ablog

不器用で落着きのない技術者のメモ

pyspark.sql module の select で DataFrame に複数カラムを連結したカラムを追加する

pyspark.sql module の select、concat、col で DataFrame に複数カラムを連結したカラムを追加する。.alias("...") で連結したカラムに別名をつけている。

from pyspark.sql.functions import concat, col, lit
df = df.select(col("col1"), col("col2"), concat(col("col1"), lit("_"), col("col2")).alias("col3"))