我使用的是pyspark,我有一个Dataframedf\u001,其中包含n列“rec”、“id”和“name”。
例如,如果我想添加一个新列'unq\u id',它将连接'rec'和'id'。当我这么做的时候,它工作得很好:
df_f_final = df_001.withColumn('unq_id', sf.concat(sf.col('rec'), sf.lit('||'), sf.col('id'))) .
但是我需要列的列表来连接dynamique(例如list):我怎么做呢?例如,create list:ll=['rec','id','name']或ll=['rec','name']并使用它生成Dataframedf\u f\u final并连接列表ll中的列
我想这很容易,但它让我发疯
谢谢你的帮助
2条答案
按热度按时间kmpatx3s1#
看看这个,如果有用就告诉我。
u91tlkcl2#
谢谢你的回答,洛卡,我终于找到了一个解决办法,和你的差不多。我做到了,而且成功了