因此,我已经阅读了所有关于从列名中替换特殊字符的示例,但我似乎无法让它在句点内工作。
我试过的:
# works to remove spaces
df.select([F.col(c).alias(c.replace(' ', '_')) for c in df.columns])
# doesn't work to remove periods
df.select([F.col(c).alias(c.replace('.', '')) for c in df.columns])
# removes special characters except periods
df.select([F.col(col).alias(re.sub("[^0-9a-zA-Z$]+","",col)) for col in df.columns])
我知道如何通过引用特定列来更改列的名称,但这需要更改任何具有特殊字符列的Dataframe的列名称
具体来说,这里是给我带来麻烦的列名:“src。“业务联系人全名”
3条答案
按热度按时间cgh8pdjw1#
尝试使用反引号转义列名
col\u name
.
4dc9hkyq2#
另一种方法是使用
reduce
以及withColumnRenamed
.eivnm1vs3#
select()
是已弃用的方法。为什么不简单到下面?输出