用空值替换空字符串

xcitsw88  于 2021-05-27  发布在  Spark
关注(0)|答案(2)|浏览(350)

我有一个列totalcharges是字符串类型的Dataframe,它有一些空值,我希望打印null而不是那些空的空格。
列现在


**************

|1671.6                           |
|8003.8                           |
|680.05                           |
|6130.85                          |
|1415                             |
|6201.95                          |
|                                 |
|74.35                            |
|6597.25                          |

预期产量

|1671.6                           |
|8003.8                           |
|680.05                           |
|6130.85                          |
|1415                             |
|6201.95                          |
|Null                             |
|74.35                            |
|6597.25                          |
svgewumm

svgewumm1#

下面的路会给你 null 当字符串为 "" ```
df.withColumn("TotalCharges",when($"TotalCharges"!=="",$"TotalCharges"))

这将为您提供“null”字符串:

df.withColumn("TotalCharges",when($"TotalCharges"==="","Null").otherwise($"TotalCharges"))

xa9qqrwz

xa9qqrwz2#

你可以试试这样的方法:

import org.apache.spark.sql.functions.{when,lit, _}
df.withColumn("TotalCharges", when(col("name") === lit(""), null).otherwi
se(col("TotalCharges")))

相关问题