我试图在spark scala中创建一个空的Dataframe,并希望创建自己的模式并将记录加载到其中。
下面是一个例子
val emptydf=Spark.emptydataframe
val loademptydf=emptydf.withcolumn(“col1”,lit(“yes”),“col2”,lit(“no”))
但是在创建模式时,我无法获得我正在放置的默认值
电流输出:
|列1 |列2 | | ||
预期产量:
|col1 | col2 | |是|否|
我试图在spark scala中创建一个空的Dataframe,并希望创建自己的模式并将记录加载到其中。
下面是一个例子
val emptydf=Spark.emptydataframe
val loademptydf=emptydf.withcolumn(“col1”,lit(“yes”),“col2”,lit(“no”))
但是在创建模式时,我无法获得我正在放置的默认值
电流输出:
|列1 |列2 | | ||
预期产量:
|col1 | col2 | |是|否|
1条答案
按热度按时间kx5bkwkv1#
withColumn
添加列,然后lit
将默认值添加到所有行,但DataFrame
是空的。。