在使用spark java读取json时,用null填充空字段

wf82jlnq  于 2021-05-27  发布在  Spark
关注(0)|答案(0)|浏览(196)

我正在寻找一种方法来填充所有空字段/未在java中使用spark在json对象中声明的字段。
输入数据:

{"car":"BMW","model":"i3","velocity":"300","price":880} 
{"car":"Mercedes","velocity":"250","price":700} 
{"car":"Porshe","model":"cayman","velocity":"350","price":920}

期望输出:

{"car":"BMW","model":"i3","velocity":"300","price":880} 
{"car":"Mercedes", "model":null, "velocity":"250","price":700} 
{"car":"Porshe","model":"cayman","velocity":"350","price":920}

我试过填充na:

Dataset<Row> ds = sqlCtx.read().option("multiline","false").json(rdd).na().fill("");
JavaRDD<String> rddOfString = ds.toJSON().rdd().toJavaRDD();

,但使用它,我无法使此字段为null-仅为null以外的任何值。
任何帮助都将不胜感激。
最好的

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题