我正在寻找一种方法来填充所有空字段/未在java中使用spark在json对象中声明的字段。
输入数据:
{"car":"BMW","model":"i3","velocity":"300","price":880}
{"car":"Mercedes","velocity":"250","price":700}
{"car":"Porshe","model":"cayman","velocity":"350","price":920}
期望输出:
{"car":"BMW","model":"i3","velocity":"300","price":880}
{"car":"Mercedes", "model":null, "velocity":"250","price":700}
{"car":"Porshe","model":"cayman","velocity":"350","price":920}
我试过填充na:
Dataset<Row> ds = sqlCtx.read().option("multiline","false").json(rdd).na().fill("");
JavaRDD<String> rddOfString = ds.toJSON().rdd().toJavaRDD();
,但使用它,我无法使此字段为null-仅为null以外的任何值。
任何帮助都将不胜感激。
最好的
暂无答案!
目前还没有任何答案,快来回答吧!