如何在spark java中将rdd字符串(xml格式)转换为Dataframe?

gev0vcfq  于 2021-07-09  发布在  Java
关注(0)|答案(0)|浏览(294)

如果xml数据在文件中可用,下面的链接中提供了很好的解决方案,https://github.com/databricks/spark-xml
下面的代码通过加载物理文件将xml转换为数据集。。

Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
                                   .option("rowTag", "book")
                                   .load("file:///C:/books.xml");

但如果javardd中有xml数据,那么如何转换成数据集呢?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题