在apache中解析xml和html

5sxhfpxr  于 2021-06-24  发布在  Pig
关注(0)|答案(3)|浏览(334)

如何使用apachepig运行xml。我尝试了piggybank.storage.xmlloader函数,但它对我不起作用。我只在本地模式下运行清管器作业。没有错误,但它没有运行。
有没有一种方法可以解析apache pig中的html页面。
请帮帮我。
提前谢谢

nsc4cvqm

nsc4cvqm1#

您需要使用org.apache.pig.piggybank.storage.xmloader()和参数。还有xpath。我觉得这个很有用。

6ljaweal

6ljaweal2#

请尝试以下代码:

register <PIG_HOME>/contrib/piggybank/java/piggybank.jar; 
A= LOAD '/xmlfile' USING org.apache.pig.piggybank.storage.XMLLoader('<XML_tag>');

对于pig mr模式,我的意思是在mr模式下运行pig,而不是在本地模式下运行(即pig-x local)。
希望有帮助。

u3r8eeie

u3r8eeie3#

请尝试在mr模式下运行脚本。因为许多函数/操作只有在mr模式下才能正常工作。

相关问题