nutch1.11

wwtsj6pe  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(314)

我想在Windows7机器上运行nutch通过cygwin。
当我尝试爬行时,我无法通过喷油器阶段。
这是我得到的错误:
2016-03-09 13:42:45,454 ERROR util.Shell - Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. 之后会导致nullpointerexception:
2016-03-09 13:42:46445错误crawl.injector-injector:java.lang.nullpointerexception at java.lang.processbuilder.start(processbuilder。java:1010)
刚过“将注入的url转换为爬网db条目”
有人知道如何克服这个错误吗?

wz1wpwve

wz1wpwve1#

我想问题是nutch无法读取输入url种子文件(包含要爬网的url列表)。请检查文件路径是否正确。
希望这有帮助,
勒库克多

相关问题