在特定的命名文件上运行mapreduce代码

p4rjhz4m 于 2021-05-27 发布在 Hadoop

关注(0)|答案(0)|浏览(168)

我需要对hadoop中某个文件夹中的文件运行一个前10个单词的计数程序。运行程序的代码如下

[training@localhost map_reduce]$ /opt/anaconda351/bin/python word_count_top_max.py /home/training/training_materials/data/kb

python程序在map\u reduce文件夹中，这就是为什么我在那个目录中，它在它后面的文件夹中运行。我现在需要在同一个文件夹上运行这个程序，但只能在文件名中有“30”的文件上运行。我试过以下方法，但没有成功，现在我的头撞到墙上了。任何建议都会有帮助。

[training@localhost map_reduce]$ /opt/anaconda351/bin/python word_count_top_max.py | ls -d *30* /home/training/training_materials/data/kb

目前还没有任何答案，快来回答吧！

相关问题