在特定的命名文件上运行mapreduce代码

p4rjhz4m  于 2021-05-27  发布在  Hadoop
关注(0)|答案(0)|浏览(168)

我需要对hadoop中某个文件夹中的文件运行一个前10个单词的计数程序。运行程序的代码如下

[training@localhost map_reduce]$ /opt/anaconda351/bin/python word_count_top_max.py /home/training/training_materials/data/kb

python程序在map\u reduce文件夹中,这就是为什么我在那个目录中,它在它后面的文件夹中运行。我现在需要在同一个文件夹上运行这个程序,但只能在文件名中有“30”的文件上运行。我试过以下方法,但没有成功,现在我的头撞到墙上了。任何建议都会有帮助。

[training@localhost map_reduce]$ /opt/anaconda351/bin/python word_count_top_max.py | ls -d *30* /home/training/training_materials/data/kb

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题