在hadoop集群、apachemahout上运行推荐,或者在hadoop中使用r(通过hadoop streaming/rhipe/rhadoop等)哪个更好?

6jjcrrmo  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(322)

我是新的大数据和寻找一个好的平台来执行建议,聚类和分类。我知道mahout有很多算法可以做到这一点。另外,r本身作为一个非常好的分析工具,对实现这一点非常有帮助。因为我正在研究bigdata,如果我决定走这条路,我将使用r+hadoop(通过streaming/rhipe/rhadoop等)。考虑到所用语言(mahout和r中的java)在复杂性上的差异,我正在寻求性能、可伸缩性、易用性、成熟度等方面的比较。

htrmnn0y

htrmnn0y1#

mahout集成了多种算法,主要解决三个问题:(1)推荐(协同过滤算法)(2)聚类(3)分类
r只是用来统计的,所以如果你想完成以上三项任务,mahout是一个很好的工具。
顺便说一句,mahout是一个maven项目,所以您需要安装maven。

相关问题