使用cdh(cloudera)有什么好处?

7vhp5slm  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(394)

关闭。这个问题是基于意见的。它目前不接受答案。
**想改进这个问题吗?**更新这个问题,这样就可以通过编辑这篇文章用事实和引文来回答。

5年前关门了。
改进这个问题
为什么我们使用cdh(cloudera)而不是apachehadoop或apachesparkets。单独的?它的优点是什么?
如果我想使用apachespark进行数据分析,单独使用cdh或apachespark框架更好吗?
谢谢

2ekbmq32

2ekbmq321#

嗯,cdh是一个“hadoop发行版”。对我来说,这是“一种安装hadoop的简单方法”,并且有一个很好的管理web界面。所以你不能用cdh代替hadoop(就像你不能用red hat代替linux一样。)
spark也可以作为一个独立的集群运行,而不需要hadoop。但是,您将无法使用hdfs资源位置信息和Yarn调度。
要开始使用spark,我建议首先尝试独立集群,因为hadoop是一个非常容易入门的东西。但是,如果您从一开始就需要hdfs功能,那么我猜您无论如何都必须设置hadoop(以任何形式)。

相关问题