mapreduce到spark

t9aqgxwy 于 2021-05-30 发布在 Hadoop

关注(0)|答案(1)|浏览(213)

我有一份用java写的mapreduce工作。它取决于多个类。我想在spark上运行mapreduce作业。
我应该遵循哪些步骤来做同样的事情？
我只需要修改mapreduce类？
谢谢！

Java hadoop mapreduce apache-spark

来源：https://stackoverflow.com/questions/28889797/mapreduce-to-spark

1条答案

按热度按时间

这是一个非常广泛的问题，但其不足之处在于：
创建输入数据的rdd。
呼叫 map 用你的Map代码。输出键值对。
呼叫 reduceByKey 用你的代码。
将生成的rdd写入磁盘。
spark比mapreduce更灵活：在步骤1和步骤4之间可以使用多种方法来转换数据。

赞(0）回复(0）举报 2021-05-30

相关问题

微信公众号

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

Python pillow/PIL无法识别对象“imagedraw”的属性“textsize”
回答(3) 发布于 5个月前
python-3.x ImportError：无法从“typing_extensions”导入名称“deprecated”
回答(2) 发布于 5个月前
python-3.x 我正尝试使用密码学对字典进行加密
回答(1) 发布于 5个月前
在Python的IDLE中导入audiolazy的问题
回答(1) 发布于 5个月前
如何将Python程序中的数据添加到Markdown？
回答(2) 发布于 5个月前