如何在python中使用mapreduce找到两条路径的链接?

gdx19jrr  于 2021-07-13  发布在  Hadoop
关注(0)|答案(0)|浏览(163)

考虑一个csv文件,其中每行包含两个字母,构成一个链接:

A,B
A,C
B,C
D,E
B,D

任务是使用python中的mrjob编写一个mapreduce程序,该程序查找数据集中2个链接的所有路径。
mapreduce代码应输出:

B,D,E # example, there is B,D + D,E link
A,B,C
A,B,D

代码格式:

from mrjob.job import MRJob

class MRLink(MRJob):

    def mapper(self,_, line):
        pass

    def reducer(self,key, values):
        pass

if __name__ == "__main__":
    MRLink.run()

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题