我的要求如下
input file
key value
eid ename
1 a
2 b
3 c
o/p文件
key values
eid 1,2,3
ename a,b,c
我在Map器中使用头数组和数据数组以及case1:without reducer(即setnumreducetasks(0))编写了逻辑
案例2:使用默认大小写
在这两种情况下,我只是得到的o/p作为
eid 1
eid 2
eid 3
ename a
ename b
ename c
1条答案
按热度按时间ugmeyewa1#
要实现这一点,您必须使用减速器。原因是,你想要所有的记录
eid
去同一个减速机和所有的记录ename
转到同一个减速器。这将帮助您聚合eid
以及ename
.如果您只是使用Map器(不带还原器),那么可能
eid
我可以去找不同的制图员。以下代码实现了这一点:
对于您的输入,我得到了输出(Map器假设键/值是用tab分隔的):