我能用Pig拉丁语做这样的事吗?
data1 = LOAD 'hadoop/text1.txt' AS (line:chararray); data2 = LOAD 'hadoop/text2.txt' AS (line:chararray); mixed = FOREACH data1, data2 GENERATE data1:line, data2:line;
6fe3ivhb1#
一般来说,按照您的要求进行操作是没有意义的,因为数据将由多个Map器加载,可能一次加载一行。不能保证同一个Map器能看到相应的行,也不能保证Map器知道他们正在读取哪个块的哪一行。正如winnienicklaus所提到的,最好的方法是标记行并进行连接。
1条答案
按热度按时间6fe3ivhb1#
一般来说,按照您的要求进行操作是没有意义的,因为数据将由多个Map器加载,可能一次加载一行。不能保证同一个Map器能看到相应的行,也不能保证Map器知道他们正在读取哪个块的哪一行。正如winnienicklaus所提到的,最好的方法是标记行并进行连接。