foreach多个pig拉丁数据

wztqucjr  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(265)

我能用Pig拉丁语做这样的事吗?

data1 = LOAD 'hadoop/text1.txt' AS (line:chararray);
data2 = LOAD 'hadoop/text2.txt' AS (line:chararray);

mixed = FOREACH data1, data2 GENERATE data1:line, data2:line;
6fe3ivhb

6fe3ivhb1#

一般来说,按照您的要求进行操作是没有意义的,因为数据将由多个Map器加载,可能一次加载一行。不能保证同一个Map器能看到相应的行,也不能保证Map器知道他们正在读取哪个块的哪一行。正如winnienicklaus所提到的,最好的方法是标记行并进行连接。

相关问题