pig中的动态元组?

uplii1fm  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(276)

我用pig中的tuple获取数据

0,(0),(zero)
   1,(1,2),(first,second)

我能收到这个吗?

0,0,zero
   1,1,first
   1,2,second
rjzwgtxy

rjzwgtxy1#

首先,我要纠正你的术语,你应该 (0) 以及 (1,2) 作为袋子,而不是元组。元组是表示某种实体的定长数据结构。说 (name, address, year of birth) ,例如。如果你有一个类似对象的列表,比如 {(apple), (orange), (banana)} ,你想要个包。
不存在允许您“压缩”多个行李/清单的行为。其原因是从设计Angular 来看,pig将袋子视为无序列表,因此术语“袋子”不是“列表”。这种假设确实有助于并行性,因为您不必考虑顺序。因此,很难匹配 1first .
您可以尝试编写一个eval函数udf,它接受两个包作为参数,然后将这两个列表拉上拉链,然后返回一个带有拉链的包。

相关问题