如何使用pig查找给定数据集中的最大年份?

tzdcorbm  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(268)

假设我有以下数据集:-

Year Temp

1974 48
1974 48
1991 56
1983 89
1993 91
1938 41
1938 56
1941 93
1983 87

我希望我的最终答案是93(关于1941年)。我能找到每年的最高温度(比如说1941-93年),但只能找到最高温度。如有任何建议,我们将不胜感激。
谢谢,

iaqfqrcu

iaqfqrcu1#

你可以用两种方法解决这个问题。
选项1:使用(全部分组+最大值)

A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int);
B = GROUP A ALL;
C = FOREACH B GENERATE MAX(A.Temp);
DUMP C;

输出:

(93)

选项2:使用(顺序和限制)

A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int);
B = ORDER A BY Temp DESC;
C = LIMIT B 1;
D = FOREACH C GENERATE Temp;
DUMP D;

输出:

(93)

相关问题