假设我有以下数据集:-
Year Temp 1974 48 1974 48 1991 56 1983 89 1993 91 1938 41 1938 56 1941 93 1983 87
我希望我的最终答案是93(关于1941年)。我能找到每年的最高温度(比如说1941-93年),但只能找到最高温度。如有任何建议,我们将不胜感激。谢谢,
iaqfqrcu1#
你可以用两种方法解决这个问题。选项1:使用(全部分组+最大值)
A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int); B = GROUP A ALL; C = FOREACH B GENERATE MAX(A.Temp); DUMP C;
输出:
(93)
选项2:使用(顺序和限制)
A = LOAD 'input' USING PigStorage() AS (Year:int,Temp:int); B = ORDER A BY Temp DESC; C = LIMIT B 1; D = FOREACH C GENERATE Temp; DUMP D;
1条答案
按热度按时间iaqfqrcu1#
你可以用两种方法解决这个问题。
选项1:使用(全部分组+最大值)
输出:
选项2:使用(顺序和限制)
输出: