我试图找到与sql函数等价的pig函数 GREATEST
以及 LEAST
. 这些函数是聚合sql函数的标量等价物 MAX
以及 MIN
分别是。
基本上,我想说这样的话:
x = LOAD 'file:///a/b/c.csv' USING PigStorage() AS (a: int, b: int, c: int);
y = FOREACH x GENERATE a AS a: int, b AS b: int, c AS c: int, GREATEST(a, b, c) AS g: int;
我知道我可以用袋子 MAX
但我正在将另一种语言翻译成pig,这种实现很难集成。
有没有一种“内联”的方法可以在这里使用?一些我忽略的内置函数,或者例如piggybank或datafu中的自定义项,将是理想的选择!如果有一个完全“内联”的版本,使用包,我只是没有想到它,那也没关系!
谢谢您!
1条答案
按热度按时间wz8daaqr1#
事实证明,有一些基于“内联”包的方法是可行的: