我有一个pig脚本,它作为oozie工作流的一部分被传递一个命令参数,我想创建一个新变量作为传递参数的子字符串。如:
%declare VAR1 SUBSTRING($INPUT, 0, 5);
误差通常为:;parseexception:在第5行第37列遇到“0”。期待着:。。。apache pig版本0.12.0-cdh5.3.0
bxgwgixi1#
一个可行的方法。值得深思Pig脚本:
%declare REQUIRED `echo ABCDE | cut -c1-3`; A = LOAD 'a.csv' USING PigStorage(',') AS (value:chararray); B = FILTER A by value == '$REQUIRED'; DUMP B;
输入:a.csv:
ABC XYZ
输出:转储b:
(ABC)
在declare语句中代替de,我们可以指定$input。
%declare REQUIRED `echo $INPUT | cut -c1-3`;
1条答案
按热度按时间bxgwgixi1#
一个可行的方法。值得深思
Pig脚本:
输入:a.csv:
输出:转储b:
在declare语句中代替de,我们可以指定$input。