我想要一个用pig脚本处理的文件
我的输入文件是( &
是柱delimeter和 $
是行(delimeter):
abc&bc&121&aa$aaj&jkj&print&star$aa&tss&jjlk&121
我试过这个:
a = LOAD 'try.txt' USING PigStorage ('$') as (col1:chararray); b = FOREACH a Generate REPLACE(col1, '&', ',');
我试图在第一个delimeter之后分离一个元组,但是我用这个只能得到第一个元组。
outputfile我要查找的内容:
(abc,bc,121,aa)
(aaj,jkj,print,star)
(aa,tss,jjlk,121)
有什么帮助吗?
1条答案
按热度按时间dgiusagp1#
你能试试这个吗?
选项1:
输入
Pig手稿:
输出:
选项2:
Pig手稿:
输出: