我有一个csv文件,其中有数百列,当我加载到Pig的文件,我不想分配每列喜欢
A = load 'path/to/file' as (a,b,c,d,e......)
因为我会在第二步过滤很多:
B = foreach A generate $0,$2,....;
但是在这里,我可以为b的每一列指定一个名称和类型吗?像这样的
B = foreach A generate $0,$2,... AS (a:int,b:int,c:float)
我试过上面的代码,但不起作用。
谢谢。
我有一个csv文件,其中有数百列,当我加载到Pig的文件,我不想分配每列喜欢
A = load 'path/to/file' as (a,b,c,d,e......)
因为我会在第二步过滤很多:
B = foreach A generate $0,$2,....;
但是在这里,我可以为b的每一列指定一个名称和类型吗?像这样的
B = foreach A generate $0,$2,... AS (a:int,b:int,c:float)
我试过上面的代码,但不起作用。
谢谢。
1条答案
按热度按时间um6iljoc1#
必须在每个逗号之间指定它们。
B = foreach A generate $0 as a, $2 as b,...
注意,它只是假设它已经是一个类型。