我有这样的数据:
1,234,"john, lee", john@xyz.com
我想用pig脚本删除,里面有空格的“”。所以我的数据看起来像:
1,234,john lee, john@xyz.com
我尝试使用csvexcelstorage加载此数据,但我还需要使用'-tagfile'选项,这在csvexcelstorage中不受支持。所以我计划只使用pigstorage,然后替换引号中的逗号(,)。我被困在这上面了。非常感谢您的帮助。谢谢
我有这样的数据:
1,234,"john, lee", john@xyz.com
我想用pig脚本删除,里面有空格的“”。所以我的数据看起来像:
1,234,john lee, john@xyz.com
我尝试使用csvexcelstorage加载此数据,但我还需要使用'-tagfile'选项,这在csvexcelstorage中不受支持。所以我计划只使用pigstorage,然后替换引号中的逗号(,)。我被困在这上面了。非常感谢您的帮助。谢谢
3条答案
按热度按时间jtw3ybtb1#
下面的命令将有帮助:
输出:
(1234年,约翰·李,john@xyz.com)
vbopmzt12#
将其加载到单个字段中,然后使用strsplit和replace
一
b
c
d
e
nkhmeac63#
我有个完美的方法。一个非常通用的解决方案如下:
详细的用例可以在我的博客上找到