我正在使用内置 piggybank.jar
班级 CustomFormatToISO
将日期转换为 ISO
键入格式。我不知道用哪种格式来处理存储在 time.txt
:
(Thu Jan 23 10:07:05 +0000 2014)
(Thu Jan 23 10:07:05 +0000 2014)
(Thu Jan 23 10:07:05 +0000 2014)
(Thu Jan 23 10:07:05 +0000 2014)
(Thu Jan 23 10:07:05 +0000 2014)
(Thu Jan 23 10:07:06 +0000 2014)
(Thu Jan 23 10:07:06 +0000 2014)
例如:
A = LOAD 'time.txt' as (t1);
B = FOREACH A GENERATE CustomFormatToISO(t1, 'DY MON dd HH24:MI:SS YYYY');
显然给了我一个错误。
有人能帮我把它转换成 ISO
格式化或到 TIMESTAMP
或者其他更常见的日期格式?
1条答案
按热度按时间zfycwa2u1#
我们为此内置了函数。看看参考资料中共享的链接。
对于讨论中共享的用例,我们可以使用下面的pig脚本。
输入:a.csv:
Pig脚本:
输出:b:
参考文献:
http://pig.apache.org/docs/r0.12.0/func.html#to-日期
http://pig.apache.org/docs/r0.12.0/func.html#to-unix时间