我想在apachepig中将数据转换成特定的格式,这样我就可以在上面使用一个报告工具。
例如:
10:00,abc
10:00,cde
10:01,abc
10:01,abc
10:02,def
10:03,efg
输出应采用以下格式:
abc cde def efg
10:00 1 1 0 0
10:01 2 0 0 0
10:02 0 0 1 0
这里的主要问题是,一个值可能在一行中出现多次,具体取决于示例csv文件中可用的不同值,总共出现120次。
任何解决这个问题的建议都是非常受欢迎的。
谢谢gagan
1条答案
按热度按时间nafvub8i1#
尝试以下操作:
这将为您获取特定键的特定值的发生次数。
编辑:刚刚注意到问题的限制120。如果不能超过120,请输入以下代码