我正在尝试获取别名中所有用户的计数。每行包含一个用户Map。
比如:([user_name/454543#paul kison])([user_name/43433ţjosiel的iphone,user_name/34343434ţjose的ipad,user_name/3434645655ţjosiel的])
在对整个别名使用size()时,我得到以下错误:错误1066:无法打开别名用户计数的迭代器。后端错误:标量在输出中有多行。
users = LOAD 'hbase://group'
USING org.apache.pig.backend.hadoop.hbase.HBaseStorage ('n:user_display_name*', '-limit 10')
as(display_name);
user_count = FOREACH users GENERATE SIZE(users.display_name);
其思想是将每个Map的计数输出相加,得到总计数。
1条答案
按热度按时间ny6fqffe1#
我必须显式地将display\u name列的类型设置为map[],并更改仅使用列名作为传递给size()的表达式。
之后我把结果总结如下: