找到apache pig join错误2087index:0 in “多个localreareat运算符”

bsxbgnwa  于 2021-06-24  发布在  Pig
关注(0)|答案(0)|浏览(124)

所以我有两种关系:
页面视图按guid和url计数 pv_counts 相同guid和url的事件 ev_counts 我正试着加入他们 joined_counts = JOIN ev_counts BY ev_site_guid, pv_counts BY pv_site_guid; ,但我不断得到这个错误:
错误2087:优化过程中出现意外问题。找到index:0 in 多个localreareat运算符。
我试过使用pig10和pig11,但都返回相同的错误。
我已经在google上搜索过了,但我基本上只是给出了pig的源代码,但没有解释它是什么或它的意思。我试过确保我的键中没有空字符串
有人知道我做错了什么吗?
以下是模式和一些示例数据:
pv\U计数 describe pv_counts; {group::pv\u站点_guid:chararray,组::pv_hostname:chararray,光伏_count:long} dump pv_counts; (bsaw-mf-0r4q-4acwqm r,示例url.com,10)
(bsaw-mf-0r4q-4acwqm r,体育,示例url.com,10)
(bsaw-mf-0r4q-4acwqm r,观点。示例url.com,10)
(bsaw-mf-0r4q-4acwqm r,newsinfo.example url.com,10)
(bsaw-mf-0r4q-4acwqm r,生活方式,示例url.com,10)
.... 更多的页面浏览量比事件。。。。
(dzildgjsgr3o3zacn9qlbk,example-url2.com.com,10)
(dzildgjsgr3o3zacn9qlbk,example-url3.com,10)
ev\U计数 describe ev_counts; {group::ev\u站点_guid:chararray,组::ee_hostname:chararray,版本1count:long,版本2count:long,版本3count:long,版本4count:long,第5版count:long} dump ev_counts; (bsaw-mf-0r4q-4acwqm r,示例url.com,29,0,0,0)
(bsaw-mf-0r4q-4acwqm r,体育,示例url.com,7,0,0,0)
(bsaw-mf-0r4q-4acwqm r,生活方式。示例url.com,2,0,0,0)
.... 没有页面浏览量那么多的事件。。。。
(dzildgjsgr3o3zacn9qlbk,example-url2.com.com,0,0,37,0,0)
(dzildgjsgr3o3zacn9qlbk,example-url3.com,0,0,1,0,0)
我可以在Pig和咕噜声中把关系抛得一干二净。
当我添加以下join语句时,它会到达最末尾并消亡:
joined_counts = JOIN ev_counts BY ev_site_guid, pv_counts BY pv_site_guid; dump joined_counts; 它将抛出“error2087:优化过程中的意外问题。找到index:0 in 多个localreareat操作符。“错误和难看的stacktrace。我对pig还比较陌生,所以我从来没有深入研究过它的内部结构。
如果有人有什么建议或东西可以尝试,我很乐意尝试。我们运行的是cloudera的cdh3u3(0.20.2)。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题