我试图重现这篇文章的结果:我有我需要的所有原始大数据,我已经创建了 tweets
表,但出于某种原因,“更复杂的查询”会产生大量mr jobs,并以 No data available
. 我用的是蜂蜡和它的查询编辑器。
怎么回事?
在终端中运行时,查询将生成
MapReduce Jobs Launched:
Job 0: Map: 1 Reduce: 1 Cumulative CPU: 6.83 sec HDFS Read: 274 HDFS Write: 96 SUCCESS
Job 1: Map: 1 Reduce: 1 Cumulative CPU: 3.96 sec HDFS Read: 471 HDFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 10 seconds 790 msec
OK
Time taken: 585.312 seconds
,其中0个hdfs写入看起来可疑。
1条答案
按热度按时间093gszye1#
抱歉,各位:原来我应该先将数据加载到表中,然后再对其运行任何查询。