hiveql查询tweets表

kh212irz 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(284)

我试图重现这篇文章的结果：我有我需要的所有原始大数据，我已经创建了 tweets 表，但出于某种原因，“更复杂的查询”会产生大量mr jobs，并以 No data available . 我用的是蜂蜡和它的查询编辑器。
怎么回事？
在终端中运行时，查询将生成

MapReduce Jobs Launched: 
Job 0: Map: 1  Reduce: 1   Cumulative CPU: 6.83 sec   HDFS Read: 274 HDFS Write: 96 SUCCESS
Job 1: Map: 1  Reduce: 1   Cumulative CPU: 3.96 sec   HDFS Read: 471 HDFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 10 seconds 790 msec
OK
Time taken: 585.312 seconds

，其中0个hdfs写入看起来可疑。

hadoop hiveql twitter

来源：https://stackoverflow.com/questions/24737498/hiveql-query-for-a-table-of-tweets