我在读有关比较Hive和 Impala 的文献。有几个来源说明了以下“冷启动”行的某些版本:众所周知,mapreduce程序在所有节点满负荷运行之前需要一段时间。在hive中,每个查询都会遇到这种“冷启动”问题。参考在我看来,仅仅理解“冷启动”是不够的。寻找更多的信息和清晰度来理解这一点。我是个数据科学家。我创建查询,对大数据概念只有基本的理解。我提到了一些问题,这些问题解释了为什么 Impala 更快(例如),但它们没有明确指出或定义冷启动。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!