impala在jdbc上的流速度非常慢

izkcnapc 于 2021-06-26 发布在 Hive

关注(0)|答案(1)|浏览(389)

我使用impala shell运行了几个大型查询，发现性能令人满意。这些查询通常将100k-1m行写入磁盘。但是，当我使用jdbc以编程方式运行相同的查询时，结果将花费非常长的时间写入磁盘。例如，一个从impala shell执行5分钟的查询在jdbc上最多需要30分钟。
我尝试过hive和cloudera jdbc驱动程序，但是得到了同样糟糕的性能。我试过各种尺寸，但没有任何区别。impala在jdbc上的流式传输基本上很慢吗？或者我可以做些别的事情来加速流式传输吗？
这在cdh 5.9.1上。

Hive impala jdbc cloudera cloudera-cdh

来源：https://stackoverflow.com/questions/43991274/impala-streaming-over-jdbc-is-really-slow