提高hbase查询性能

cs7cruho  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(386)

我有一个包含客户联系信息的hbase表。此表包含大约700k行。我有一个脚本,它必须查询customers表以查找2000-3000条记录的匹配项。每次扫描大约需要1秒钟才能完成。所以2000张唱片需要33分钟才能完成。我想看看我是否能提高这个性能。我试过设置缓存,但没用。以下是细节。customers表上只有一个列族,customer id是行键。我的问题看起来像这样。
singlecolumnvaluefilter('内部','国家',=,'binary:gb'和singlecolumnvaluefilter('内部','邮政编码',=,'binary:w24rt')和singlecolumnvaluefilter('内部','街道',=,'binary:bayswaterroad')
如何提高性能?

hjzp0vay

hjzp0vay1#

hbase的最佳性能来自于根据查询要求设计行键。当您根据该行键进行搜索时,您将得到最短的时间。因此,一个选择是优化行键。
此外,您还包括3列值过滤器,因此对于每个扫描,它有3次查找。
您可以添加更多与排除不匹配行相关的选项。

相关问题