mapreduce—hbase扫描在多列系列还是单列系列中性能更好?

7hiiyaii  于 2021-07-13  发布在  Hbase
关注(0)|答案(1)|浏览(415)

我想在hbase中存储一个对象(负载)和一些元数据。
然后我想在表上运行查询,并根据元数据信息提取有效负载部分。
例如,假设我有以下列限定符
p:有效载荷(大于m1+m2)。
m1:元数据1
m2:元数据2
然后我会运行一个查询,例如:
在m1='search-key1'&&m2='search-key2'处获取所有有效负载
这样做有意义吗
m1和m2在一个列族中,p在另一个列族中?扫描会更快吗?
是否将所有3列保留在同一列族中?
通常,我会做一个刺(我可能仍然需要)-我想我会先问。

dced5bon

dced5bon1#

我会尽量遵循hbase参考中给出的建议并使用选项2(将所有3列保留在同一列族中):
如果可以的话,试着在模式中使用一个列族。仅在数据访问通常是列范围的情况下引入第二列和第三列族;i、 e.查询一个列族或另一个列族,但通常不能同时查询两个列族。

相关问题