Cassandra:最佳分区大小

qf9go6mv  于 11个月前  发布在  Cassandra
关注(0)|答案(1)|浏览(120)

我计划有一个像这样的简单表(简单的键/值用例):

CREATE TABLE my_data (
    id bigint,
    value blob,
    PRIMARY KEY (id)
)

具有以下特点:

  • 如您所见,一个分区=一个blob(value)
  • 每个值总是由相应的键访问
  • 每个值是最大1 MB的blob(平均也是1 MB)
  • 使用1 MB blob,它给予6000万个分区

你觉得1 MB的blob怎么样?Cassandra可以吗
事实上,我可以进一步划分我的数据,以使用1 ko blob,但在这种情况下,它将导致Cassandra上更多的分区(超过6亿?)和更多的分区来检索同一客户端查询的数据。
谢谢

wpcxdonn

wpcxdonn1#

一般的建议是保持分区大小尽可能小,可能不超过5~ 10 MB。但是,在您的情况下,1 MB的blob是一个强烈建议
6亿个分区根本不是问题。Cassandra旨在处理数十亿、数万亿甚至更大的分区。干杯!

相关问题