我计划有一个像这样的简单表(简单的键/值用例):
CREATE TABLE my_data (
id bigint,
value blob,
PRIMARY KEY (id)
)
具有以下特点:
- 如您所见,一个分区=一个blob(value)
- 每个值总是由相应的键访问
- 每个值是最大1 MB的blob(平均也是1 MB)
- 使用1 MB blob,它给予6000万个分区
你觉得1 MB的blob怎么样?Cassandra可以吗
事实上,我可以进一步划分我的数据,以使用1 ko blob,但在这种情况下,它将导致Cassandra上更多的分区(超过6亿?)和更多的分区来检索同一客户端查询的数据。
谢谢
1条答案
按热度按时间wpcxdonn1#
一般的建议是保持分区大小尽可能小,可能不超过5~ 10 MB。但是,在您的情况下,1 MB的blob是一个强烈建议。
6亿个分区根本不是问题。Cassandra旨在处理数十亿、数万亿甚至更大的分区。干杯!