Cassandra压缩代码库

我想知道当我在Cassandra的Column Family中插入一个新列时,在磁盘上准确存储了多少字节.

我的主要问题是当用Snappy压缩列时我需要知道这些信息,我知道原始字节的计算,但由于数据的可变性,我无法正确估计压缩率.

有关在Cassandra代码库中何处找到此字节数的任何信息都将受到欢迎.

提前致谢.

最佳答案 压缩永远无法保证压缩率.您可以获得的最佳值是样本数据的平均比率.

因此,获取大量样本数据,将其插入测试实例,并测量磁盘使用情况.

您可能拥有使用Snappy压缩得非常差的数据,实际上导致磁盘使用量超过存储原始字节数.

在压缩数据方面,只有一条规则:MEASURE

点赞