Base58编码的长度是如何计算的?

base58 是由中本聪为bitcoin设计的。

相比与base64的字符,他将一些直观看来模糊的字符去除了。

字符共58个

  • 1-9 共9个
  • 大写字母A-Z(不包括O、I),共24个
  • 小写字母a-z (不包括l),共25个

在一些base58的实现代码中,我们往往需要为生成的编码后的字符串预留空间,这是如何计算的呢?

例如一段源码及注释:

std::vector<unsigned char> b58((pend - pbegin) * 138 / 100 + 1); 
// log(256) / log(58), rounded up

这个公式看起来有点让人摸不着头脑,但经过一些思考,我想明白了。

在编码后的字符串中,每一个字符都是从58个字符中当中选择出来的。那么这58种不同的信息可以用多少bit来代替呢?显然答案是log(2)58。换句话说,每一个字母代表的信息量是log(2)58 bit。

我们输入的字节流信息量是固定的:(byte_length * 8)bit

那么,需要预留的字符数量就是(byte_length * 8)/ log258

经过换算,

(byte_length * 8)/ log258 =
(byte_length * log2256) / log258 =
byte_length * 1.38

最后,还需要加向上取整

最终结果就是 byte_length * 1.37 + 1

    原文作者:marmalade
    原文地址: https://segmentfault.com/a/1190000015020583
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞