base58 是由中本聪为bitcoin设计的。
相比与base64的字符,他将一些直观看来模糊的字符去除了。
字符共58个
- 1-9 共9个
- 大写字母A-Z(不包括O、I),共24个
- 小写字母a-z (不包括l),共25个
在一些base58的实现代码中,我们往往需要为生成的编码后的字符串预留空间,这是如何计算的呢?
例如一段源码及注释:
std::vector<unsigned char> b58((pend - pbegin) * 138 / 100 + 1);
// log(256) / log(58), rounded up
这个公式看起来有点让人摸不着头脑,但经过一些思考,我想明白了。
在编码后的字符串中,每一个字符都是从58个字符中当中选择出来的。那么这58种不同的信息可以用多少bit来代替呢?显然答案是log(2)58。换句话说,每一个字母代表的信息量是log(2)58 bit。
我们输入的字节流信息量是固定的:(byte_length * 8)bit
那么,需要预留的字符数量就是(byte_length * 8)/ log258
经过换算,
(byte_length * 8)/ log258 =
(byte_length * log2256) / log258 =
byte_length * 1.38
最后,还需要加向上取整
最终结果就是 byte_length * 1.37 + 1