关于一致性哈希算法

假设我们有 K 个机器,数据的哈希值的范围为 [0, MAX]。我们将整个范围划分为 m 个小区间(m 远大于 K),每个机器负责 m/K 个小区间。当有新机器加入的时候,我们就将某几个小区间的数据搬移到新机器上去。这样,既不用全部重新计算哈希值,搬移数据,也保持了各个机器上数据数量的均衡。

1.首先,我们把全量的缓存空间当做一个环形存储结构。环形空间总共分成2^32个缓存区,在Redis中则是把缓存key分配到16384个slot

《关于一致性哈希算法》

 2.每一个缓存key都可以通过Hash算法转化为一个32位的二进制数,也就对应着环形空间的某一个缓存区。我们把所有的缓存key映射到环形空间的不同位置。

 

《关于一致性哈希算法》

3.我们的每一个缓存节点(Shard)也遵循同样的Hash算法,比如利用IP做Hash,映射到环形空间当中。

《关于一致性哈希算法》

4.如何让key和节点对应起来呢?很简单,每一个key的顺时针方向最近节点,就是key所归属的存储节点。所以图中key1存储于node1,key2,key3存储于node2,key4存储于node3。

《关于一致性哈希算法》

【优势】

1.增加节点

当缓存集群的节点有所增加的时候,整个环形空间的映射仍然会保持一致性哈希的顺时针规则,所以有一小部分key的归属会受到影响。

《关于一致性哈希算法》

有哪些key会受到影响呢?图中加入了新节点node4,处于node1和node2之间,按照顺时针规则,从node1到node4之间的缓存不再归属于node2,而是归属于新节点node4。因此受影响的key只有key2。

《关于一致性哈希算法》

最终把key2的缓存数据从node2迁移到node4,就形成了新的符合一致性哈希规则的缓存结构。

2.删除节点

当缓存集群的节点需要删除的时候(比如节点挂掉),整个环形空间的映射同样会保持一致性哈希的顺时针规则,同样有一小部分key的归属会受到影响。

《关于一致性哈希算法》

有哪些key会受到影响呢?图中删除了原节点node3,按照顺时针规则,原本node3所拥有的缓存数据就需要“托付”给node3的顺时针后继节点node1。因此受影响的key只有key4。

《关于一致性哈希算法》

最终把key4的缓存数据从node3迁移到node1,就形成了新的符合一致性哈希规则的缓存结构。

参考:https://www.sohu.com/a/158141377_479559

    原文作者:哈希算法
    原文地址: https://blog.csdn.net/zpznba/article/details/84334654
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞