MySql性能调优二(BTree、B+Tree与索引数据结构)

前言

本篇基于上一篇MySql性能调优一(存储引擎InnoDB,MyISAM),本篇继续学习Mysql性能调优,关于BTree、B+Tree与mysql索引数据结构理解。

BTree特性

BTree又叫多路平衡查找树,一颗m叉的BTree特性如下:

  • 树中每个节点最多包含m个孩子。
  • 除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子。
  • 若根节点不是叶子节点,则至少有两个孩子。
  • 所有的叶子节点都在同一层。
  • 每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1] <= n <= m-1 。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 BTree.png

BTree插入

以5叉BTree为例,key的数量:公式推导[ceil(m/2)-1] <= n <= m-1。所以 2 <= n <=4。当n>4时,中间节点分裂到父节点,两边节点分裂。

  1. 以插入C N G A H E K Q M F W L T Z D P R X Y S为例,前4个字母没什么好说的。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 1.png

  1. 插入H,n>4,中间元素G字母向上分裂到新的节点。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 2.png

  1. 插入E,K,Q不需要分裂。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 3.png

  1. 插入M,中间元素M字母向上分裂到父节点G。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 4.png

  1. 插入F,W,L,T不需要分裂。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 5.png

  1. 插入Z,中间元素T向上分裂到父节点中。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 6.png

  1. 插入D,中间元素D向上分裂到父节点中。然后插入P,R,X,Y不需要分裂。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 7.png

  1. 最后插入S,NPQR节点n>5,中间节点Q向上分裂,但分裂后父节点DGMT的n>5,中间节点M向上分裂。需要注意的是,原BTree第三个子节点HKL会包含DG节点中。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 8.png

到此,一个BTree的构建就完成了,怎么样?是不是很简单。删除操作比插入略微复杂,鉴于篇幅,不做叙述。

B+Tree

B+Tree为BTree的变种,B+Tree与BTree的区别为:

  • 有n棵子树的B+Tree最多含有n个key,而BTree最多含有n-1个key。
  • B+Tree的叶节点保存所有的key信息,依key大小顺序排列。
  • 所有的非叶子节点都可以看作是key的索引部分,节点中只含有其子节点的最大(或最小)key。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 B+Tree.png

由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。

带有顺序指针的B+Tree

MySql索引数据结构对经典的B+Tree进行了优化。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 带有顺序指针的B+Tree.png

在原B+Tree的基础上,增加一个指向相邻叶子节点的指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。
如上图访问18-49的元素,只需要顺着18的指针走向49即可。

MySql索引数据结构

在mysql中,索引的实现方式与存储引擎相关,MySql支持多种索引类型,如B+Tree、Hash索引、全文索引等等。在此只关注MyISAM与InnoDB的B+Tree索引数据结构。

MyISAM的B+Tree索引

MyISAM的主键索引与辅助索引在结构上没有任何区别,只是主键索引要求key唯一。可以看出,MyISAM的索引叶节点保存的是表的行的物理地址值。
MyISAM的索引是“非聚集”的,这么称呼只是为了与InnoDB的聚集索引相区分。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 MyISAM的B+Tree主键索引.png

InnoDB的B+Tree索引

InnoDB的索引实现方式与MyISAM截然不同,InnoDB的B+Tree叶子节点保存有完整的记录信息。这也解释了上篇所说的InnoDB的索引与数据文件是同一个文件。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 图1.png

图1是B+tree的主键索引,这种索引也叫做聚集索引。InnoDB索引必须按照主键聚集,所有InnoDB必须要包含有主键。如果没有显示指定,MySql会自动选择一个唯一标识列或生成一个隐含字段作为主键。

《MySql性能调优二(BTree、B+Tree与索引数据结构)》 图2.png

图2是InnoDB的B+Tree辅助索引,B+Tree的叶子节点只保存主键的值而不是行的地址值。所以辅助索引的检索需要检索两遍索引。

因此,对于InnoDB的B+Tree索引使用有两个注意点:

  • 建议使用主键自增。由于B+Tree的特性,非自增的主键在插入时会造成B+Tree频繁的分裂。
  • 不建议主键字段过长。由于所有的辅助索引都会检索主键索引,过长的主键索引会使辅助索引过大。
    原文作者:一壶老酒一碗粥
    原文地址: https://www.jianshu.com/p/9d86ace330e3
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞