B树简单理解

2019年3月16日 294次阅读来源: B树

平衡二叉排序树便于动态查找，因此用平衡二叉排序树来组织索引表是一种可行的选择。当用于大型数据库时，所有数据及索引都存储在外存，因此，涉及到内、外存之间频繁的数据交换，这种交换速度的快慢成为制约动态查找的瓶颈。若以二叉树的结点作为内、外存之间数据交换单位，则查找给定关键字时对磁盘平均进行㏒㏒次访问是不能容忍的（树的深度过大而造成磁盘I/O读写过于频繁，进而导致查询效率低下）。

磁盘读取数据是以盘块(block)为基本单位的。位于同一盘块中的所有数据都能被一次性全部读取出来。而磁盘IO代价主要花费在查找时间Ts上。因此我们应该尽量将相关信息存放在同一盘块，同一磁道中。或者至少放在同一柱面或相邻柱面上，以求在读/写信息时尽量减少磁头来回移动的次数，避免过多的查找时间Ts。

所以，在大规模数据存储方面，大量数据存储在外存磁盘中，而在外存磁盘中读取/写入块(block)中某数据时，首先需要定位到磁盘中的某块，如何有效地查找磁盘中的数据，需要一种合理高效的外存数据结构，就是下面所要重点阐述的B-tree结构，以及相关的变种结构：B⁺-tree结构和B^*-tree结构。

因此，必须选择一种能尽可能降低磁盘I/OI/O次数的索引组织方式。树结点的大小尽可能地接近页的大小。
     B树主要用于文件系统中，在B树中，每个节点的大小为一个磁盘的页，节点中锁包含的关键字及其子节点的数目取决于页的大小。一个度为m的B树，称为m阶B树，定义如下：
     （1）一个m阶B树，或者是空树，或者满足一下性质的m叉树；
     （2）根节点或者是叶子，或者至少有两颗子树，至多是m棵子树；
     （3）除根节点外，所有非终端节点至少是「m/2 （向上取整）棵子树，至多是m棵子树；
     （4）所有叶子节点都在树的同一层上。
     （5）
《B树简单理解》

     下图为B树的一个例子：


1，B树的数据结构，根据以上的信息，定义B树的数据结构如下：
//节点数据结构的定义
typedef struct BTNode
{
    int keynum;             //节点信息的数量，不包含key[0]节点
    struct BTNode *parent;  //父节点
    int key[M+1];           //节点信息数组，第一个节点没用。
    struct BTNode *ptr[M+1];//子节点信息
}BTNode;

2，B树的查找
     查找的基本思想是：
     （1）从树的根节点T开始，在节点中利用遍历或折半查找给定的值，如果找到，则返回节点指针和在节点中的位置；如果没有，则到（2）
     （2）与节点中的Key进行比较，找到给定值左右Key中间的指针，去其子树中查找
     （3）重复执行1,2两步，直到找到。如果直到叶子节点，仍未找到，则返回0，并返回最后搜索的叶子节点。（此节点是给定值需要插入的位置）

3，B树的插入
     插入新节点的基本思想如下：
     （1）在B树查找关键字，如果找到，则不插入；否则，执行（2）
     （2）将给定值插入到叶子节点中，如果：
          a，叶子的节点数
          b，叶子的节点数=m-1：插入节点，并将节点分裂。分裂的方式是将该节点拆分成两个节点，然后，将中间节点插入到父节点当中，拆分后的两个节点，分别作为插入到父节点的中间节点的左右子。如果中间节点插入到父节点后，仍然需要分裂，则继续分裂，直到根节点。如果仍然需要分裂，则新建一个根节点，将分裂后的两个节点分别作为新根节点的两个子节点。
     例如如下图：
《B树简单理解》

    原文作者：B树
    原文地址: https://blog.csdn.net/u013782203/article/details/51981876
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。