B树C语言实现-创建、插入、删除

1. 课程设计题目标题:  B树的基本操作算法(创建、插入、删除)

问题描述:

 在计算机科学中,B树在查找、访问、插入、删除操作上时间复杂度为O(log2~n),与自平衡二叉查找树不同的是B树对大块数据读写的操作有更优的性能,其通常在数据库和文件系统中被使用。  

对于一棵B树,对其进行创建、插入、删除的基本操作。

2. 算法描述

(1) 总体思路(最初的算法)

一棵m阶的B树,或为空树,或为满足下列特征的m叉树:

 ①、树中每个结点至多有m棵子树;    

 ②、若根结点不是终端结点,则至少有2棵子树;

 ③、除根之外,所有非终端结点至少有棵子树;    

 ④、所有的非终端结点中包含下列信息数据: [n, C0, K0, C1, K1, C2, K2, …., Kn-1, Cn]         其中:Ki[i=0,1,…,n-1]为关键字,且Ki<Ki+1[i=0, 1, …, n-2];Ci[i=0,1,…,n]为至上子树根结点的指针,且指针Ci所指子树中所有结点的关键字均小于Ki[i=0,1,…,n-1],但都大于Ki-1[i=1,…,n-1];

数据结构:

(2) 第二版本算法

基本操作之插入的步骤:

B树是从空树起,逐个插入关键字而建立起来的,由于B树结点中的关键字个数num必须>=,因此,每次插入一个关键字不是在树中添加一个终端结点,而是首先在最底层的某个非终端结点中插入一个关键字,若该结点的关键字个数不超过m-1,则插入完成,否则要进行结点的“分裂”。

  假设结点node的关键字个数num>max,则需进行分裂处理,其大体处理流程如下:

  1) 结点node以sidx关键字为分割点,索引(0 ~ sidx-1)关键字继续留在结点node中,索引(sidx+1 ~ num-1)关键字放入新结点node2中

  2) 而索引sidx关键字则插入node->parent中,再将新结点node2作为父结点新插入关键字的右孩子结点

  3) 判断插入node的sidx关键字后,node->parent的关键字个数num是否超过max,如果超过,则以parent为操作对象进行1)的处理;否则,处理结束。

 

 

当结点关键字个数num达到max时,则需要进行“分裂”处理,分割序号为num/2。分裂过程如下:

    ->1) 以序列号idx=num/2为分割点,原结点分裂为2个结点A和B;

    ->2) 原结点无父结点,则新建一个结点P,并将关键字插入到新结点P中;若有父节点就直接把AB作为父节点的子结点

    ->3) 将结点A和B作为结点P的子结点,并遵循B树特征④;

    ->4) 因结点P的结点数未超过max,则分裂结束。

 

(3) 第三版本算法

基本操作之删除的步骤:

假设现有一棵m阶的B树,则单个结点的关键字最大个数max=m-1,关键字最小个数min=。假设被删关键字key为结点node中的第idx个关键字,由B树的特征可知,在删除操作之前,结点node的关键字个数num需满足min <= num <= max)。  

情况1:被删关键字KEY所在结点node为非最底层结点时    

Step1:找到被删关键字KEY在结点node中的位置idx —— 即:node->key[idx]为将被删除的关键字    

Step2:找到以子结点child = node->child[idx]为根节点的子树    

Step3:再找到该子树中的最大关键字KEY2,并将之拿去填充被删关键字KEY的位置,即:node->key[idx] = KEY2。 —— 子树最大关键字MaxKey被拿走后,相当于子树最大关键字的原位置被空缺了出来,也可在一定意义上理解为最终删除的子树中的最大关键字。    

经过思考后可发现:以子结点child = node->child[idx]为根节点的子树中最大关键字一定是在最底层某个结点中,不管要求被删的关键字KEY在哪个结点,均可视为最终被删的关键字都是在最底层结点中,而最底层结点的处理请参考2)的处理流程。

 

  

 情况2:被删关键字KEY所在结点node为最底层结点时    

2.1) 删除操作前,结点node的关键字个数num>时,则进行删除操作后,结点node关键字个数num仍然处在min <= num <= max的范围之中,此时删除操作处理完成;    

2.2) 删除操作前,结点node的关键字个数num=时,则进行删除操作后,结点node的关键字个数num<,显然已经不符合B树的特征,为了维护B树的特征,此时需要进行的处理有2种情况:    

->2.2.1) 如果结点node的兄弟结点brother的结点个数num>时,则结点node可以向brother借用一个结点,但是需要以父结点的关键字为跳板,此时删除操作处理完成;    

->2.2.2) 如果结点node的兄弟结点brother的节点个数num=时,则将node和brother进行合并为一个结点new,同时需要将父结点parent中夹在node和brother之间的关键字插入到新结点new中。如果父结点parent中的一个关键字被插入到了新结点后,父结点parent的关键字个数num>=,则删除操作处理完成; 如果父结点parent的关键字个数num<,则父结点parent此时已经不满足B树特征,则需以父结点为操作对象进行2.2)中的情况判断,并依次类推直至根结点。

3. 数据结构

typedef struct _btree_node_t  
{  
    int num;                      /*关键字个数*/ 
    int *key;                     /* 关键字:所占空间为(max+1) – 多出来的1个空间用于交换空间使用 */  
    struct _btree_node_t **child;  /* 子结点:所占空间为(max+2)- 多出来的1个空间用于交换空间使用 */   
    struct _btree_node_t *parent;  /* 父结点 */  
}btree_node_t;  

typedef struct  
{  
    int max;                /* 单个结点最大关键字个数 – 阶m=max+1 */        
    int min;                /* 单个结点最小关键字个数 min=(m/2)向上取整-1*/         
    int sidx;               /* 分裂索引 = (max+1)/2 */        
    btree_node_t *root;     /* B树根结点地址 */           
}btree_t;  

4. 程序源代码

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <errno.h>
typedef struct _btree_node_t  
{  
    int num;                      /*关键字个数*/ 
    int *key;                     /* 关键字:所占空间为(max+1) - 多出来的1个空间用于交换空间使用 */  
    struct _btree_node_t **child;  /* 子结点:所占空间为(max+2)- 多出来的1个空间用于交换空间使用 */   
    struct _btree_node_t *parent;  /* 父结点 */  
}btree_node_t;  

typedef struct  
{  
    int max;                /* 单个结点最大关键字个数 - 阶m=max+1 */        
    int min;                /* 单个结点最小关键字个数 min=(m/2)向上取整-1*/         
    int sidx;               /* 分裂索引 = (max+1)/2 */        
    btree_node_t *root;     /* B树根结点地址 */           
}btree_t;  

static int btree_merge(btree_t *btree, btree_node_t *node);
static int _btree_merge(btree_t *btree, btree_node_t *left, btree_node_t *right, int mid);
//节点创建
static btree_node_t *btree_creat_node(btree_t *btree)  
{  
    btree_node_t *node = NULL;    
    node = (btree_node_t *)calloc(1, sizeof(btree_node_t));  
    if(NULL == node) {  
        fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));  
        return NULL;  
    }  
  
    node->num = 0;  //结点关键字个数初始化为0
  
    /* 申请max+1个空间,当关键字个数到达max+1时执行分裂操作 */  
    node->key = (int *)calloc(btree->max+1, sizeof(int));  
    if(NULL == node->key) {  
        free(node), node=NULL;  
        fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));  
        return NULL;  
    }  
  
    /* 申请max+2个子节点空间,因为子节点每分裂一次,父节点多一个关键字,所以当父节点需要分裂时,正好是子节点个数为max+2个 */  
    node->child = (btree_node_t **)calloc(btree->max+2, sizeof(btree_node_t *));  
    if(NULL == node->child) {  
        free(node->key);  
        free(node), node=NULL;  
        fprintf(stderr, "[%s][%d] errmsg:[%d] %s\n", __FILE__, __LINE__, errno, strerror(errno));  
        return NULL;  
    }  
  
    return node;  
}  


btree_t* btree_creat(int m)  
{  
    btree_t *btree = NULL;  
  
    if(m < 3) { //阶数不能小于3阶 
        fprintf(stderr, "[%s][%d] Parameter 'max' must geater than 2.\n", __FILE__, __LINE__);  
        return NULL;  
    }  
  
    btree = (btree_t *)calloc(1, sizeof(btree_t));  
    if(NULL == btree) {  
        fprintf(stderr, "[%s][%d] errmsg:[%d] %s!\n", __FILE__, __LINE__, errno, strerror(errno));  
        return NULL;  
    }  
  
    btree->max= m - 1;  
    btree->min = m/2;  
    if(0 != m%2) {  
        btree->min++;  
    }  
    btree->min--;  //min=(m/2)向上取整-1
    btree->sidx = m/2;  //分裂索引
    btree->root = NULL; 
  
    return btree;  
} 

//分裂结点
static int btree_split(btree_t *btree, btree_node_t *node)  
{  
    int idx = 0, total = 0, sidx = btree->sidx;  
    btree_node_t *parent = NULL, *newNode = NULL;   
  
  
    while(node->num > btree->max) {    
        total = node->num;  
  
        newNode = btree_creat_node(btree);  //创建一个新结点用来放索引sidx+1开始的关键字
        if(NULL == newNode) {         
            fprintf(stderr, "[%s][%d] Create node failed!\n", __FILE__, __LINE__);  
            return -1;  
        }  
  
  
        memcpy(newNode->key, node->key + sidx + 1, (total-sidx-1) * sizeof(int));  //把sidx之后的关键字放入新结点中
        memcpy(newNode->child, node->child+sidx+1, (total-sidx) * sizeof(btree_node_t *));  //把child[sidx]之后的子结点放到newNode->child中
	

  
        newNode->num = (total - sidx - 1);  //计算新结点的关键字个数
        newNode->parent  = node->parent;    //将node和newNode作为原node父节点的子结点
  
        node->num = sidx;   
		
        parent  = node->parent;  
        if(NULL == parent)  {   //如果node没有父节点      
  
            parent = btree_creat_node(btree);  //新建一个结点作为父节点
            if(NULL == parent) {         
                fprintf(stderr, "[%s][%d] Create root failed!", __FILE__, __LINE__);  
                return -1;  
            }         
  
            btree->root = parent;   //更新根结点
			//把node,newNode作为新建父节点的子结点
            parent->child[0] = node;  
			parent->child[1] = newNode; 	
            node->parent = parent;   
            newNode->parent = parent;   
  
            parent->key[0] = node->key[sidx];  //把分裂索引所在的关键字放到该父节点中

            parent->num++;  
        }         
        else {         
			//如果node原本就有父节点,就直接把key[sidx]插入到父节点中
            for(idx=parent->num; idx>0; idx--) {      //找到父节点中比key[sidx]大的最小关键字,把key[sidx]插到该关键字的前面   
                if(node->key[sidx] < parent->key[idx-1]) {   //在parent->key中每次找到一个比key[sidx]大的就再比较前一个      
                    parent->key[idx] = parent->key[idx-1];  //每找到一个,就把该关键字的值,和该关键字下方的右孩子结点向后移一位
                    parent->child[idx+1] = parent->child[idx];  
                    continue;  //继续进行for循环
                } 
                break; 
				//直到找到比key[sidx]大的最小parent->key索引,
				//此时的parent->key[idx]表示node->key[sidx]要插入的地方,parent->child[idx+1]是newNode要插入的地方
            }         
  
            parent->key[idx] = node->key[sidx];  //插入分裂关键字
            parent->child[idx+1] = newNode;      //插入新结点
            newNode->parent = parent;            
            parent->num++;  
        }         
  
      //  memset(node->key+sidx, 0, (total - sidx) * sizeof(int));  
      //  memset(node->child+sidx+1, 0, (total - sidx) * sizeof(btree_node_t *));   
  
        /* Change node2's child->parent */  
      //  for(idx = 0; idx <= newNode->num; idx++) {  
      //      if(NULL != newNode->child[idx]) {         
      //          newNode->child[idx]->parent = newNode;  
      //      }         
      //  }    
				memset(node->key+sidx, 0, (total - sidx) * sizeof(int));  
        memset(node->child+sidx+1, 0, (total - sidx) * sizeof(btree_node_t *)); 
		//将复制给newNode的子结点中的parent指向newNode
		for(idx = 0; idx <= newNode->num; idx++) {  
            if(NULL != newNode->child[idx]) {         
                newNode->child[idx]->parent = newNode;  
            }         
        } 
       node = parent;   
    }  
  
    return 0;  
}  

static int _btree_insert(btree_t *btree, btree_node_t *node, int key, int idx) 
 //传入要插入关键字的结点,idx表示比自己大的结点的位置,也就是key要插入的位置
{  
    int i = 0;  
  
  
    for(i=node->num; i>idx; i--) {  
        node->key[i] = node->key[i-1];  //插入关键字
    }  
  
    node->key[idx] = key; 
    node->num++;  
  
    if(node->num > btree->max) {  //当该结点关键字个数大于最大关键字个数时,执行分裂操作
        return btree_split(btree, node);  
    }  
  
    return 0;  
}  

//插入操作
int btree_insert(btree_t *btree, int key)  
{  
    int idx = 0;  //key索引
    btree_node_t *node = btree->root;  

    if(NULL == node) {  //如果为空树,就创建第一个结点
        node = btree_creat_node(btree);  
        if(NULL == node) {  
            fprintf(stderr, "[%s][%d] Create node failed!\n", __FILE__, __LINE__);  
            return -1;  
        }  
        //第一个结点创建成果后,插入key
        node->num = 1;   
        node->key[0] = key;  
        node->parent = NULL;  
  
        btree->root = node;  
        return 0;  
    }  
  
  
    while(NULL != node) {  
        for(idx=0; idx < node->num; idx++) {  
            if(key == node->key[idx]) {  //如果要插入的数据已经存在就不需要插入
                fprintf(stderr, "[%s][%d] The node is exist!\n", __FILE__, __LINE__);  
                return 0;  
            }  
             else if(key < node->key[idx]) {  //找到第一个比自己大的关键字,没有的话就继续idx++
                break;  
            }  
        }  
        //如果该结点存在子结点,此时的idx也表示子结点的索引
		//子结点索引从0开始
		//child[idx]<key[idx]<child[idx+1]
        if(NULL != node->child[idx]) {  //如果这个关键字有对应的子节点,就进入这个子节点,在这个子节点中执行上述操作
            node = node->child[idx];  
        }  
        else {  
            break;  //直到找到一个比自己大的且没有子结点的关键字,执行插入操作,插到这个关键字的前面
        }  
    }  
  
 
    return _btree_insert(btree, node, key, idx);  //执行插入操作
}  
static int _btree_merge(btree_t *btree, btree_node_t *left, btree_node_t *right, int mid)  
{  
    int m = 0;  
    btree_node_t *parent = left->parent;  
  
    left->key[left->num++] = parent->key[mid];  
  
    memcpy(left->key + left->num, right->key, right->num*sizeof(int));  
    memcpy(left->child + left->num, right->child, (right->num+1)*sizeof(btree_node_t *));  
    for(m=0; m<=right->num; m++) {  
        if(NULL != right->child[m]) {  
            right->child[m]->parent = left;  
        }  
    }  
    left->num += right->num;  
  
    for(m=mid; m<parent->num-1; m++) {  
        parent->key[m] = parent->key[m+1];  
        parent->child[m+1] = parent->child[m+2];  
    }  
  
    parent->key[m] = 0;  
    parent->child[m+1] = NULL;  
    parent->num--;  
    free(right);  
  
    /* Check */  
    if(parent->num < btree->min) {  
        return btree_merge(btree, parent);  
    }  
  
    return 0;  
}  

static int btree_merge(btree_t *btree, btree_node_t *node)  
{  
    int idx = 0, m = 0, mid = 0;  
    btree_node_t *parent = node->parent, *right = NULL, *left = NULL;  
 
    if(NULL == parent) {  
        if(0 == node->num) {  
            if(NULL != node->child[0]) {  
                btree->root = node->child[0];  
                node->child[0]->parent = NULL;  
            }  
            else {  
                btree->root = NULL;  
            }  
            free(node);  
        }  
        return 0;  
    }  
  
    for(idx=0; idx<=parent->num; idx++) {  
        if(parent->child[idx] == node) {  
            break;  
        }  
    }  
  
    if(idx > parent->num) {  
        fprintf(stderr, "[%s][%d] Didn't find node in parent's children array!\n", __FILE__, __LINE__);  
        return -1;  
    }  

    else if(idx == parent->num) {  
        mid = idx - 1;  
        left = parent->child[mid];  

        if((node->num + left->num + 1) <= btree->max) {  
            return _btree_merge(btree, left, node, mid);  
        }  
  

        for(m=node->num; m>0; m--) {  
            node->key[m] = node->key[m - 1];  
            node->child[m+1] = node->child[m];  
        }  
        node->child[1] = node->child[0];  
  
        node->key[0] = parent->key[mid];  
        node->num++;  
        node->child[0] = left->child[left->num];  
        if(NULL != left->child[left->num]) {  
            left->child[left->num]->parent = node;  
        }  
  
        parent->key[mid] = left->key[left->num - 1];  
        left->key[left->num - 1] = 0;  
        left->child[left->num] = NULL;  
        left->num--;  
        return 0;  
    }  
      

    mid = idx;  
    right = parent->child[mid + 1];  

    if((node->num + right->num + 1) <= btree->max) {  
        return _btree_merge(btree, node, right, mid);  
    }  
  
    node->key[node->num++] = parent->key[mid];  
    node->child[node->num] = right->child[0];  
    if(NULL != right->child[0]) {  
        right->child[0]->parent = node;  
    }  
  
    parent->key[mid] = right->key[0];  
    for(m=0; m<right->num; m++) {  
        right->key[m] = right->key[m+1];  
        right->child[m] = right->child[m+1];  
    }  
    right->child[m] = NULL;  
    right->num--;  
    return 0;  
}  

static int _btree_delete(btree_t *btree, btree_node_t *node, int idx)  
{  
    btree_node_t *orig = node, *child = node->child[idx];  
   
    while(NULL != child) {  
        node = child;  
        child = node->child[child->num];  
    }  
  
    orig->key[idx] = node->key[node->num - 1];  
  

    node->key[--node->num] = 0;  
    if(node->num < btree->min) {  
        return btree_merge(btree, node);  
    }  
  
    return 0;  
}  

int btree_delete(btree_t *btree, int key)  
{  
    int idx = 0;  
    btree_node_t *node = btree->root;  
  
  
    while(NULL != node) {  
        for(idx=0; idx<node->num; idx++) {  
            if(key == node->key[idx]) {  
                return _btree_delete(btree, node, idx);  
            }  
            else if(key < node->key[idx]) {  
                break;  
            }  
        }  
  
        node = node->child[idx];  
    }  
  
    return 0;  
}  

void Inorder(btree_node_t *root,int deep){
    int i,j,k,a=1;
    if(root != NULL)
    {
       if(deep){
        printf("\n");
       }
       for(j = 0;j < deep;j++){
        printf("---");  
       }
       for(i = 0; i <= root->num;i++){
           if(a){
        printf("< %d | ",root->num);
        for( k = 0;k < root->num;k++){
            printf("%d ",root->key[k]);
        }
        a--;
        printf(">");
          }
        Inorder(root->child[i],deep+1);
       }
       printf("\n");
    }
}

int main(){
   btree_t *bt;
   int i;
   int a[21]={3,4,44,12,67,98,32,43,24,100,34,55,33,13,25,8,5,41,77,200};
   bt = btree_creat(4);
   for(i = 0;i < 20;i++){
    printf("insert %d: %d\n",i+1,a[i]);
    btree_insert(bt,a[i]);
    Inorder(bt->root,0);
    printf("\n");
   }

   for(i = 0;i < 10;i++){
    printf("delete %d: %d\n",i+1,a[i]);
    btree_delete(bt,a[i]);
    Inorder(bt->root,0);
   }
   return 0;
}

    原文作者:B树
    原文地址: https://blog.csdn.net/Meikongggg/article/details/78595512
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞