为什么B树的搜索复杂度是logB(N)?

翻译一段:

 

索引加快搜索速度:

 

使用索引可以大大改善搜索速度。在上面的例子中,初始的磁盘读的搜索范围被2这个因子进行的缩小(因为是2叉树)。这个可以通过创建一个索引从本质上进行改进,该索引包含地盘数据块的第一个记录。这个补充索引应该是原始数据库的1%大,但是它可以被更快的搜索。在补充索引中找到一个条目可以指导我们在主数据库中搜索那个数据块;在搜索完补充索引之后,我们必须在搜索主数据库中的对应数据块-代价是一次额外的磁盘读。这个索引应该可以容纳10000个条目,所以最多会有14次比较(log2(10000))。像主数据库,大概最后6次比较是在同一个磁盘数据块内的。索引大概在8次磁盘读中被搜索完成,然后希望找到的记录将在第9次磁盘读时被访问到。

 

创建辅助索引的方式可以被不断使用来穿件辅助索引的索引。这将产生仅仅100个条目来构建出一个补充索引的补充索引并且被放在一个磁盘数据块中。

 

这样我们将不是读14次磁盘,而是仅仅读3次磁盘。读并且搜索辅助索引的第一个数据块来定位辅助索引的相关数据块。然后读和搜索辅助索引的数据块定位主数据块中相关的数据块。这样我们不用150毫秒以拿到该记录,而是30毫秒。

 

辅助索引把一个复杂度大概为log2(N)的二次搜索问题变成了logb(N)磁盘读,b是数据块的因素(也就是一个数据块容纳的条目数量)

 

在现实当中,如果主数据库经常被搜索,辅助的辅助索引和大部分辅助索引保留在一个磁盘缓存中,所以他们基本上不需要磁盘读。

 

 

    原文作者:B树
    原文地址: https://blog.csdn.net/houhouzhe/article/details/8556707
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞