学习数据结构/算法的一些心得

2023年3月11日 253次阅读来源: 抬头挺胸才算活着

数据结构是可以被串起来的，每新出现一种新的数据结构或者算法肯定是前面的存在一些不足，新提出的可以对其进行改进，多问自己为什么要有这种数据结构/算法，这样子就有利于将知识点串联起来，知识点不再是孤立地散布在大脑中，调用起来也会更快。

在查找的章节，可以按照如下的知识点串联起来，学起来会更加容易一点。

查找数据结构和算法

首先介绍了顺序表（可以理解为数组）查找，首先从最简单的数据无序可以找起，其复杂度为O（n），显然我们是不满意的，于是我们可以想到将数据进行排序可能会加快查找的速度，接下来是数据有序的情况找起，一共有三种查找的方法，二分法、插值法、Fabonacci法，三种方法大同小异，只不过是每次分开数据的节点不同而已，这时的已经变为时间复杂度为O（lgn），当然我们在一开始的时候要对数据进行排序。这个时候我们还发现一个问题，顺序表查找在删除和插入的时候时间复杂度是O（n）（看见有没有，一路下来都是发现问题，针对问题设计新的方案），于是我们引入了搜索二叉树（BST）。网上搜文的时候发现有人说搜索二叉树是为了加快搜索的速度，那么我就要问他，为什么不用有序排序的顺序表？搜索二叉树数据结构比起一个简单的数组可是要比较复杂，显然搜索二叉树并不是为了加快搜索速度，仅仅为此，我们用有序排序的顺序表查找就可以了。甚至严格来说，搜索二叉树的时间复杂度跟其高度有关，不完全是O（lgn）。搜索二叉树是为了加快顺序表删除和插入操作。引入搜索二叉树后，我们可知，其搜索、插入、删除都与其高度有关，对于满/完全二叉树来说，高度接近lgn，但却存在为单链的情况，这时高度为n，各种操作的复杂度都是O（lgn）。因此我们又引入平衡二叉树，平衡二叉树可以尽量平衡整棵二叉树，注意不是将其弄成满/完全二叉树，那这样子操作起来比较复杂，我们只要求尽量平衡。每次在插入和删除节点的时候，都检查树是否违反了平衡二叉树的定义（平衡因子绝对值小于2），如果是对检测地方进行旋转，于是得到的树整体仍然可以比较平衡，高度比较低。那现在总归可以了吧，各种操作时间复杂度都是O（lgn）。然而在查找的数据多到内存装不下的时候，我们每次判断一个节点就要到硬盘进行读取一次数据，这样子耗时是非常多的，硬盘读取的速度跟内存读取速度相差10^5倍，大概是1天和1秒的区别，因此又有了多路查找树（2-3数、3-3-4树、B树）。多路查找树在每个节点放多个数据，我们可以一次性读取多个，“一棵B个树的阶为1001（即一个节点包含1000个关键字），高度为2，它可以存储超过10亿个关键字……读取两次硬盘即可…….”。

数据结构

总结

如果你已经对查找的各种数据结构建立起了以上的知识结构，那么下次需要遇到查找相关的问题，你的思路收敛起来是比较快的，而不是像一团浆糊，比如问你。

在解决一个新的问题，我们首先对其进行简化后模式识别，看该问题跟其他已经遇到的问题，学过的知识点是否有共通之处，如果有我们便能够对其比较快地进行解决。（如果没有，那就真的靠的是智商了，不过大部分情况下，我们还是在脑子搜索是否遇到类似的问题）而识别的快慢，能否识别起来，靠的是我们的学习能力，学习的时候你是否有将这些知识点进行归纳整理。所以大部分情况下，想问题想的慢可能要归咎于学习能力的问题。

    原文作者：抬头挺胸才算活着
    原文地址: https://www.jianshu.com/p/455075d33f82
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。