为什么数组比链表查询速度快?
数组和链表的查询时间复杂度虽然都是O(n),但实际上数据比链表查找要快很多,因为数组是连续存储的,而只有连续存储才能被CPU缓存读入,所以数组可以全部或者部分存在于CPU缓存里,CPU缓存中每个元素的平均读取时间只要3个CPU时钟周期,而链表的节点是分散在堆空间(内存)里的,内存的平均读取时间是100个CPU时钟周期,这时候CPU缓存帮不上忙,只能是去读取内存,所以链表的查询速度比较快。
CPU 寄存器 – immediate access (0-1个CPU时钟周期)
CPU L1 缓存 – fast access (3个CPU时钟周期)
CPU L2 缓存 – slightly slower access (10个CPU时钟周期)
内存 (RAM) – slow access (100个CPU时钟周期)
硬盘 (file system) – very slow (10,000,000个CPU时钟周期)
但是链表动态扩容存储空间会比数组来得方便。
数据结构的存储方式只有两种:顺序存储(数组)和 链式存储(链表)
这句话怎么理解,不是还有散列表、栈、队列、堆、树、图等等各种数据结构吗?
- 我们分析问题,一定要有递归的思想,自顶向下,从抽象到具体。你上来就列出这么多,那些都属于「上层建筑」,而数组和链表才是「结构基础」。因为那些多样化的数据结构,究其源头,都是在链表或者数组上的特殊操作,API不同而已。
- 比如说「队列」、「栈」这两种数据结构既可以使用链表也可以使用数组实现。用数组实现,就要处理扩容缩容的问题;用链表实现,没有这个问题,但需要更多的内存空间存储节点指针。
- 「图」的两种表示方法,邻接表就是链表,邻接矩阵就是二维数组。邻接矩阵判断连通性迅速,并可以进行矩阵运算解决一些问题,但是如果图比较稀疏的话很耗费空间。邻接表比较节省空间,但是很多操作的效率上肯定比不过邻接矩阵。
- 「散列表」就是通过散列函数把键映射到一个大数组里。而且对于解决散列冲突的方法,拉链法需要链表特性,操作简单,但需要额外的空间存储指针;线性探查法就需要数组特性,以便连续寻址,不需要指针的存储空间,但操作稍微复杂些。
-「树」,用数组实现就是「堆」,因为「堆」是一个完全二叉树,用数组存储不需要节点指针,操作也比较简单;用链表实现就是很常见的那种「树」,因为不一定是完全二叉树,所以不适合用数组存储。为此,在这种链表「树」结构之上,又衍生出各种巧妙的设计,比如二叉搜索树、AVL树、红黑树、区间树、B 树等等,以应对不同的问题。 - 了解 Redis 数据库的朋友可能也知道,Redis 提供列表、字符串、集合等等几种常用数据结构,但是对于每种数据结构,底层的存储方式都至少有两种,以便于根据存储数据的实际情况使用合适的存储方式。
数据结构种类很多,甚至你也可以发明自己的数据结构,但是底层存储无非数组或者链表。