数组和链表
数据是使用连续的内存空间存储数据。
链表是使用不连续的内存空间存储数据。
常见链表链表结构
单链表
循环链表
双向链表
基本概念
结点
分配用来存储数据的每个不连续的内存块就是结点。
后继指针
既然内存块不是连续的,那么这些值是如何关联起来的。这时候就会通过后继指针来串联这些结点。每个结点除了存储数据外,还要存储下一个结点的内存地址,就是通过后继指针next指向的。
头结点
头结点就是链表起始结点,用于存储链表的基地址。
头结点一般不存储数据。
指向头结点的指针成为头指针。
尾结点
就是最后一个结点,该结点指针区域不指向任何结点,而是指向一个空地址NULL。
单链表
单链表从头结点开始到尾结点结束的链表。
其插入和删除的时间复杂度为O(1),查找的时间复杂度为O(n)
对应的,数据插入和删除的时间复杂度为O(n),查找的时间复杂度为O(1)
循环链表
区别于单链表,循环链表就是将尾结点的指针指向了头结点,形成一个闭环,即为循环链表。
循环链表的优点就是从链尾到链头比较方便。
双向链表
顾名思义,每个结点不仅有指向下一个结点,同时还有了指向上一个结点。
显然,相比之前的链表结构,该链表结构增加了空间消耗,那么必然,在时间上会得到补偿,典型的空间换时间。
下面我们来看看双向链表是如何实现空间换时间的。
我们还是说回普通链表的插入和删除操作。
删除操作
更加准确的说删除操作会有两种情况
删除结点中“值等于某个给定值”的结点
删除给定指针指向的结点
对于第一种情况,如果只是删除,那么时间复杂度就是O(1)。但是在此之前,我们需要找到这个节点,鉴于链表内存结构的不连续性,需要一一遍历才能找到这个结点,所以时间复杂度是O(n),最终时间复杂度也是O(n)。
对于第二种情况,和第一种情况类似,遍历找到这个接口并删除,时间复杂度也是O(n)。
上面说的是单链表,如果这时候是双链表结构,情况就会不太一样。
第一种情况,依然无法避免,因为链表内存结构不连续的事实无法改变。
第二种情况,具体的操作是找到指定的结点,然后将该结点的上一个结点的后继指针指向该结点的下一个结点。但是在双线链表就不一样了,找到当前节点就可以无缝平滑的找到其上一个结点,而不需要傻乎乎的从头结点开始遍历一直找。所以这时候的时间复杂度从O(n)变为了O(1)。这就是典型的空间换时间。
空间换时间和时间换空间
针对不同的场景,我们需要在时间和空间之前做一个权衡。
比如缓存就是一个典型的空间换时间,我们希望接口的响应速度更快更及时,所以我们一次性将数据加载到缓存即内存,这样访问的速度变快了,但是在空间层面上,我们占用了更多的内存资源。
分页请求等这些就是时间换空间,我们每次只使用有限的空间存储返回结果,但是需要分多次请求返回(可能不是十分恰当,意在表明,当空间资源稀缺货有限时,可以通过延长时间来弥补)
数组和链表的比较
数组是固定大小的,如果要扩容,需要重新申请一个更大的内存空间并拷贝原来的数组内容。
链表是天然支持动态扩容的,能够很好的利用碎片的内存空间。
如果你的代码对内存使用非常苛刻,建议使用数组。因为链表除了保存数据的内存空间,还需要内存空间用来存储下一个结点的内存地址,所以空间占用会翻倍。
链表的插入和删除会带来内存的申请和释放,容易造成内存碎片,对于Java语言来说,会导致频繁的GC(垃圾回收)。
如何基于链表实现LRU缓存淘汰算法
LRU(Least Recently used)最近最少使用算法是缓存淘汰的算法之一。
意思就是最近时间内,使用次数最少的缓存内容就优先删除。
实现思路
使用一个链表存储缓存的数据,从头至尾,越靠近头结点表示越是最近访问的数据,越靠近尾结点表示越是久远访问过的数据。
如果访问的某个数据已经被缓存在这个链表中,我们通过遍历找到这个结点后就删除,然后将这个结点插入到头结点。
如果这个数据没有在链表中,这时候继续判断,如果缓存没有满,则将此结点插入到头结点。如果缓存已满,则删除尾结点,并将新数据插入头结点。
使用链表实现这个问题,正是利用链表插入和删除方便的特性,同时头尾指针的顺序也正好可能映射缓存被访问的热度。