C++ STL容器底层数据结构总结

STL 就是所谓的标准模板库(Standard Template Library),这可能是C++程序员的一大利器。

总的来说,STL包括几个部分:容器,算法(泛型算法),迭代器三个主要部分(当然还包含仿函数,适配器等其他部分),下图说明了三个主要部分之间的关系(网图,侵删)。

《C++ STL容器底层数据结构总结》 STL三个主要部分的关系示意图

要是详细的总结,这肯定是一本类似于《C++ Primer》的大书。本篇文章主要是对于STL中的常用容器的底层数据结构进行总结整理。

I、vector

1.1 vector底层数据结构

vector是我们用到最多的数据结构,其底层数据结构是数组,由于数组的特点,vector也具有以下特性:
1、O(1)时间的快速访问;
2、顺序存储,所以插入到非尾结点位置所需时间复杂度为O(n),删除也一样;
3、扩容规则:
当我们新建一个vector的时候,会首先分配给他一片连续的内存空间,如std::vector<int> vec,当通过push_back向其中增加元素时,如果初始分配空间已满,就会引起vector扩容,其扩容规则在gcc下以2倍方式完成:
首先重新申请一个2倍大的内存空间;
然后将原空间的内容拷贝过来;
最后将原空间内容进行释放,将内存交还给操作系统;

测试代码如下:

#include<iostream>
#include<vector>
using namespace std;

void mycapacity(const vector<int>& vec)
{
    cout << "分配总空间大小为:" << vec.capacity() << endl;
}

void mysize(const vector<int>& vec)
{
    cout << "已用空间大小为:" << vec.size() << endl;
}

void myprint(const vector<int>& vec)
{
    for (int i = 0; i < vec.size(); ++i)
        cout << vec[i] << ",";
    cout << endl;
}


int main()
{
    vector<int> vec;
    cout << "起始状态:" << endl;
    mycapacity(vec);
    mysize(vec);
    cout << "========================" << endl;

    for (int i = 0; i < 10; ++i) {
        vec.push_back(i);
        cout << "压入第" << i+1 << "个元素之后:" << endl;
        myprint(vec);
        mycapacity(vec);
        mysize(vec);
        cout << "========================" << endl;
    }

    return 0;
}

《C++ STL容器底层数据结构总结》 测试输出结果

从输出结果中的三个红色箭头可以看出vector的扩容规则。

4、注意事项:
根据vector的插入和删除特性,以及扩容规则,我们在使用vector的时候要注意,在插入位置和删除位置之后的所有迭代器和指针引用都会失效,同理,扩容之后的所有迭代器指针和引用也都会失效。

II、map & multimap & unordered_map & unordered_multimap

2.1 map与multimap底层数据结构

map与multimap是STL中的关联容器、提供一对一key-value的数据处理能力; map与multimap的区别在于,multimap允许关键字重复,而map不允许重复。

这两个关联容器的底层数据结构均为红黑树,关于红黑树的理解可以参考教你透彻了解红黑树一文。

根据红黑树的原理,map与multimap可以实现O(lgn)的查找,插入和删除。

2.2 unordered_map 与unordered_multimap底层数据结构

unordered_map与unordered_multimap 对比2.1中的两种map在于其2.1中的两个容器实现了以key为序排列,也就是说map与multimap为有序的

而unordered_map与unordered_multimap中key为无序排列,其底层实现为hash table,因此其查找时间复杂度理论上达到了O(n),之所以说理论上是因为在理想无碰撞的情况下,而真实情况未必如此。

III、set & multiset & unordered_set & unordered_multiset

以上四种容器也都是关联容器,set系与map系的区别在于map中存储的是<key-value>,而set可以理解为关键字即值,即只保存关键字的容器。

3.1 set & multiset底层数据结构

set与multiset有序存储元素,这两种容器的底层实现与map一样都是红黑树,所以能实现O(lgn)的查找,插入,删除操作。

set与multiset的区别在于是否允许重复;

3.2 unordered_set & unordered_multiset

与unordered_map & unordered_multimap相同,其底层实现为hash table

IV、 priority_queue

4.1 priority_queue

优先级队列相当于一个有权值的单向队列queue,在这个队列中,所有元素是按照优先级排列的。

priority_queue根据的处理规则来调整元素之间的位置,关于堆的原理,可以参考

根据堆的特性,优先级队列实现了取出最大最小元素时间复杂度为O(1),对于插入和删除,其最坏情况为O(lgn)。

V、 其他数据结构

list的底层数据结构为双向链表,特点是支持快速的增删。
queue为单向队列,为先入先出原则。
deque为双向队列,其对比queue可以实现在头尾两端高效的插入和删除操作。

欢迎转载,转载请注明出处wenmingxing 你好呀 C++

    原文作者:wenmingxing
    原文地址: https://www.jianshu.com/p/834cc223bb57
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞