HashMap、HashTable、LinkedHashMap、TreeMap、ConcurrentHashMap、SparseArray、ArrayMap

2019年5月30日 255次阅读来源: 蜡笔小州

面试官：请说一下HashMap和HashTable的区别？
我：额…我只用过HashMap。
面试官：好，回去等消息。
我：哦。
.
.
.
.
.
.
.
.
.
.
.
三年后

前言

Hashmap在我们代码中还是经常用到的，它用于存放一些键值对，比如我有一次在做广告需求的时候，要做缓存，而每个城市的广告图还不同，当时就是使用的hashmap存放的城市号码和对应图片的url地址。
而HashTable这个东西在多线程中还是需要使用到的因为他是线程安全的，而我们知道线程安全必然他的效率就会低了些，而HashMap还支持key、value为null，所以面试官在问你的时候（当然现在不会问了），首先来一个素质三连：

《HashMap、HashTable、LinkedHashMap、TreeMap、ConcurrentHashMap、SparseArray、ArrayMap》 HashMap、HashTable.png

HashMap

首先我们要了解的是HashMap的结构就是一个链表数组，也就是装链表单位的数组，为什么要这么做，我们知道，链表（空间不连续，寻址困难，增删元素只需修改指针，所以查询慢、增删快）的删减效率高，但是查询效率低，数组（连续空间，寻址迅速，但是在删除或者添加元素的时候需要有较大幅度的移动）的删减效率低，但查询效率高，我的工资低但是加班多，额，综合了俩种数据结构的优点，开发人员总结了使用的方式，开发了哈希表，就是我们的链表数组，额这下工资高加班也多（雾）咯。

复习：ArrayList和Vector都是使用数组方式存储数据，所以是有序的，此数组元素数大于实际存储的数据以便增加和插入元素，它们都允许直接按序号索引元素，但是插入元素要涉及数组元素移动等内存操作，所以索引数据快而插入数据慢，Vector由于使用了synchronized方法（线程安全），通常性能上较ArrayList差，Vector每次增加要讲容量翻倍，java2.1后出现ArrayList代替Vector以增强效率。而LinkedList使用双向链表实现存储，按序号索引数据需要进行前向或后向遍历，但是插入数据时只需要记录本项的前后项即可，所以插入速度较快。

下面介绍HashMap的俩个方法：

keyset
ketset是键的集合。是纵向的。因为set具备迭代器，可以迭代方式取出所有的键，再根据get方法。获取每一个键对应的值。

Map map = new HashMap(); 
Set  keySet= map.keySet();
Iterator iterator = keySet.iterator();
while(iterator.hasNext()) {
        Object key = iterator.next();
        Object value = map.get(key);
         //
}

entryset
entryset是映射关系的集合，是横向的。

Map map = new HashMap();
Iterator iterator = map.entrySet().iterator();
while(iterator.hasNext()) {
      Map.Entry entry = iterator.next();
      Object key = entry.getKey();
                   //
}

其他
Set()的速度比entrySet()慢了很多。
使用entrySet则必须将map对象转换为Map.Entry，keySet则不需要。
另一种遍历：

Map map = new HashMap();
      Collection c = map.values();
      Iterator iterator = c.iterator();
      while(iterator.hasNext()) {
             Object value = iterator.next(); 
     }

hashmap的使用原理

当系统开始初始化 HashMap 时，系统会创建一个长度为 capacity 的 Entry 数组，这个数组里可以存储元素的位置被称为“桶（bucket）”，每个 bucket 都有其指定索引，系统可以根据其索引快速访问该 bucket 里存储的元素。

无论何时，HashMap 的每个“桶”只存储一个元素（也就是一个 Entry），由于 Entry 对象可以包含一个引用变量（就是 Entry 构造器的的最后一个参数）用于指向下一个 Entry，因此可能出现的情况是：HashMap 的 bucket 中只有一个 Entry，但这个 Entry 指向另一个 Entry ——这就形成了一个 Entry 链。

当链的数量为8个的时候，会变成平行树的结构。

如果 HashMap 的每个 bucket 里只有一个 Entry 时，HashMap 可以根据索引、快速地取出该 bucket 里的 Entry；在发生“Hash 冲突”的情况下，单个 bucket 里存储的不是一个 Entry，而是一个 Entry 链，系统只能必须按顺序遍历每个 Entry，直到找到想搜索的 Entry 为止——如果恰好要搜索的 Entry 位于该 Entry 链的最末端（该 Entry 是最早放入该 bucket 中），那系统必须循环到最后才能找到该元素。

归纳起来简单地说，HashMap 在底层将 key-value 当成一个整体进行处理，这个整体就是一个 Entry 对象。HashMap 底层采用一个 Entry[] 数组来保存所有的 key-value 对，当需要存储一个 Entry 对象时，会根据 Hash 算法来决定其存储位置；当需要取出一个 Entry 时，也会根据 Hash 算法找到其存储位置，直接取出该 Entry。由此可见：HashMap 之所以能快速存、取它所包含的 Entry，完全类似于现实生活中母亲从小教我们的：不同的东西要放在不同的位置，需要时才能快速找到它。

当创建 HashMap 时，有一个默认的负载因子（load factor），其默认值为 0.75，这是时间和空间成本上一种折衷：增大负载因子可以减少 Hash 表（就是那个 Entry 数组）所占用的内存空间，但会增加查询数据的时间开销，而查询是最频繁的的操作（HashMap 的 get() 与 put() 方法都要用到查询）；减小负载因子会提高数据查询的性能，但会增加 Hash 表所占用的内存空间。
参考：http://alex09.iteye.com/blog/539545

当两个对象的hashcode相同会发生什么

因为hashcode相同，所以它们的bucket位置相同，‘碰撞’会发生。因为HashMap使用链表存储对象，这个Entry(包含有键值对的Map.Entry对象)会存储在链表中

如果两个键的hashcode相同，你如何获取值对象？

当我们调用get()方法，HashMap会使用键对象的hashcode找到bucket位置，然后获取值对象。找到bucket位置之后，会调用keys.equals()方法去找到链表中正确的节点，最终找到要找的值对象

如果HashMap的大小超过了负载因子(load factor)定义的容量，怎么办？

除非你真正知道HashMap的工作原理，否则你将回答不出这道题。默认的负载因子大小为0.75，也就是说，当一个map填满了75%的bucket时候，和其它集合类(如ArrayList等)一样，将会创建原来HashMap大小的两倍的bucket数组，来重新调整map的大小，并将原来的对象放入新的bucket数组中。这个过程叫作rehashing，因为它调用hash方法找到新的bucket位置。

为什么String, Interger这样的wrapper类适合作为键？

String, Interger这样的wrapper类作为HashMap的键是再适合不过了，而且String最为常用。因为String是不可变的，也是final的，而且已经重写了equals()和hashCode()方法了。其他的wrapper类也有这个特点。不可变性是必要的，因为为了要计算hashCode()，就要防止键值改变，如果键值在放入时和获取时返回不同的hashcode的话，那么就不能从HashMap中找到你想要的对象。不可变性还有其他的优点如线程安全。如果你可以仅仅通过将某个field声明成final就能保证hashCode是不变的，那么请这么做吧。因为获取对象的时候要用到equals()和hashCode()方法，那么键对象正确的重写这两个方法是非常重要的。如果两个不相等的对象返回不同的hashcode的话，那么碰撞的几率就会小些，这样就能提高HashMap的性能。
参考某博客已找不到。

ConcurrentHashMap和Hashtable

ConcurrentHashMap和Hashtable都是线程安全的，HashTable是锁住整个hash表，而concurrentHashMap引入了分割，只锁当前需要用到的桶，不论它变得多么大，仅仅需要锁定map的某个部分，而其它的线程不需要等到迭代完成才能访问map，ConcurrentHashMap同步性能更好。当Hashtable的大小增加到一定的时候，性能会急剧下降，因为迭代时需要被锁定很长的时间，但是HashTable提供更强的线程安全性。

LinkedHashMap和TreeMap

LinkedHashMap保存了记录的插入顺序，在用Iterator遍历LinkedHashMap时，先得到的记录肯定是先插入的.也可以在构造时用带参数，按照应用次数排序。在遍历的时候会比HashMap慢，不过有种情况例外，当HashMap容量很大，实际数据较少时，遍历起来可能会比LinkedHashMap慢，因为LinkedHashMap的遍历速度只和实际数据有关，和容量无关，而HashMap的遍历速度和他的容量有关。
TreeMap实现SortMap接口，能够把它保存的记录根据键排序,默认是按键值的升序排序，也可以指定排序的比较器，当用Iterator 遍历TreeMap时，得到的记录是排过序的。
TreeMap取出来的是排序后的键值对。但如果您要按自然顺序或自定义顺序遍历键，那么TreeMap会更好。
LinkedHashMap 是HashMap的一个子类，如果需要输出的顺序和输入的相同,那么用LinkedHashMap可以实现,它还可以按读取顺序来排列，像连接池中可以应用。
参考：http://seaizon.iteye.com/blog/571101

SparseArra和ArrayMap

这个是android提供的api，为了是更好的节约内存。

SpareseArray

SparseArray比HashMap更省内存，在某些条件下性能更好，主要是因为它避免了对key的自动装箱（int转为Integer类型），它内部则是通过两个数组来进行数据存储的，一个存储key，另外一个存储value，为了优化性能，它内部对数据还采取了压缩的方式来表示稀疏数组的数据，从而节约内存空间，SparseArray在存储和读取数据时候，使用的是二分查找法。虽说SparseArray性能比较好，但是由于其添加、查找、删除数据都需要先进行一次二分查找，所以在数据量大的情况下性能并不明显。

ArrayMap

ArrayMap是一个<key,value>映射的数据结构，它设计上更多的是考虑内存的优化，内部是使用两个数组进行数据存储，一个数组记录key的hash值，另外一个数组记录Value值，它和SparseArray一样，也会对key使用二分法进行从小到大排序。

区别

1、如果key的类型已经确定为int类型，那么使用SparseArray，因为它避免了自动装箱的过程，如果key为long类型，它还提供了一个LongSparseArray来确保key为long类型时的使用。

2、如果key类型为其它的类型，则使用ArrayMap。
参考：http://blog.csdn.net/u010687392/article/details/47809295
.
.
.
.
.
.
.
.
.
.

面试官：你有使用过地图嘛？
我：哦map哈，hashmap，arraymap…..balabala
面试官：我说的是地图！
我：额地图，用过..
面试官：回去等消息。
我：哦。

文章借用了大量博客
转载请注明出处:http://www.jianshu.com/p/c4cae2dfe614

    原文作者：蜡笔小州
    原文地址: https://www.jianshu.com/p/c4cae2dfe614
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。