HashMap 原理详解

2023年8月27日 325次阅读来源: keisu

HashMap是什么

HashMap是Java常用的用来储存键值对的数据结构，它是线程不安全的，可以储存null键值，这些大家经常用，也都知道，接下来根据源码分析一下HashMap的实现。

一、实现原理

HashMap采用数组散列+链表的方式来储存键值对，键值对的对象实现如下：

   static class Entry<K,V> implements Map.Entry<K,V> {  
      final K key;  
     V value;  
      Entry<K,V> next;  
      final int hash;  
    ……  
}

通过一个Entry的数组table就实现了多个对象的保存，使用哈希值和键值解决了在插入和查找时的冲突。

一、put方法，写入键值对

public V put(K key, V value){

 //如果 key 为 null，调用 putForNullKey 方法写入null键的值
 if (key == null){
    return putForNullKey(value);
}
 //根据 key 的 keyCode 计算 Hash 值 
int hash = hash(key.hashCode());
//查找hash值在table中的索引
int i = indexFor(hash, table.length);
// 如果 i 索引处的 Entry 不为 null，通过循环不断遍历链表查找是否在链表中有相同key的Entry
for (Entry<K,V> e = tablei; e != null; e = e.next) {
    Object k;
    //找到与插入的值的key和hash相同的Entry
    if (e.hash == hash && ((k = e.key) == key|| key.equals(k)){ 
        //key值相同时直接替换value值，跳出函数
    V oldValue = e.value;
      e.value = value;     e.recordAccess(this);   return oldValue;         }     }
// 如果 i 索引处的 Entry 为 null 或者key的hash值相同而key不同 ，则需要新增Entry
modCount++; 
// 将 key、value 添加到 i 索引处
addEntry(hash, key, value, i); 
return null; 
}

在put方法中解决hash碰撞的方式很清楚，即当两个entry的hash值相同时，需要对key值是否相同进行判断，只有key和hash都相同，才能进行修改，否则认为不是同一个entry。

addEntry的实现

代码：

void addEntry(int hash, K key, V value, int bucketIndex)  {    // 获取指定 bucketIndex 索引处的 Entry
Entry<K,V> e = tablebucketIndex;   
tablebucketIndex = new Entry<K,V>(hash, key, value, e);       // 如果 Map 中的 key-value 对的数量超过了极限 
if (size++ >= threshold)  
     resize(2  table.length);
 }

在创建新Entry时如果table的bucketIndex处有元素的话，创建时需要将entry的next设置为原先存储的元素。

二、get方法

public V get(Object key) { // 如果 key 是 null，调用 getForNullKey 取出null的 value if (key == null) return getForNullKey(); // 根据该 key 的 hashCode 值计算它的 hash 码 int hash = hash(key.hashCode()); // 直接取出 table 数组中指定索引处的值， for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; // 搜索该 Entry 链的下一个对象 e = e.next) { Object k; // 如果该 Entry 的 key和hash 与被搜索 key 相同 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) return e.value; } return null; }
实现的原理与get相同。

三、一些需要注意的点

由HashMap的原理可知，主要的储存依赖hash值的计算，因此选用String，Integer这些类做为键会提高HashMap的效率，因为String等对象一旦放入Map中就不会发生变化，因此其hash值也不会发生改变，获取对象的速度将大大提高。
如果HashMap的大小超过了负载因子定义的容量，HashMap将会创建一个原来两倍的bucket数组，将原来的对象放入新的数组中，扩大hashMap的容量。（负载因子初始0.75）
在多个线程同时发现HashMap的大小过小时，都会尝试调整大小，会造成条件竞争。
在Java 8中，如果hash相同的key的数量大于8，会使用平衡树代替链表。

HashMap为什么线程不安全

如上，在两个线程同时尝试扩容HashMap时，可能将一个链表形成环形的链表，所有的next都不为空，进入死循环
在两个线程同时进行put时可能造成一个线程数据的丢失

    原文作者：keisu
    原文地址: https://blog.csdn.net/h1130189083/article/details/78303865
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。