HashMap 原理详解

HashMap是什么

HashMap是Java常用的用来储存键值对的数据结构,它是线程不安全的,可以储存null键值,这些大家经常用,也都知道,接下来根据源码分析一下HashMap的实现。

一、实现原理

HashMap采用数组散列+链表的方式来储存键值对,键值对的对象实现如下:

   static class Entry<K,V> implements Map.Entry<K,V> {  
      final K key;  
     V value;  
      Entry<K,V> next;  
      final int hash;  
    ……  
}  

通过一个Entry的数组table就实现了多个对象的保存,使用哈希值和键值解决了在插入和查找时的冲突。

一、put方法,写入键值对

public V put(K key, V value){

 //如果 key 为 null,调用 putForNullKey 方法写入null键的值
 if (key == null){
    return putForNullKey(value);
}

//根据 key 的 keyCode 计算 Hash 值 
int hash = hash(key.hashCode());
//查找hash值在table中的索引
int i = indexFor(hash, table.length);
// 如果 i 索引处的 Entry 不为 null,通过循环不断遍历链表查找是否在链表中有相同key的Entry
for (Entry<K,V> e = tablei; e != null; e = e.next) {
    Object k;
    //找到与插入的值的key和hash相同的Entry
    if (e.hash == hash && ((k = e.key) == key|| key.equals(k)){

        //key值相同时直接替换value值,跳出函数
    V oldValue = e.value;
      e.value = value;
    e.recordAccess(this);
  return oldValue;
        }
    }
// 如果 i 索引处的 Entry 为 null 或者key的hash值相同而key不同 ,则需要新增Entry
modCount++; 
// 将 key、value 添加到 i 索引处
addEntry(hash, key, value, i); 
return null; 
} 

在put方法中解决hash碰撞的方式很清楚,即当两个entry的hash值相同时,需要对key值是否相同进行判断,只有key和hash都相同,才能进行修改,否则认为不是同一个entry。

addEntry的实现

代码:

void addEntry(int hash, K key, V value, int bucketIndex) 
{ 
  // 获取指定 bucketIndex 索引处的 Entry
Entry<K,V> e = tablebucketIndex;  

tablebucketIndex = new Entry<K,V>(hash, key, value, e); 
     // 如果 Map 中的 key-value 对的数量超过了极限if (size++ >= threshold) 

     resize(2  table.length);

}  

在创建新Entry时如果table的bucketIndex处有元素的话,创建时需要将entry的next设置为原先存储的元素。

二、get方法

public V get(Object key)
{
// 如果 key 是 null,调用 getForNullKey 取出null的 value
if (key == null)
return getForNullKey();
// 根据该 key 的 hashCode 值计算它的 hash 码
int hash = hash(key.hashCode());
// 直接取出 table 数组中指定索引处的值,
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
// 搜索该 Entry 链的下一个对象
e = e.next)
{
Object k;
// 如果该 Entry 的 key和hash 与被搜索 key 相同
if (e.hash == hash && ((k = e.key) == key
|| key.equals(k)))
return e.value;
}
return null;
}

实现的原理与get相同。

三、一些需要注意的点

  • 由HashMap的原理可知,主要的储存依赖hash值的计算,因此选用String,Integer这些类做为键会提高HashMap的效率,因为String等对象一旦放入Map中就不会发生变化,因此其hash值也不会发生改变,获取对象的速度将大大提高。
  • 如果HashMap的大小超过了负载因子定义的容量,HashMap将会创建一个原来两倍的bucket数组,将原来的对象放入新的数组中,扩大hashMap的容量。(负载因子初始0.75)
  • 在多个线程同时发现HashMap的大小过小时,都会尝试调整大小,会造成条件竞争。
  • 在Java 8中,如果hash相同的key的数量大于8,会使用平衡树代替链表。

HashMap为什么线程不安全

  • 如上,在两个线程同时尝试扩容HashMap时,可能将一个链表形成环形的链表,所有的next都不为空,进入死循环
  • 在两个线程同时进行put时可能造成一个线程数据的丢失
    原文作者:keisu
    原文地址: https://blog.csdn.net/h1130189083/article/details/78303865
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞