HashMap是什么
HashMap是Java常用的用来储存键值对的数据结构,它是线程不安全的,可以储存null键值,这些大家经常用,也都知道,接下来根据源码分析一下HashMap的实现。
一、实现原理
HashMap采用数组散列+链表的方式来储存键值对,键值对的对象实现如下:
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;
……
}
通过一个Entry的数组table就实现了多个对象的保存,使用哈希值和键值解决了在插入和查找时的冲突。
一、put方法,写入键值对
public V put(K key, V value){
//如果 key 为 null,调用 putForNullKey 方法写入null键的值
if (key == null){
return putForNullKey(value);
}
//根据 key 的 keyCode 计算 Hash 值
int hash = hash(key.hashCode());
//查找hash值在table中的索引
int i = indexFor(hash, table.length);
// 如果 i 索引处的 Entry 不为 null,通过循环不断遍历链表查找是否在链表中有相同key的Entry
for (Entry<K,V> e = tablei; e != null; e = e.next) {
Object k;
//找到与插入的值的key和hash相同的Entry
if (e.hash == hash && ((k = e.key) == key|| key.equals(k)){
//key值相同时直接替换value值,跳出函数
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
// 如果 i 索引处的 Entry 为 null 或者key的hash值相同而key不同 ,则需要新增Entry
modCount++;
// 将 key、value 添加到 i 索引处
addEntry(hash, key, value, i);
return null;
}
在put方法中解决hash碰撞的方式很清楚,即当两个entry的hash值相同时,需要对key值是否相同进行判断,只有key和hash都相同,才能进行修改,否则认为不是同一个entry。
addEntry的实现
代码:
void addEntry(int hash, K key, V value, int bucketIndex)
{
// 获取指定 bucketIndex 索引处的 Entry
Entry<K,V> e = tablebucketIndex;
tablebucketIndex = new Entry<K,V>(hash, key, value, e);
// 如果 Map 中的 key-value 对的数量超过了极限
if (size++ >= threshold)
resize(2 table.length);
}
在创建新Entry时如果table的bucketIndex处有元素的话,创建时需要将entry的next设置为原先存储的元素。
二、get方法
public V get(Object key)
{
// 如果 key 是 null,调用 getForNullKey 取出null的 value
if (key == null)
return getForNullKey();
// 根据该 key 的 hashCode 值计算它的 hash 码
int hash = hash(key.hashCode());
// 直接取出 table 数组中指定索引处的值,
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
// 搜索该 Entry 链的下一个对象
e = e.next)
{
Object k;
// 如果该 Entry 的 key和hash 与被搜索 key 相同
if (e.hash == hash && ((k = e.key) == key
|| key.equals(k)))
return e.value;
}
return null;
}
实现的原理与get相同。
三、一些需要注意的点
- 由HashMap的原理可知,主要的储存依赖hash值的计算,因此选用String,Integer这些类做为键会提高HashMap的效率,因为String等对象一旦放入Map中就不会发生变化,因此其hash值也不会发生改变,获取对象的速度将大大提高。
- 如果HashMap的大小超过了负载因子定义的容量,HashMap将会创建一个原来两倍的bucket数组,将原来的对象放入新的数组中,扩大hashMap的容量。(负载因子初始0.75)
- 在多个线程同时发现HashMap的大小过小时,都会尝试调整大小,会造成条件竞争。
- 在Java 8中,如果hash相同的key的数量大于8,会使用平衡树代替链表。
HashMap为什么线程不安全
- 如上,在两个线程同时尝试扩容HashMap时,可能将一个链表形成环形的链表,所有的next都不为空,进入死循环
- 在两个线程同时进行put时可能造成一个线程数据的丢失