HashMap进行put操作会引起死循环?

HashMap进行put操作会引起死循环?

最近在磕《java并发编程艺术》,在看到第六章的时候出现了下面这段我不是很理解的东西,如下

《java并发编程艺术》截取

为什么要使用ConcurrentHashMap

在并发编程中使用HashMap可能导致程序死循环。而使用线程安全的HashTable效率又非常低下,基于以上两个原因,便有了ConcurrentHashMap的登场机会。

1. 线程不安全的HashMap

在多线程环境下,使用HashMap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap。例如,执行以下代码会引起死循环。

final HashMap<String, String> map = new HashMap<> (2);
        Thread t = new Thread (() -> { 
            for (int i = 0; i < 10000; i++) { 
                new Thread (() -> map.put (UUID.randomUUID ().toString (), ""), "ftf" + i).start ();
            }
        }, "ftf");
        t.start();
        t.join();

HashMap在并发执行put操作时会引起死循环,是因为多线程会导致HashMap的Entry链表形成环形数据结构,一旦形成环形数据结构,Entry的next节点永远不为空,就会产生死循环获取Entry。

不知道是不是由于篇幅原因,我觉得作者并没有把为什么会引起死循环说明白,我只好自己再去看源码了

JDK1.8 HashMap源码

HashMap中关于put操作的源码如下
public V put(K key, V value) { 
        return putVal(hash(key), key, value, false, true);
}
 final V putVal (int hash, K key, V value, boolean onlyIfAbsent,
                    boolean evict) { 
        Node<K, V>[] tab;
        Node<K, V> p;
        int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize ()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode (hash, key, value, null);
        else { 
            Node<K, V> e;
            K k;
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals (k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K, V>) p).putTreeVal (this, tab, hash, key, value);
            else { 
                for (int binCount = 0; ; ++ binCount) { 
                    //e是p的下一个节点
                    if ((e = p.next) == null) { 
                        //插入链表的尾部
                        p.next = newNode (hash, key, value, null);
                        //如果插入后链表长度大于8则转化为红黑树
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin (tab, hash);
                        break;
                    }
                    //如果key在链表中已经存在,则退出循环
                    if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals (k))))
                        break;
                    p = e;
                }
                //如果key在链表中已经存在,则修改其原先的key值,并且返回老的值
                if (e != null) {  // existing mapping for key
                    V oldValue = e.value;
                    if (! onlyIfAbsent || oldValue == null)
                        e.value = value;
                    afterNodeAccess (e);
                    return oldValue;
                }
            }
            ++ modCount;
            if (++ size > threshold)
                resize ();
            afterNodeInsertion (evict);
            return null;
}

当你看到这的时候是不是还是不懂为什么会有死循环?是的,我看到这也没懂,只能去网上看看大佬们怎么说

百度上关于这个问题的第一篇文章就是这个:https://www.cnblogs.com/wfq9330/p/9023892.html

这源码跟我看的JDK1.8的截然不同,目测应该是JDK1.8以下的

结论

  1. JDK1.8之前,为了提高rehash的速度,冲突链表是使用头插法,因为头插法是操作速度最快的,找到数组位置就直接找到插入位置了,头插法在多线程下回引起死循环
  2. JDK1.8之后开始加入红黑树,当链表长度大于8时链表就会转换成红黑树,这样就大大提高了在冲突链表查找的速度,同时因为链表的长度不可能大于8,链表在rehash的消耗就小很多,所以JDK1.8使用尾插法也避免了死循环问题
    原文作者:不会程序的JAVA程序媛
    原文地址: https://blog.csdn.net/weixin_44019182/article/details/107103854
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞