Java ArrayList和HashMap扩容

思考
1、假如我们要创建已知长度的集合List(ArrayList)or Map(HashMap),如何创建?
通常
Map<Integer,Object> map = new HashMap<>(1);
List<String> list = new ArrayList<>(1);
固定长度,减少扩容次数
2、HashMap构造函数,除了初始化容量,还有其它参数吗?
还有个扩容因子loadFactor

印象中以为ArrayList和HashMap都有loadFactor,其实只有HashMap中有,ArrayList中没有。那么他们是如何实现扩容的呢?

ArrayList

/**
 * Appends the specified element to the end of this list.
 *
 * @param e element to be appended to this list
 * @return <tt>true</tt> (as specified by {@link Collection#add})
 */
public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

add()方法调用ensureCapacityInternal()方法。size表示元素数量,同list.size()方法

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    
    ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    // overflow-conscious code
    // 是否扩容判断
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

最小容量 (minCapacity) = size + 1;
当最小容量大于存储数组长度时,触发扩容,so…数组存储满时再添加新元素触发扩容。

/**
 * Increases the capacity to ensure that it can hold at least the
 * number of elements specified by the minimum capacity argument.
 *
 * @param minCapacity the desired minimum capacity
 */
private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);//此处
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

新容量(newCapacity) = 原容量 + 原容量位运算左移1位
最后通过Arrays.copyOf方法完成复制扩容。
注:左移1位 = n/2 取整

总结:
1、扩容触发点,数组存储已满,再add()时触发
2、扩容量,大概是原来的一半,准确是 newCapacity = oldCapacity + (oldCapacity >> 1);

HashMap
错误理解,原印象扩容因子loadFactor,默认0.75,即假如当前容量是100时,元素数量达到75,即75%时触发扩容。扩容量是当前容量值最近2n次方。

正解:
hashMap.put(key,value)会调用resize()方法

/**
 * Implements Map.put and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to put
 * @param onlyIfAbsent if true, don't change existing value
 * @param evict if false, the table is in creation mode.
 * @return previous value, or null if none
 */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;//此处1
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        //此处省略...
    }
    ++modCount;
    if (++size > threshold)
        resize();//此处2
    afterNodeInsertion(evict);
    return null;
}

此处1:第一次put时初始化table,调用resize()方法
此处2:新增后元素数量大于threshold,调用resize()方法
threshold阈值,注释【The next size value at which to resize (capacity * load factor)】

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        //此处1
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        //此处2
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    //此处3
    else if (oldThr > 0) //initial capacity was placed in threshold
        newCap = oldThr;
    //此处4
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    //此处5
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    //中间省略...
}

新阈值和新容量计算稍复杂,仔细梳理每行代码,抛开容量最大值、超出int范围问题,代码解读
新阀值:
1、当原容量大于0 && 原容量右移1位后小于最大容量 && 原容量大于初始容量,新阈值等于原阈值右移1位,即新阈值 = 原阈值2
2、当原容量等于0 && 原阈值等于0,新阀值等于默认扩容因子(0.75)
默认初始化容量(16)
3、前两种都不满足时,新容量 * 扩容因子
新容量:
4、当原容量大于0,新容量等于原右移1位
5、当原容量等于0 && 原阈值大于0,新容量等于原阈值
6、当原容量等于0 && 原阈值等于0,新容量等于默认初始容量

场景:
1、new HashMap(),第一次put,原容量等于0,原阈值等于0,执行代码”此处4″
2、new HashMap(),第n(1< n <int最大值)次put时,原容量大于0,原阈值大于默认初始容量,执行代码”此处2″
3、new HashMap(initialCapacity),第一次put时,因设置初始容量,阀值会在构造函数初始化,阀值等于 比initialCapacity大于等于的最近2的n次方(假如设置初始容量3,比3大的最近的2的n次方是4),所以原容量等于0,原阈值大于0,执行代码”此处3″,新阈值等于0 , 代码”此处5″也会执行。
4、new HashMap(initialCapacity),如果table已有元素,那么原容量大于0,当原容量小于默认容量时,只会执行代码”此处5″
5、new HashMap(initialCapacity),如果table已有元素,同上,原容量大于0,当原容量大于等于默认容量时,只会执行代码”此处2″

总结
1、只原容量等于0或原容量小于默认初始容量时,新阀值 = 新容量 * 扩容因子
2、非1情况,新阀值 = 新容量 = 原容量*2

Redis列表和数组扩容机制类似,后续补充。。。

如有错误欢迎指正,谢谢~

下篇准备写ThreadPool。

    原文作者:耗子2015
    原文地址: https://www.jianshu.com/p/21ef5957d6e9
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞