飞道的博客

HashMap学习篇resize()的扩容机制(JDk1.8)

547人阅读  评论(0)

HashMap学习篇resize()的扩容机制(JDk1.8)

先提一下HashMap的底层数据结构为数组+链表+红黑树。

1.数据初始化

        //将之前的数组的数据保存出来
        Node<K,V>[] oldTab = table;
        //获取之前保存数据的长度,防止未初始化报错
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        //获取之前扩容临界值(capacity*loadFactor)
        int oldThr = threshold;
        //初始化新的容器参数
        int newCap, newThr = 0;

2.生成新容器的容量和扩容临界点

  //判断旧容量有值时
        if (oldCap > 0) {
            //当他大于等于限制的最大容量时(这里可以理解成扩容失败,旧容器的容量值已经超过了默认最大容量,只能将容器的临界值修改为int最大21E)
            if (oldCap >= MAXIMUM_CAPACITY) {
                //扩容临界值默认使用Integer的最大值
                threshold = Integer.MAX_VALUE;
                //然后返回之前的数组结构,将扩容临界值设置为MAXIMUM_CAPACITY,”未进行扩容,只是将扩容临				界值扩大为Integer的最大值"
                return oldTab;
            }

            //判断 之前的长度扩大一倍是否会大于默认的最大长度 并且之前的长度是否大于默认长度16(这里的目的是为了判断容量扩大一倍后是否会超过默认值,如果没有说明新容器可以使用这个容量,并且要大于默认值16)
            //这里设置为@1
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)
                //则将之前的扩容临界值扩大一倍
                newThr = oldThr << 1; // double threshold

         //当旧容量长度为0,并且扩容临界值大于0时,将新容量设置为扩容临界值(当Map的数据被清除完时,会出现这种情况) 
         //需要注意的是这里变化了newCap的长度,但是没有变化临界值的长度,这里做一个备注为@2 
         //这里验证了hashMap扩容因子的使用,因为oldThr=(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY) 直接将新容器容量设置为oldThr相当于将旧容器扩充了0.75
        }else if (oldThr > 0)  newCap = oldThr;
        else {     
        //当旧容量长度为0,并且扩容临界值为0时,初始化长度为16 ,扩容临界点为(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY)
        //这个地方就是hashMap的初始化点          
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }

        //@1的说明当长度为1时,并没有初始化扩容临界值时并且对@2没有初始化变化临界值的长度的补充
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            //判断是否new容量是否大于最大值,临界值是否大于最大值,都满足是扩容为他自己否则为Integer最大类型
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }

3.实现数据复制

 //将刚刚判断好的临界值长度复制给现在对象的变化临界值,到这里就将当前对象的容器临界值设定完成
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        //使用新的长度值创建一个数组,并且传给成员变量
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        //这里设置完了,容器的容量值(引用传递)
        table = newTab;

        //这里是将旧数组的的数据遍历出来(未初始化的不会进入)
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                //把已经赋值之后的变量置位null,当然是为了好回收,释放内存
                    oldTab[j] = null;
                    //如果下标处的节点没有下一个元素,说明可以直接保存
                    if (e.next == null)
                     //把该变量的值存入newCap中,数组的坐标为 位运算结果  e.hash & (newCap - 1) 
                     //详情可以看下面解析
                        newTab[e.hash & (newCap - 1)] = e;
                    //当next下面的直属数据大于1时,(JDk1.8使用的数组链表加红黑树,这里就是用的红黑树当						下面有多个时),本文不作详解  
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                     //当只有一个时使用链表就是 5接2时
                        else { 
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                         //判断0或者1 当e.hash超过了oldCap为!=0  没有超过时为0  详情也可以看下文
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

这里解析一下位运算符&

首先说一下e.hash & (newCap - 1)

当e.hash=5 newCap=16 你会发现e.hash & (newCap - 1) 的值为5,

当e.hash=21 newCap=16 你会发现值同样是5

如果相同的判断都是这个值,那么就会实现链表的挂载或者红黑树,当扩容(成31时)之后你会发现保存的数据的Hash值位原值,一定程度上防止了保存数据的超出索引范围的现象

然后说一下e.hash & oldCap使用链表只挂5和21时,本人理解当挂多个时会自动生成红黑树所以不会走这里

当oldCap(初始容量为)16时,由上图可知,之前5和21都是挂载在索引为5的位置,当扩容为31后

将分别执行下面的代码,loHead为5的数据,hiHead为21的数据,并且分别清楚的next的数据

if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }

就会出现,由下图可知就将索引挂载的数据进行了分开


转载:https://blog.csdn.net/Violet_201903027/article/details/106409492
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场