1.红黑树简介
红黑树(Red Black Tree)是一种含有红黑结点并能自平衡二叉查找树,典型的用途是实现 map。
它必须满足下面规则:
规则1:每个结点要么是黑色,要么是红色。
规则2:根结点是黑色。
规则3:每个叶子结点(NIL)是黑色。
规则4:每个红色结点的两个子结点都是黑色。
规则5:任意一结点到每个叶子结点的路径都包含相同数量的黑结点。
记住上面的规则也不难,我们会发现黑色结点非常特殊,规则1即“非红即黑”,规则2和3即“首尾全黑”,规则4即“红子双黑”,规则5即“路径等黑”。
这些规则强制约束红黑树,使得红黑树具有如下关键特性:
(1)从根到叶子的最长路径不大于最短路径的两倍,所以红黑树大致上是平衡的。
从规则5中,我们知道从根结点到每个叶子结点的黑色结点数量是一样的,那么纯由黑色结点组成的路径就是最短路径;
规则4表明路径上不能有两个连续的红色结点,除了根结点和叶子结点,当红色结点和黑色结点交替出现数量相同时,即位最长路径。
(2)加入到红黑树中的结点为红色结点。
从规则4中知道,当前红黑树中从根结点到每个叶子结点的黑色结点数量是一样的,此时假如新的黑色结点的话,必然破坏规则,但加入红色结点却不一定,除非其父结点就是红色结点,因此加入红色结点,破坏规则的可能性小一些。
下面是一个红黑树示例:
2.红黑树的自平衡
再了解红黑树的基本性质后,红黑树是如何实现自平衡的呢?红黑树总是通过旋转和变色达到自平衡。
左旋: 以某个结点作为旋转结点,拎起其右子结点变为旋转结点的父结点,右子结点的左子结点变为旋转结点的右子结点。
右旋:
以某个结点作为旋转结点,拎起其左子结点变为旋转结点的父结点,左子结点的右子结点变为旋转结点的左子结点。
变色: 结点的颜色由红变黑或由黑变红。
上面所说的旋转结点即上图中的 P 结点。
我们先忽略颜色,可以看到旋转操作不会影响旋转结点的父结点,父结点及以上的结构还是保持不变,所以旋转操作是局部的。
3.红黑树的查找
因为红黑树是一颗二叉平衡树,并且查找不会破坏树的平衡,所以查找跟二叉平衡树的查找无异:
1 从根结点开始查找,把根结点设置为当前结点;
2 若当前结点为空,返回 null;
3 若当前结点不为空,用当前结点的 key 跟查找 key 作比较;
4 若当前结点 key 等于查找 key,那么该 key 就是查找目标,返回当前结点;
5 若当前结点 key 大于查找key,把当前结点的左子结点设置为当前结点,重复步骤 2;
6 若当前结点key小于查找key,把当前结点的右子结点设置为当前结点,重复步骤 2;
4.红黑树的插入
插入操作包括两部分工作:一查找插入的位置;二插入后自平衡。查找插入的父结点很简单,跟查找操作区别不大,这里便不再赘述,重点介绍插入结点后的自平衡。
当我们插入值为 66 的结点时,红黑树变成了这样。
很明显,这个时候结构依然遵循着上述 5 大规则,无需启动自动平衡机制调整结点平衡状态。
如果再向里面插入值为 51 的结点呢,这个时候红黑树变成了这样。
很明显现在的结构不遵循规则 4 了,这个时候就需要启动自动平衡机制调整结点平衡状态。
变色:
我们可以通过变色的方式,使结构满足红黑树的规则。
1 首先解决结构不遵循规则 4 这一点,红色结点的子结点必须为黑色,需将结点 49 改为黑色;
2 此时我们发现又违反了规则 5,结点 49 所在路径多了个黑色结点,那么我们将结点 45 改为红色结点;
3 发现又违反了规则 4,那么我们将结点 56 和结点 43 改为黑色结点;
4 但是我们发现此时又违反了规则 5(60-56-XX 路径的黑色结点比60-68-XX的黑色结点多),因此我们需要调整结点 68 为黑色;
5 完成。
最终调整完成后的树为:
但并不是什么时候都那么幸运,可以直接通过变色就达成目的,大多数时候还需要通过旋转来解决。
旋转:
如在下面这棵树的基础上,加入结点 65。
插入结点65后进行以下自平衡步骤。
这个时候,你会发现对于结点64无论是红色结点还是黑色结点,都会违反规则5,路径中的黑色结点始终无法达成一致,这个时候仅通过【变色】已经无法达成目的。我们需要通过旋转操作,当然【旋转】操作一般还需要搭配【变色】操作。
无法通过变色而进行旋转的场景分为以下四种:
(1)左左结点旋转。
这种情况下,父结点和插入的结点都是左结点,如下图这种情况下,我们要插入结点 65。
按照规则,步骤如下:
(2)左右结点旋转。
规则如下:先父结点【左旋】,然后祖父结点【右旋】,搭配【变色】。
按照规则,步骤如下:
(3)右左结点旋转。
这种情况下,父结点是右结点,插入的结点是左结点,如下图(旋转原始图2)这种情况,我们要插入结点68。
规则如下:先父结点【右旋】,然后祖父结点【左旋】,搭配【变色】。
按照规则,步骤如下:
(4)右右结点旋转。
这种情况下,父结点和插入的结点都是右结点,在旋转原始图2中,我们要插入结点70
规则如下:以祖父结点【左旋】,搭配【变色】。
按照规则,步骤如下:
红黑树插入总结:
(1)无需调整。
当父结点为黑色时插入子结点。
(2)【变色】即可实现平衡。
1 空树插入根结点,将根结点红色变为黑色;
2 父结点和叔父结点都为红色。
(3)【旋转+变色】才可实现平衡。
1 父结点为红色左结点,叔父结点为黑色,插入左子结点,那么通过【左左结点旋转】;
2 父结点为红色左结点,叔父结点为黑色,插入右子结点,那么通过【左右结点旋转】;
3 父结点为红色右结点,叔父结点为黑色,插入左子结点,那么通过【右左结点旋转】;
4 父结点为红色右结点,叔父结点为黑色,插入右子结点,那么通过【右右结点旋转】。
4.红黑树的删除
相比较于红黑树的结点插入,删除结点更为复杂,我们从子结点是否为null和红色为思考维度来讨论。
(1)子结点至少有一个为 null。
当待删除的结点的子结点至少有一个为null结点时,删除了该结点后,将其有值的结点取代当前结点即可,若都为null,则将当前结点设置为null,当然如果违反规则了,则按需调整,如【变色】以及【旋转】。
(2)子结点都是非null结点。
这种情况下,
第一步:找到该结点的前驱或者后继
前驱:左子树中值最大的结点(可得出其最多只有一个非null子结点,可能都为null);
后继:右子树中值最小的结点(可得出其最多只有一个非null子结点,可能都为null);
前驱和后继都是值最接近该结点值的结点,类似于该结点.prev = 前驱,该结点.next = 后继。
第二步:将前驱或者后继的值复制到该结点中,然后删掉前驱或者后继。
如果删除的是左结点,则将前驱的值复制到该结点中,然后删除前驱;如果删除的是右结点,则将后继的值复制到该结点中,然后删除后继;
这相当于是一种“取巧”的方法,我们删除结点的目的是使该结点的值在红黑树上不存在,因此专注于该目的,我们并不关注删除结点时是否真是我们想删除的那个结点,同时我们也不需考虑树结构的变化,因为树的结构本身就会因为自动平衡机制而经常进行调整。
前面我们已经说了,我们要删除的实际上是前驱或者后继,因此我们就以前驱为主线来讲解,后继的学习可参考前驱,包括几种情况。
(a)前驱为黑色结点,并且有一个非null子结点。
分析:
因为要删除的是左结点64,找到该结点的前驱63;然后用前驱的值63替换待删除结点的值64,此时两个结点(待删除结点和前驱)的值都为63;删除前驱63,此时成为上图过程中间环节,但我们发现其不符合红黑树规则4,因此需要进行自动平衡调整,这里直接通过【变色】即可完成。
(b)前驱为黑色结点,同时子结点都为null。
分析:
因为要删除的是左结点 64,找到该结点的前驱 63;然后用前驱的值63替换待删除结点的值64,此时两个结点(待删除结点和前驱)的值都为63;删除前驱63,此时成为上图过程中间环节,但我们发现其不符合红黑树规则5,因此需要进行自动平衡调整,这里直接通过【变色】即可完成。
(c)前驱为红色结点,同时子结点都为null。
分析:
因为要删除的是左结点64,找到该结点的前驱63;然后用前驱的值63替换待删除结点的值64,此时两个结点(待删除结点和前驱)的值都为63;删除前驱63,树的结构并没有打破规则。
(3)红黑树删除总结。
红黑树删除的情况比较多,但也就存在以下情况:
删除的是根结点,则直接将根结点置为null;
待删除结点的左右子结点都为null,删除时将该结点置为null;
待删除结点的左右子结点有一个有值,则用有值的结点替换该结点即可;
待删除结点的左右子结点都不为null,则找前驱或者后继,将前驱或者后继的值复制到该结点中,然后删除前驱或者后继;
结点删除后可能会造成红黑树的不平衡,这时我们需通过【变色】+【旋转】的方式来调整,使之平衡,上面也给出了例子,建议大家多多练习,而不必背下来。
5.小结
本文主要介绍了红黑树的相关原理,包括红黑树的性质、查找、插入和删除,以及变色和旋转来达到树的自平衡。针对红黑树的5大规则,对红黑树的插入和删除操作,使用了大量的图形来加以说明。红黑树的使用非常广泛,如 C++ map 和 Java TreeMap、TreeSet 都是基于红黑树实现的,而 JDK8 中 HashMap 当链表长度大于 8 时也会转化为红黑树。红黑树比较复杂,本人也是还在学习过程中,如果有不对的地方请批评指正,同进步谢谢。
参考文献
[1] 简书.30张图带你彻底理解红黑树
[2] 博客园.关于红黑树(R-B tree)原理,看这篇如何
转载:https://blog.csdn.net/K346K346/article/details/107907025