红黑树简介


红黑树是一种自平衡二叉查找树,也有着二叉搜索树的特性,保持着右边始终大于左边结点key的特性。前面提到过的AVL树,也是二叉搜索树的一种变形,红黑树没有达到AVL树的高度平衡,换句话说,它的高度,并没有AVL树那么高的要求,但他的应用却更加的广泛,实践中是相当高效的,他可以在O(log n)的时间内做查找、插入、删除操作。在C++ STL中,set、multiset、map、multimap等都应用到的红黑树的变体。

红黑树在平衡二叉搜索树的前提下,每个节点新增了 _color 这一成员变量,用来对各个节点做出标记。接下来,我们就来分析红黑树的插入算法。


一棵AVL树,需要满足以下几条要求。

1、每个结点,不是黑色就是红色

2、树的根结点必须是黑色

3、从根节点到叶子结点的任意一条路上,不允许存在两个连续的红色结点。

4、对于每个结点,从他开始到每个叶结点的简单路径上,黑色结点树相同。

这里多说一点,如果满足以上条件的话,从根节点开始,到叶子结点,最长的不会超过最长路径的两倍。(可以考虑最为极端的情况)


思路简析


和AVL树相同,要保证树的平衡性,必须要用到的是旋转算法。由于红黑树的情况比较多(尽管写起代码来不是很复杂),所以在这里旋转的过程中,我们不像AVL树一样,旋转的同时对平衡因子进行调整,红黑树的旋转算法,只是单纯调整当前结点与其parent 、grandparent 、uncle结点的相对位置,在旋转完成之后,我们再对结点颜色进行设置。

插入算法会在下面给出。


首先我们给出结点的定义。

enum Color
{
RED,
BLACK
};
template<typename K, typename V>
struct RBTreeNode
{
RBTreeNode<K, V>* _left;
RBTreeNode<K, V>* _right;
RBTreeNode<K, V>* _parent;
K _key;
V _value;
Color _color;
RBTreeNode(const K& key,const V& value)
:_left(NULL)
, _right(NULL)
, _parent(NULL)
, _key(key)
, _value(value)
, _color(RED)//默认构造红色结点
{}
};

_key为关键码(_key值是不允许重复的),_value为值,关于这里结点的构造函数,想多说一点,为什么结点颜色要默认给红色?很明显,一般情况下,黑色结点比红色结点多,但这里我们需要注意的是,我们针对的调整,其实大多数是红色。黑色结点下如果追加了红色结点,是不需要调整的,红色结点下如果多增加了一个黑色结点,是一定要进行调整的。


接下来开始插入结点。

1、处理特殊情况

当树为空树时,直接 new 一个结点给根,然后再改变颜色即可。


if(_root==NULL){_root=newNode(key,value);_root->_color=BLACK;returntrue;}


2、树不为空树时,我们首先需要找到我们待插入结点的位置。由于红黑树是二叉搜索树,通过循环,比较待插入结点的key值和当前结点的大小,找到待插入结点的位置。同时给该节点开辟空间,确定和parent节点的指向关系。

Node*cur=_root;Node*parent=NULL;while(cur!=NULL){if(key>cur->_key){parent=cur;cur=cur->_right;}elseif(key<cur->_key){parent=cur;cur=cur->_left;}else{returnfalse;}}cur=newNode(key,value);if(key>(parent->_key)){parent->_right=cur;cur->_parent=parent;}else{parent->_left=cur;cur->_parent=parent;}

当插入结点的parent结点为黑色结点时,不需要做任何调整,只需要和parent结点建立联系即可。

3、下面是需要我们特殊处理的几种情况。

我们给出四个Node结点 cur(待插入结点)、parent (cur的父亲结点)、grandparent(cur的祖父结点)、uncle(cur的叔叔结点)。

情况一、

parent为黑色,uncle存在且为红色

如图:

三角形结点只是表示可能存在的结点,可能为空。

当cur为新插入结点时,a-e结点均为空结点,由于不可以存在连续的红结点,因此,我们需要将parent结点和uncle结点变为黑色。细心的话可以发现,grandparent结点变为了红色,这是因为当grandparent不为根节点时,我们这棵子树的一条支路上的黑色结点就会多出一个,因此我们需要将grandparent结点变为红色,然后继续向上进行调整。在插入完成之后,我们只需要统一将根节点重新赋值为红色即可。

情况二、

parent为红色,uncle结点不存在,或uncle结点存在,但为黑色

如图:

看到第一张图的时候,不要怀疑这里画的有问题,这种情况是可能存在的,那就是说,cur是调整上来的,从我的上一种情况调整过来的,虽然看着grandparent的左右支路黑色结点数不相同,但我还有下面的三角形结点。

现在我这里就需要进行旋转,为什么这里不能直接颜色变换?因为我们抛过三角形结点,以grandparent结点为分界,最左支路和最后支路的,黑色结点数差一。旋转的图示如上图所示,以grandparent结点为轴,向右旋转。将grandparent结点作为parent结点的右子树进行旋转。同时需要的是,grandparent结点不一定是根节点,我们需要提前保留并判断grandparent->_parent结点,之后重新赋给parent->_parent。


情况三、

如果可以理解了第二种情况,第三种情况就容易理解了许多,和第二种情况一样,只不过cur是parent的右子树,我们需要先以parent为轴,向左旋转,得到上面这种情况之后,再以grandparent为轴向右旋转。如下图。


值得注意的一点,也是一开始写代码总是验证出错的一个问题,我们先以parent为轴左旋,之后看上图,cur此时变成了parent->_parent,如果此时按照情况二的处理方式,结点颜色一定会发生问题,因此,在上图中,我专门给出了一张图,将parent和cur指针交换,注意,只交换的是指针。


到这里,红黑树的基本情况以及处理完毕,再有的话就是当parent一开始就是在grandparent的右子树上的几种情况,和上面的旋转成镜像的关系。下面给出具体的代码:


boolInsert(constK&key,constV&value){//空树if(_root==NULL){_root=newNode(key,value);_root->_color=BLACK;returntrue;}//构建节点,并插入到对应位置Node*cur=_root;Node*parent=NULL;while(cur!=NULL){if(key>cur->_key){parent=cur;cur=cur->_right;}elseif(key<cur->_key){parent=cur;cur=cur->_left;}else{returnfalse;}}cur=newNode(key,value);if(key>(parent->_key)){parent->_right=cur;cur->_parent=parent;}else{parent->_left=cur;cur->_parent=parent;}//开始调整while(cur!=_root&&parent->_color==RED){//如果parent的color为RED,parent一定不是根节点,且祖父节点color为BLACKNode*grandparentnode=parent->_parent;//grandparentnode->_color=BLACK;if(parent==grandparentnode->_left){Node*unclenode=grandparentnode->_right;//叔叔节点uncleif(unclenode&&(unclenode->_color==RED))//uncle不为空,且uncle->color为RED{parent->_color=BLACK;unclenode->_color=BLACK;grandparentnode->_color=RED;cur=grandparentnode;parent=cur->_parent;}else//uncle为空,或uncle->color为BLACK{if(cur==parent->_right){RotateL(parent);std::swap(parent,cur);}RotateR(grandparentnode);parent->_color=BLACK;grandparentnode->_color=RED;break;}}else//parent==grandparent->_right{Node*unclenode=grandparentnode->_left;if(unclenode&&(unclenode->_color==RED))//uncle存在,且color为RED{parent->_color=BLACK;unclenode->_color=BLACK;grandparentnode->_color=RED;cur=grandparentnode;parent=cur->_parent;}else//uncle不存在,或uncle->color为黑色{if(cur==parent->_left){RotateR(parent);std::swap(cur,parent);}RotateL(grandparentnode);grandparentnode->_color=RED;parent->_color=BLACK;break;}}}//统一将根节点的颜色变为黑色_root->_color=BLACK;returntrue;}


红黑树结点的插入到这里就结束了,可以发现的是,我们其实一直在关注的是uncle结点,也就是cur的叔叔结点。这是红黑树插入思想里面的一个核心。

下面,就红黑树的基本特征,给出一段检验函数,判断红黑树是否满足要求。


boolIsBalance(){if(_root==NULL)returntrue;if(_root->_color==RED)returnfalse;intcount=0;Node*cur=_root;while(cur!=NULL){if(cur->_color==BLACK){count++;}cur=cur->_left;}intk=0;return_IsBalance(_root,count,k);}bool_IsBalance(Node*root,constint&count,intk){if(root==NULL)returntrue;if(root!=_root&&root->_color==RED){if(root->_parent->_color==RED){cout<<"连续红色结点"<<root->_key<<endl;returnfalse;}}if(root->_color==BLACK)k++;if(root->_left==NULL&&root->_right==NULL){if(k==count)returntrue;else{cout<<"黑色节点不相等"<<root->_key<<endl;returnfalse;}}return_IsBalance(root->_left,count,k)\&&_IsBalance(root->_right,count,k);}


红黑树的应用远比AVL树多,还是一开始我们说的,其实红黑树的高度相对来说要比AVL树高出一些的,但这其实并不影响太多。因为我们的时间复杂度都是在O(log n)附近,当n = 10亿时,log(n)也仅仅只有30。但是另一方面,由于红黑树要比AVL树的要求低,所以当我们插入一个结点时,相对来说调整的次数也就少了许多,这个是红黑树的优势。

------muhuizz整理