【算法与数据结构】—— 并查集_小言_互联网的博客

【算法与数据结构】—— 并查集

2020-12-24 13:39 773人阅读评论(0)

并查集

概念：
并查集由一个整型数组pre[ ]和两个函数find( )、join( )构成
数组pre[ ]记录了每个点的前导点是什么，函数find(x)用于查找，函数join(x,y)用于合并

作用：
并查集的主要作用是求连通分支数（如果一个图中所有点都存在可达关系（直接或间接相连），则此图的连通分支数为1；如果此图有两大子图各自全部可达，则此图的连通分支数为2……）

问题引入
话说江湖上散落着各式各样的大侠，他们有的行侠仗义，有的打抱不平，有的为推翻当政者统治，有的则是为了做真实的自己。但是人与人之间，总有着不同的信仰和不同的目的，在碰到和自己不是一路人的，就免不了要打一架。但大侠们有一个优点就是讲义气，绝对不打自己的朋友。而且他们信奉“朋友的朋友就是我的朋友”，只要是能通过朋友关系串联起来的，不管拐了多少个弯，都认为是自己人。这样一来，江湖上就形成了一个个的门派，通过门派内两两之间的朋友关系也就串联起来。而不在同一个门派的人，无论如何都无法通过朋友关系连起来，于是就可以放心往死里打。于是乎，出现了“明教”、“峨嵋派”、“少林寺”、“华山派”、“全真教”……

但是两个原本互不相识的人，如何判断是否属于一个门派呢？我们可以在每个门派内推举出一个比较有名望的人作为该门派的代表人物，这样，每当两个人在狭路相逢准备恶斗时，就先报一下自己所在门派的教主（或者称之为掌门）的名字，如果相同则表示是一个门派的，那就不必自相残杀了。于是教主下令，重新编制。门派内所有人实行分等级制度，形成树状结构，教主就是根节点，下面分别是二级队员、三级队员。每个人只要记住自己的上级是谁就行了。遇到判断敌友的时候，只要一层层向上问，直到最高层，就可以在短时间内确定教主是谁了。由于我们关心的只是两个人之间是否连通，至于他们是如何连通的，以及每个圈子内部的结构是怎样的，甚至教主是谁，并不重要。所以我们可以放任教主随意编制，只要不搞错敌友关系就好了。

冷雨夜，胡青牛在骊山下快马加鞭送信，发现一头戴竹笠之人立于前方，正系拔剑之时，只听那厮大喝一声：“在下乃明教右使范遥，敢问阁下大名？”。胡青牛一听，抱拳回礼道：“在下胡青牛，乃杨左使近卫”。范遥反问道：“敢问兄台教主系谁，若非我们本教中人，在这明教之地肆意走动那可是死罪！”。青牛吓得赶紧打了个电话问他的上级杨左使：“杨左使，我们教主叫什么名字呀？”，杨逍回答道：“咋们教主是张无忌啊！”，青牛赶紧回答范遥道：“我的教主是张无忌！”。范遥听后，收下了已经蓄好了的内力，并抱拳放行

上面的情境中，胡青牛同志通过向上级查询得到了教主的名字，当然范遥也是
而在并查集中，用于查询各自的教主名字的函数就是我们的find函数
1. find函数的定义与实现
find函数的作用是用于查找某个人所在门派的教主，换言之就是用于对某个给定的点x，返回其所属集合的代表。这需要我们首先定义一个数组：int pre[1000];
这个数组记录了每个大侠的上级是谁。大侠们从1或者0开始编号（依据题意而定），pre[15]=3就表示15号大侠的上级是3号大侠。如果一个人的上级就是他自己，那说明他就是教主了，查找到此为止。也有孤家寡人自成一派的，比如欧阳锋，那么他的上级就是他自己
每个人都只认自己的上级。比如胡青牛同学只知道自己的上级是杨左使。张无忌是谁？不认识！要想知道自己的教主是谁，只能一级级查上去。因此你可以视find这个函数就是找教主用的，意义再清楚不过了。下面给出这个函数的具体实现：

int find(int x)					//查找x的教主
{
   
	while(pre[x] != x)			//如果x的上级不是x自己（也就是说找到的大侠不是教主）
		x = pre[x];				//x接着找他的上级，直到找到教主为止
	return x;					//教主驾到~~~
}

现在有个新问题，怎么对给出的人员进行编制呢？答案是，通过join函数
2. join函数的定义与实现
我们知道，在两个点之间连一条线，原先它们所在的两个板块间的所有点就都可以互通了。这在图上很好办，画条线就行了，但在并查集里要怎么实现呢？还是举江湖的例子（如上图所示），虚竹小和尚与周芷若MM是我非常喜欢的两个人物，他们的终极boss分别是玄慈方丈和灭绝师太，那明显就是两个阵营了。我不希望他们互相打架，就对他俩说：“你们两位拉拉勾，做好朋友吧。”他们看在我的面子上，同意了。这一同意可非同小可，整个少林和峨眉派的人就不能打架了。这么重大的变化，可如何实现呀，要改动多少地方？其实非常简单，我对玄慈方丈说：“大师，麻烦你把你的上级改为灭绝师太吧。这样一来，两派原先的所有人员的终极boss都是师太，那还打个球啊！反正我们关心的只是连通性，门派内部的结构不要紧的。”玄慈一听肯定火大了：“我靠，凭什么是我变成她手下呀，怎么不反过来？我抗议！”抗议无效，上天安排的，最大。反正谁加入谁效果是一样的，我就随手指定了一个。这段函数的意思很明白了吧？
下面给出这个函数的实现：

void join(int x,int y)                     //我想让虚竹和周芷若做朋友
{
   
    int fx=find(x), fy=find(y);            //虚竹的老大是玄慈，芷若MM的老大是灭绝
    if(fx != fy)                           //玄慈和灭绝显然不是同一个人
        pre[fx]=fy;                        //方丈只好委委屈屈地当了师太的手下啦
}

3. 路径压缩算法的引入与实现
建立门派的过程是用join函数将两个人连接起来的，谁当谁的手下完全随机。最后的树状结构会变成什么样，我也完全无法预计，一字长蛇阵也有可能。这样查找的效率就会比较低下。最理想的情况就是所有人的直接上级都是掌门，一共就两级结构，只要找一次就找到掌门了。哪怕不能完全做到，也最好尽量接近。这样就产生了路径压缩算法。
设想这样一个场景：两个互不相识的大侠夏侯惇和许褚碰面了，想知道能不能揍。于是赶紧打电话问自己的上级：“你是不是掌门？” 上级说：“我不是呀，我的上级是谁谁谁，你问问他看看。” 两个人一路问下去，发现它们的最终boss都是曹操。具体结构如下：

“哎呀呀，原来是自己人，失礼失礼，在下军机处前将军夏侯惇!”
“幸会幸会，在下军卫队上级许褚！”
两人高高兴兴地手拉手喝酒去了
“等等等等，两位同学请留步，还有事情没完成呢！”我叫住他俩：“还要做路径压缩！”
两人醒悟，夏侯惇打电话给他的上级郭嘉：“军师啊，我查过了，我们的掌门都是曹丞相。不如我们直接拜在丞相手下吧，省得级别太低，以后查找掌门麻烦。”郭嘉答道：“嗯，有道理。”
许褚接着也打电话给刚才拜访过的典韦，做同样的事情。于是此时，整个曹操阵营的结构如下：

这样，在刚才查询过程中涉及到的人物都聚集在了曹操的直接领导下。由于每次查询都做了优化处理，所以整个门派树的层数都会维持在比较低的水平上。路径压缩算法所实现的功能就是这么个意思
下面给出具体的实现代码：

int find_pre(int x)     				//查找结点x的根结点 
{
   
    if(pre[x] == x)         			//递归出口：x的上级为x本身，即x为根结点 
        return x;       
    return pre[x] = find_pre(pre[x]);  //此代码相当于先找到根结点rootx，然后pre[x]=rootx 
}

该优化的主要思路是：将x到根节点路径上的所有点的pre（上级）都设为根节点
该算法的缺点是：只有在查找了上级的元素才能进行压缩，并且第一次执行时，是不能达到压缩效果的。只有在之后才能有效

其实掌握了1、2、3就能应对绝大多数的题，下面第4点供有兴趣的同学学习
4. 加权标记法的引入与实现
除了路径压缩算法可以将并查集中的树状结构进行压缩外，还有一种方法——加权标记法
主要思路：给每个结点加权以标记树的深度，使得在合并操作时能尽可能减小树的深度
比如对于合并操作，假设需要合并的两个集合的代表元分别为x和y（用集合中的某个元素来代表这个集合，该元素称为集合的代表元），则只需要令parent[x] = y或者parent[y] = x即可
我们为了使合并后的树不产生退化（即：使树中左右子树的深度差尽可能小），那么对于每一个元素x，维护一个rank[x]数组，用以表达子树x的深度。合并时，如果rank[x] < rank[y]，则令parent[x] = y,否则令parent[y] = x。举个例子，我们对以A，F为代表元的集合进行合并操作，具体情况如下：

由于rank(A) > rank(F) ,因此令parent[F]= A。合并后的图形如下图所示：

当然，由于给每个节点加权意味着需要额外的数据结构来存放权重信息，所以这将导致额外的空间开销

总结
①用集合中的某个元素来代表这个集合，该元素称为集合的代表元；
②一个集合内的所有元素组织成以代表元为根的树形结构；
③对于每一个元素 pre[x]指向x在树形结构上的父亲节点。如果x是根节点，则令pre[x] = x；
④对于查找操作，假设需要确定x所在的的集合，也就是确定集合的代表元。可以沿着pre[x]不断在树形结构中向上移动，直到到达根节点。

因此：判断两个元素是否属于同一集合，只需要看他们的代表元是否相同即可。
基于这样的特性，并查集由以下用途：
1、维护无向图的连通性。支持判断两个点是否在同一连通块内，和判断增加一条边是否会产生环。
2、用在求解最小生成树的Kruskal算法里。

一般来说，一个并查集对应三个操作：初始化+查找根结点函数+合并集合函数

初始化

void Make_pre(int i)
{
   
    pre[i]=i; 				//初始时，某个元素的“上级”就是它自己
}

查找函数

int Find_pre(int i)
{
    
   if(pre[i]==i) return pre[i];		//如果元素i的父节点是自己，说明自己就是源头
   return  Find_pre(pre[i]);    	//否则递归查找元素i的源头
}

合并集合函数

void join(int x,int y)                    //试图合并元素x和元素y
{
   
    int fx=find(x), fy=find(y); 		  //找到x和y的源头
    if(fx != fy) pre[fx]=fy;  			  //合并两个源头
}

通过rank机制，优化3中的合并集合函数

void Union(int i,int j)
{
   
    i=Find_pre(i);
    j=Find_pre(j);
    if(i==j) return ;
    if(rank[i]>rank[j]) pre[j]=i;
    else
    {
   
        if(rank[i]==rank[j]) rank[j]++;   
        pre[i]=j;
    }
}

下面给出上述所以内容的代码汇总：

const int  N=105
int pre[N];     						//存储每个结点的前驱结点 
int rank[N];    						//树的高度 
void init(int n)     					//初始化函数，对录入的n个结点进行初始化 
{
   
    for(int i = 0; i < n; i++){
   
        pre[i] = i;     				//每个结点的上级都是自己 
        rank[i] = 1;    				//每个结点构成的树的高度为1 
    } 
}
int find_pre(int x)     	 		    //查找结点x的根结点 
{
   
    if(pre[x] == x) return x;  			//递归出口：x的上级为x本身，则x为根结点 
    return find_pre(pre[x]); 			//递归查找 
} 
 
//改进查找算法：完成路径压缩，将x的上级直接变为根结点，那么树的高度就会大大降低 
int find_pre(int x)     				//查找结点x的根结点 
{
   
    if(pre[x] == x) return x;			//递归出口：x的上级为x本身，即x为根结点 
    return pre[x] = find_pre(pre[x]);   //此代码相当于先找到根结点rootx，然后pre[x]=rootx 
} 

bool is_same(int x, int y)      		//判断两个结点是否连通 
{
   
    return find_pre(x) == find_pre(y);  //判断两个结点的根结点（亦称代表元）是否相同 
}

bool unite(int x,int y)
{
   
    x = find_pre(x);
    y = find_pre(y);
    if(x == y) return false;
    if(rank[x] > rank[y]) pre[y]=x;		//令y的根结点的上级为x
    else
    {
   
        if(rank[x] == rank[y])  rank[y]++;
        pre[x] = y;
	}
	return true;
}

趁热打铁！！！
下面给出两道涉及到并查集知识的典型例题（含题解），请同学们务必练习下
蓝桥杯历届试题合根植物
 蓝桥杯历届试题国王的烦恼

转载：https://blog.csdn.net/the_ZED/article/details/105126583

查看评论

小言_互联网的博客

小言_互联网的博客

个人资料

文章分类

文章存档

阅读排行

评论排行

推荐文章

【算法与数据结构】—— 并查集

并查集

* 以上用户言论只代表其个人观点，不代表本网站的观点或立场