《ACM/ICPC算法训练教程》读书笔记-这一次补上并查集的部分。将对并查集的思想进行详细阐述,并附上本人AC掉POJ1703的Code。
在一些有N个元素的集合应用问题中,通常会将每个元素构成单元素集合,然后按照一定顺序将同属一组的集合合并,期间要反复查找每一个元素在哪个集合中。这类问题往往看似简单,但是数据量很大,因此容易造成TLE或MLE,也就是空间度和时间度极其复杂。因此在这里,我们引入一种抽象的特殊数据结构——并查集。
并查集:类似一个族谱,每个结点均有一个father[x]来表示x结点的父结点,因此,我们在给并查集初始化的时候,先将结点设为自己的父结点,也就是: father[x] = x; ,依次初始所有结点。
并查集有两种重要的操作:查找,合并。
查找
并查集为避免时间上和空间上的损耗,在每一轮查找时,都要进行一次路径压缩优化。什么叫做路径压缩呢,简单的说就是将所有子结点都直接归属其根结点,减小代差,这样父辈和子辈就方便”交流”了。
具体来说,在查找时,如果得到3的父结点为1,而1的父结点为2,2的父结点又为4,就依次完成: father[3] = father[1] = father[2] = 4;
这样的优势就在于待到下一次查找时,可以直接进行一次操作完成查询,而不需多次操作“寻根问底”。
在这里我们利用递归的思想让这段代码实现起来简便易行:
1 /*查找并压缩路径*/ 2 int Find_set(int x) 3 { 4 int temp = fa[x]; 5 if(x != fa[x]) 6 fa[x] = Find_set(fa[x]); //路径压缩 7 return fa[x]; 8 } 9 /*使用*/ 10 p[x] = Find_set(x);
合并
也就是合并x和y所在的两个集合,简单来说,只需要把其中一个集合的根节点赋给另一个集合的根节点就可以了。因此此时需要进行一次查询操作并查找到x和y所在集合的两个根节点。
具体实现如下:
1 void Union(int x,int y) 2 { 3 int fx = Find_set(x); 4 int fy = Find_set(y); 5 if (fx == fy) //根节点Same 6 return; 7 father[fx] = fy; 8 }
本书在这里给出的Code包括了启发式合并:也就是将深度小的根节点挂在深度大的根节点上,这样每次查询时进行路径压缩的次数就会得到优化。
但是我认为初学的时候摊上这个就有点麻烦了,而且这种优化在一定程度来说写起来比较繁琐,因此就没有在这里贴出来了,在某些极端情况下可以加上启发式合并试试。
那么像这样利用路径压缩就可以将并查集的时间复杂度看做O(1),空间复杂度为O(n),这样就将一个大规模问题转化为一个空间小,速度极快的简单操作。
POJ1703解题报告:
题目大意:Tadu City中有两个黑帮团伙,一共n名团伙成员(不知道属于哪个组织),现在警察局有一些信息,每条信息包括两个人的编号:
输入D x y:代表x于y不在一个团伙里
输入A x y:询问x与y是否在同一团伙或者不确定他们在同一个团伙里
那么在这种题目中,我们用并查集的思想可以避免大规模地遍历每个成员。那么具体来说如何实现呢。
如果定义两个帮派集合,那么在大量的D x y中也可能无法确认谁属于哪个帮派,而如果定义每个人一个帮派,那么就可以将并查集的思想利用起来,为了表明成员间的关系,因此我们在这里加入一个relate[x]来表明x结点与其父结点的关系。我们用1来表示这两个成员是不同帮派,而用0来表示这两个成员属于同一个帮派。
大家可以先打个草稿来尝试如何将大量D x y数据合并(注意relate[]的调整)
Code仅供参考:
1 //并查集:D x y 表示x和y分属不同帮派,A x y表示查询x和y的关系 2 //在并查集的基础上加上relate[],表示t与其父结点fa[t]的关系 3 //Memory:948K Time:344Ms 4 #include<iostream> 5 #include<cstring> 6 #include<cstdio> 7 using namespace std; 8 #define MAX 100005 9 int n, m; 10 int fa[MAX], r[MAX]; //father node - relation 11 int find(int x) 12 { 13 if (x != fa[x]) { 14 int pa = fa[x]; 15 fa[x] = find(fa[x]); //路径压缩 16 r[x] ^= r[pa]; //改变关系 17 } 18 return fa[x]; 19 } 20 int main() 21 { 22 int T; 23 scanf("%d", &T); 24 while (T--) 25 { 26 scanf("%d%d", &n, &m); 27 memset(r, 0, sizeof(r)); 28 for (int i = 0; i <= n;i++) 29 fa[i] = i; 30 while (m--) 31 { 32 int c1, c2; 33 char flag; 34 scanf("\n%c%d%d", &flag, &c1, &c2); 35 //找出根节点 36 int p1 = find(c1), p2 = find(c2); 37 if (flag == 'A') 38 { 39 if (p1 != p2) 40 printf("Not sure yet.\n"); 41 else if (r[c1] == r[c2]) 42 printf("In the same gang.\n"); 43 else printf("In different gangs.\n"); 44 } 45 else { 46 fa[p1] = p2; 47 r[p1] = r[c1] == r[c2]; //c1-p1与c2-p2关系相同则p1与p2关系不同,反之亦然 48 } 49 } 50 } 51 return 0; 52 }