算法手记 之 数据结构(并查集详解)(POJ1703)

《ACM/ICPC算法训练教程》读书笔记-这一次补上并查集的部分。将对并查集的思想进行详细阐述,并附上本人AC掉POJ1703的Code。

 

 

  在一些有N个元素的集合应用问题中,通常会将每个元素构成单元素集合,然后按照一定顺序将同属一组的集合合并,期间要反复查找每一个元素在哪个集合中。这类问题往往看似简单,但是数据量很大,因此容易造成TLE或MLE,也就是空间度和时间度极其复杂。因此在这里,我们引入一种抽象的特殊数据结构——并查集。

  并查集:类似一个族谱,每个结点均有一个father[x]来表示x结点的父结点,因此,我们在给并查集初始化的时候,先将结点设为自己的父结点,也就是: father[x] = x; ,依次初始所有结点。

  并查集有两种重要的操作:查找合并

 

查找

  并查集为避免时间上和空间上的损耗,在每一轮查找时,都要进行一次路径压缩优化。什么叫做路径压缩呢,简单的说就是将所有子结点都直接归属其根结点,减小代差,这样父辈和子辈就方便”交流”了。

  具体来说,在查找时,如果得到3的父结点为1,而1的父结点为2,2的父结点又为4,就依次完成: father[3] = father[1] = father[2] = 4;

  这样的优势就在于待到下一次查找时,可以直接进行一次操作完成查询,而不需多次操作“寻根问底”。

  在这里我们利用递归的思想让这段代码实现起来简便易行:

 1 /*查找并压缩路径*/
 2 int Find_set(int x)
 3 {
 4     int temp = fa[x];
 5     if(x != fa[x])
 6         fa[x] = Find_set(fa[x]);    //路径压缩
 7     return fa[x];
 8 }
 9 /*使用*/
10 p[x] = Find_set(x);

 

合并

  也就是合并x和y所在的两个集合,简单来说,只需要把其中一个集合的根节点赋给另一个集合的根节点就可以了。因此此时需要进行一次查询操作并查找到x和y所在集合的两个根节点。

  具体实现如下:

1 void Union(int x,int y)
2 {
3     int fx = Find_set(x);
4     int fy = Find_set(y);
5     if (fx == fy)    //根节点Same
6         return;
7     father[fx] = fy;
8 }

  本书在这里给出的Code包括了启发式合并:也就是将深度小的根节点挂在深度大的根节点上,这样每次查询时进行路径压缩的次数就会得到优化。

  但是我认为初学的时候摊上这个就有点麻烦了,而且这种优化在一定程度来说写起来比较繁琐,因此就没有在这里贴出来了,在某些极端情况下可以加上启发式合并试试。

 

  那么像这样利用路径压缩就可以将并查集的时间复杂度看做O(1),空间复杂度为O(n),这样就将一个大规模问题转化为一个空间小,速度极快的简单操作。

 

 

  POJ1703解题报告:

  题目大意:Tadu City中有两个黑帮团伙,一共n名团伙成员(不知道属于哪个组织),现在警察局有一些信息,每条信息包括两个人的编号:

  输入D x y:代表x于y不在一个团伙里
  输入A x y:询问x与y是否在同一团伙或者不确定他们在同一个团伙里

  

  那么在这种题目中,我们用并查集的思想可以避免大规模地遍历每个成员。那么具体来说如何实现呢。

  如果定义两个帮派集合,那么在大量的D x y中也可能无法确认谁属于哪个帮派,而如果定义每个人一个帮派,那么就可以将并查集的思想利用起来,为了表明成员间的关系,因此我们在这里加入一个relate[x]来表明x结点与其父结点的关系。我们用1来表示这两个成员是不同帮派,而用0来表示这两个成员属于同一个帮派。

  大家可以先打个草稿来尝试如何将大量D x y数据合并(注意relate[]的调整)

 

  Code仅供参考:

  

 1 //并查集:D x y 表示x和y分属不同帮派,A x y表示查询x和y的关系
 2 //在并查集的基础上加上relate[],表示t与其父结点fa[t]的关系
 3 //Memory:948K Time:344Ms
 4 #include<iostream>
 5 #include<cstring>
 6 #include<cstdio>
 7 using namespace std;
 8 #define MAX 100005
 9 int n, m;
10 int fa[MAX], r[MAX];    //father node - relation
11 int find(int x)
12 {
13     if (x != fa[x]) {
14         int pa = fa[x];
15         fa[x] = find(fa[x]);    //路径压缩
16         r[x] ^= r[pa];    //改变关系
17     }
18     return fa[x];
19 }
20 int main()
21 {
22     int T;
23     scanf("%d", &T);
24     while (T--)
25     {
26         scanf("%d%d", &n, &m);
27         memset(r, 0, sizeof(r));
28         for (int i = 0; i <= n;i++)
29             fa[i] = i;
30         while (m--)
31         {
32             int c1, c2;
33             char flag;
34             scanf("\n%c%d%d", &flag, &c1, &c2);
35             //找出根节点
36             int p1 = find(c1), p2 = find(c2);
37             if (flag == 'A')
38             {
39                 if (p1 != p2)
40                     printf("Not sure yet.\n");
41                 else if (r[c1] == r[c2])
42                     printf("In the same gang.\n");
43                 else printf("In different gangs.\n");
44             }
45             else {
46                 fa[p1] = p2;
47                 r[p1] = r[c1] == r[c2];    //c1-p1与c2-p2关系相同则p1与p2关系不同,反之亦然
48             }
49         }
50     }
51     return 0;
52 }

 

    原文作者:Inkblots
    原文地址: https://www.cnblogs.com/Inkblots/p/4935456.html
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞