一、算法知识
并查集是一种树型的高级数据结构,用于处理集合的合并和查询的问题,应用十分广泛。
因为主要用合并和查询,所以叫做并查集。但是要注意,这里的集合是不能相交的。
并查集主要有两个函数:find(a)和union(a,b)。
find(a)主要用于查询a所在树的根节点。
union(a,b)主要用于合并两棵树。
来看一道例题:
二、题目描述及分析
亲戚
若某个家族人员过于庞大,要判断两个是否是亲戚,确实还很不容易。 现在给出某个亲戚关系图,求任意给出的两个人是否具有亲戚关系。 我们规定:如果x和y是亲戚,y和z是亲戚,那么x和z也是亲戚;如果x,y是亲戚,那么x的亲戚都是y的亲戚,y的亲戚也都是x的亲戚。
输入
第一行:三个整数n,m,p,(n≤5000,m≤5000,p≤5000),分别表示有n个人,m个亲戚关系,询问p对亲戚关系。 以下m行:每行两个数Mi,Mj,1≤Mi,Mj≤N,表示Ai和Bi具有亲戚关系。 接下来p行:每行两个数Pi,Pj,询问Pi和Pj是否具有亲戚关系。
输出
P行,每行一个’Yes’或’No’。表示第i个询问的答案为“具有”或“不具有”亲戚关系。
样例输入
6 5 3
1 2
1 5
3 4
5 2
1 3
1 4
2 3
5 6
样例输出
Yes
Yes
No
记得我以前写过一个关于并查集的博客(并查集算法—-犯罪团伙(黑科技))。里面主要写了并查集的合并的过程。但算法是伪并查集算法,所以很耗时,实际上真正的并查集算法快得多。
以前的代码:
#include<cstdio>
int b[5005];
int main()
{
int m,n,i,j,x,y,k,p;
scanf("%d%d%d",&n,&m,&p);
for(i=1;i<=n;i++)
b[i]=i;
for(i=1;i<=m;i++){
scanf("%d%d",&x,&y);
k=b[y];
for(j=1;j<=n;j++){
if(b[j]==k){
b[j]=b[x];
}
}
}
for(i=1;i<=p;i++){
scanf("%d%d",&x,&y);
if(b[x]==b[y])
printf("Yes\n");
else
printf("No\n");
}
}
总体思路:
1、我们把每一个节点所在的树的根节点存入f[]数组中。
2、输入两个数,查找他们的根节点。
3、对他们所在的树的根节点进行合并。
4、最后输入要查找的两个节点,找到他们的根节点,判断他们的根节点是否相同。
但是这种算法的速度也很慢,因为输入数据有可能形成一条单链
,把所有的时间都浪费在find()函数上。
所以我们对find()进行了优化。
优化前:find(a)只把a这一个节点接在了根节点上。
int find(x)
{
while(parent[x]!=-1)
x=parent[x];
return x;
}
优化后:find(a)把a点到根节点的之间的所有节点(包括a)都接到了根节点的下方。这就是路径压缩。
优化后find()函数的主要内容:
int find(int x)
{
if(!f[x])
return x;
return f[x]=find(f[x]);
}
接下来就是union()函数了。其实根本不用写函数,就一条语句:
f[x]=y;
全部代码:
#include<cstdio>
int n,m,c;
int f[5005];
int find(int x)
{
if(!f[x])
return x;
return f[x]=find(f[x]);
}
int main()
{
int a,b,p,q,i;
scanf("%d%d%d",&n,&m,&c);
for(i=1;i<=m;i++){
scanf("%d%d",&a,&b);
p=find(a);q=find(b);
if(p!=q)
f[p]=q;
}
for(i=1;i<=c;i++){
scanf("%d%d",&a,&b);
if(find(a)==find(b))
printf("Yes\n");
else
printf("No\n");
}
}
其实还有一种启发式合并的方法,也可以让find()函数的时间缩短。