编程之美——寻找最近点对
题目:给定平面上N个点的坐标,找出距离最近的两个点。
这个题目其实就是求最近点对的距离。《算法导论》上有详细讲解,王晓东的书上也有代码。主要思想就是分治。先把n个点按x坐标排序,然后求左边n/2个和右边n/2个的最近距离,最后合并。合并要重点说一下,比较麻烦。
首先,假设点是n个,编号为1到n。我们要分治求,则找一个中间的编号mid,先求出1到mid点的最近距离设为d1,还有mid+1到n的最近距离设为d2。这里的点需要按x坐标的顺序排好,并且假设这些点中,没有2点在同一个位置。(若有,则直接最小距离为0了)。
然后,令d为d1, d2中较小的那个点。如果说最近点对中的两点都在1-mid集合中,或者mid+1到n集合中,则d就是最小距离了。但是还有可能的是最近点对中的两点分属这两个集合,所以我们必须先检测一下这种情况是否会存在,若存在,则把这个最近点对的距离记录下来,去更新d。这样我们就可以得道最小的距离d了。
关键是要去检测最近点对,理论上每个点都要和对面集合的点匹配一次,那效率还是不能满足我们的要求。所以这里要优化。怎么优化呢?考虑一下,假如以我们所选的分割点mid为界,如果某一点的横坐标到点mid的横坐标的绝对值超过d1并且超过d2,那么这个点到mid点的距离必然超过d1和d2中的小者,所以这个点到对方集合的任意点的距离必然不是所有点中最小的。
所以我们先把在mid为界左右一个范围内的点全部筛选出来,放到一个集合里。筛选好以后,当然可以把这些点两两求距离去更新d了,不过这样还是很慢,万一满足条件的点很多呢。这里还得继续优化。首先把这些点按y坐标排序。假设排序好以后有cnt个点,编号为0到cnt-1。那么我们用0号去和1到cnt-1号的点求一下距离,然后1号和2到cnt-1号的点求一下距离。。。如果某两个点y轴距离已经超过了d,这次循环就可以直接break了,开始从下一个点查找了。
代码为:
#include<iostream>
#include<algorithm>
#include<cmath>
using namespace std;
struct point
{
double x,y;
}p[100005];
int a[100005];
int cmpx(const point &a,const point &b)
{
return a.x<b.x;
}
int cmpy(int &a,int &b)
{
return p[a].y<p[b].y;
}
inline double dis(point &a,point &b)
{
return sqrt((a.x-b.x)*(a.x-b.x)+(a.y-b.y)*(a.y-b.y));
}
inline double min(double a,double b)
{
return a<b?a:b;
}
double closest(int low,int high)
{
if(low+1==high)
return dis(p[low],p[high]);
if(low+2==high)
return min(dis(p[low],p[high]),min(dis(p[low],p[low+1]),dis(p[low+1],p[high])));
int mid=(low+high)>>1;
double ans=min(closest(low,mid),closest(mid+1,high));
int i,j,cnt=0;
for(i=low;i<high;i++)
{
if(p[i].x>=p[mid].x-ans && p[i].x<=p[mid].x+ans)
a[cnt++]=i;
}
sort(a,a+cnt,cmpy);
for(i=0;i<cnt;i++)
{
for(j=i+1;j<cnt;j++)
{
if(p[a[j]].y-p[a[a[i].y]>=ans)
break;
ans=min(ans,dis(p[a[i]],p[a[j]]));
}
}
return ans;
}
int main(void)
{
int i,n;
while(scanf("%d",&n)!=EOF)
{
if(!n)
break;
for(i=0;i<n;i++)
scanf("%lf %lf",&p[i].x,&p[i].y);
sort(p,p+n,cmpx);
printf("%.21f\n",closest(0,n-1));
}
return 0;
}
按照y值进行升序排列后,还可以进一步进行优化的,就是每次选取6个点就OK了,具体原因编程之美上面有介绍的(编程之美上写8个点是不对的)。
for(i = 0 ; i < cnt ; ++i)
{
int k = (i+7) > cnt ? cnt :(i+7); //只要选取出7个点(证明过程没看懂)
for(j = i+1 ; j < k ; ++j)
{
if(p[a[j]].y - p[a[i]].y >= ans) //注意下标索引
break;
ans = min(ans , dis(p[a[i]] , p[a[j]]));
}
}