[TOC]
其实对于那种地理位置不会变的两个主体之间的距离,最好是直接将结果静态化。也就是直接写死在配置里。
比如,找自己家附近的地铁站。
这种情况下,一般而言“家”这个主体是不会轻易“跑来跑去”的。每次查询都计算一次距离没什么意义。最好是直接将距离持久化后直接查询。
另一种情况:
获取APP用户所在位置附近的地铁站
这种情况下,用户的地理位置是变动的。所以每次都得实时计算实际距离。
思路
将地球当做一个标准的球体,使用球面距离公式来计算球面两点间大圆的弧长。
- 球面距离
public static double getDistance2(double long1, double lat1, double long2, double lat2) {
lat1 = rad(lat1);
lat2 = rad(lat2);
double a = lat1 - lat2;
double b = rad(long1 - long2);
double sa2 = Math.sin(a / 2.0);
double sb2 = Math.sin(b / 2.0);
return 2 * EARTH_MEAN_RADIUS_KM * Math.asin(Math.sqrt(sa2 * sa2 + Math.cos(lat1) * Math.cos(lat2) * sb2 * sb2));
}
知道两点之间的经纬度就可以。
当然,这种计算不得不放在数据库里,然后根据距离排序返回。将上面的公式带入到SQL里就可以。
附近地铁站示例
- 建地铁站示例表
CREATE TABLE station
(
id INT AUTO_INCREMENT PRIMARY KEY,
name VARCHAR(20) NULL COMMENT '地铁站名',
lng DOUBLE NULL COMMENT '经度',
lat DOUBLE NULL COMMENT '维度'
);
- SQL示例
SET @targetLat = 31.175702;
SET @targetLng = 121.519095;
SELECT
s.id ,
s.name ,
s.lng ,
s.lat ,
ROUND(
6378.138 * 2 * ASIN(
SQRT(
POW(
SIN( ( @targetLat * PI() / 180 - s.lat * PI() / 180 ) / 2 ) , 2 )
+
COS( @targetLat * PI( ) / 180 ) * COS( s.lat * PI( ) / 180 )
* POW( SIN( ( @targetLng * PI() / 180 - s.lng * PI() / 180 ) / 2 ) , 2 )
)
) * 1000
) AS distance
FROM station s
ORDER BY distance ASC , s.id
LIMIT 20;
其中的targetLat
和 targetLng
就是用户的地理位置。
这样的确可以达到目的。但是,这是对所有数据先计算了一次和用户的距离后再排序。
地铁站的数量太大的时候这种操作可就不太优雅了。不仅不够优雅,而且效率是很吓人的。
优化
其实,可以在计算距离之前就将很多数据先过滤掉。
没必要在 计算上海地铁站距离的时候将美国的地铁站距离也计算一遍吧。
这在大多数应用中都可以先将一些不需要的数据过滤掉。
比如在数据是区分城市的情况下就可以将SQL改为下面这样:
SET @targetLat = 31.175702;
SET @targetLng = 121.519095;
SET @cityId=605;
SELECT
s.id ,
s.name ,
s.lng ,
s.lat ,
ROUND(
6378.138 * 2 * ASIN(
SQRT(
POW(
SIN( ( @targetLat * PI() / 180 - s.lat * PI() / 180 ) / 2 ) , 2 )
+
COS( @targetLat * PI( ) / 180 ) * COS( s.lat * PI( ) / 180 )
* POW( SIN( ( @targetLng * PI() / 180 - s.lng * PI() / 180 ) / 2 ) , 2 )
)
) * 1000
) AS distance
FROM station s
where city_id=@cityId # 先将待计算的数据过滤的一部分
ORDER BY distance ASC , s.id
LIMIT 20;
上面的改进就是先将待计算的数据在计算之前就剔除大部分。找一个长沙地铁站,没有必要在上海先找一遍吧。
当然,这种情况比较特殊一点,因为你事先能知道用户所处的城市。
另一种改进就是:
以用户所在位置为圆心,画一个半径为R的圆,然后反推出这个圆圈的外接四边形的经纬度范围。在计算距离之前先将外接四边形经经纬度之外的数据过滤掉。
指定一个理想的半径R,先过滤掉不可能符合条件的数据。
- 反推外接四边形范围
/**
* 获取距离指定经纬度的点{@code radius} KM 的外接四边形(严格来说应该是外接立方体)四个顶点的经纬度
*
* @param lng 经度
* @param lat 纬度
* @param radius 半径,单位:KM
* @return <lng1,lng2,lat1,lat2>
*/
public static Tuple4<Double> calcBoxByDistFromPt(double lng, double lat, double radius) {
SpatialContext context = SpatialContext.GEO;
Rectangle rectangle = context.getDistCalc()//
.calcBoxByDistFromPt(//
context.makePoint(lng, lat), //
radius * com.spatial4j.core.distance.DistanceUtils.KM_TO_DEG, context, null//
);
return new Tuple4<>(rectangle.getMinX(), rectangle.getMaxX(), rectangle.getMinY(), rectangle.getMaxY());
}
这里用到的工具类maven坐标如下:
<dependency>
<groupId>com.spatial4j</groupId>
<artifactId>spatial4j</artifactId>
<version>0.5</version>
</dependency>
此时的SQL可以改成这样:
SET @targetLat = 31.175702;
SET @targetLng = 121.519095;
SELECT
s.id ,
s.name ,
s.lng ,
s.lat ,
ROUND(
6378.138 * 2 * ASIN(
SQRT(
POW(
SIN( ( @targetLat * PI() / 180 - s.lat * PI() / 180 ) / 2 ) , 2 )
+
COS( @targetLat * PI( ) / 180 ) * COS( s.lat * PI( ) / 180 )
* POW( SIN( ( @targetLng * PI() / 180 - s.lng * PI() / 180 ) / 2 ) , 2 )
)
) * 1000
) AS distance
FROM station s
WHERE
( s.lng BETWEEN ${lng1} AND ${lng2} )
AND ( s.lat BETWEEN ${lat1} AND ${lat2} )
ORDER BY distance ASC , s.id
LIMIT 20;
上面的 lng1,lng2,lat1,lat2
就是外接四边形的范围。
引用资料
示例源码
- service:https://github.com/hylexus/bl…
- 初始化数据:https://github.com/hylexus/bl…
- 感谢这位仁兄提供的测试数据:http://blog.csdn.net/a364572/…