我目前在mysql数据库中有不到一百万个位置,都有经度和纬度信息。
我试图通过查询找到一个点和许多其他点之间的距离。它没有我想要的那么快,尤其是每秒100+次。
有没有比mysql更快的查询或更快的系统?我使用这个查询:
SELECT
name,
( 3959 * acos( cos( radians(42.290763) ) * cos( radians( locations.lat ) )
* cos( radians(locations.lng) - radians(-71.35368)) + sin(radians(42.290763))
* sin( radians(locations.lat)))) AS distance
FROM locations
WHERE active = 1
HAVING distance < 10
ORDER BY distance;
注:提供的距离单位为英里。如果需要公里,请使用6371而不是3959。
使用mysql
SET @orig_lon = 1.027125;
SET @dest_lon = 1.027125;
SET @orig_lat = 2.398441;
SET @dest_lat = 2.398441;
SET @kmormiles = 6371;-- for distance in miles set to : 3956
SELECT @kmormiles * ACOS(LEAST(COS(RADIANS(@orig_lat)) *
COS(RADIANS(@dest_lat)) * COS(RADIANS(@orig_lon - @dest_lon)) +
SIN(RADIANS(@orig_lat)) * SIN(RADIANS(@dest_lat)),1.0)) as distance;
参见:https://andrew.hedges.name/experiments/haversine/
参见:https://stackoverflow.com/a/24372831/5155484
参见:http://www.plumislandmedia.net/mysql/haversine-mysql-nearest-loc/
注意:LEAST用于避免null值,如https://stackoverflow.com/a/24372831/5155484上建议的注释
Create your points using Point values of Geometry data types in MyISAM table. As of Mysql 5.7.5, InnoDB tables now also support SPATIAL indices.
Create a SPATIAL index on these points
Use MBRContains() to find the values:
SELECT *
FROM table
WHERE MBRContains(LineFromText(CONCAT(
'('
, @lon + 10 / ( 111.1 / cos(RADIANS(@lat)))
, ' '
, @lat + 10 / 111.1
, ','
, @lon - 10 / ( 111.1 / cos(RADIANS(@lat)))
, ' '
, @lat - 10 / 111.1
, ')' )
,mypoint)
,或MySQL 5.1及以上版本:
SELECT *
FROM table
WHERE MBRContains
(
LineString
(
Point (
@lon + 10 / ( 111.1 / COS(RADIANS(@lat))),
@lat + 10 / 111.1
),
Point (
@lon - 10 / ( 111.1 / COS(RADIANS(@lat))),
@lat - 10 / 111.1
)
),
mypoint
)
这将选择方框内的所有点(@lat +/- 10km, @lon +/- 10km)。
这实际上不是一个盒子,而是一个球面矩形:纬度和经度绑定的球面段。这可能与弗朗茨约瑟夫土地上的普通矩形不同,但在大多数有人居住的地方都很接近。
应用额外的过滤来选择圆内的所有内容(不是正方形)
可能会应用额外的精细过滤来考虑大的圆距离(对于大的距离)
不是MySql特有的答案,但它会提高sql语句的性能。
你要做的是计算到表中每个点的距离,看看它是否在给定点的10个单位内。
在运行此sql之前,您可以做的是创建四个点,在一侧绘制一个20个单位的盒子,与您的点在中心,即。(x1,y1)。(x4, y4),其中(x1,y1)为(给定long + 10个单位,给定lat + 10个单位)…(给予龙-10单位,给予拉-10单位)。
实际上,你只需要两个点,左上右下分别是(X1, Y1)和(X2, Y2)
现在您的SQL语句使用这些点来排除肯定超过10u从您给定的点,它可以使用纬度和经度上的索引,因此将比您目前拥有的快几个数量级。
e.g.
select . . .
where locations.lat between X1 and X2
and locations.Long between y1 and y2;
方框方法可能会返回假阳性(您可以在方框的角落中拾取距离给定点> 10u的点),因此您仍然需要计算每个点的距离。然而,这同样会快得多,因为您已经极大地限制了测试框内的点的数量。
我把这个技巧叫做“在盒子里思考”:)
编辑:这可以放入一个SQL语句吗?
抱歉,我不知道mySql和Php能做什么。
我不知道构建这四个点的最佳位置,也不知道如何将它们传递给Php中的mySql查询。但是,一旦您掌握了这四点,就没有什么能阻止您将自己的SQL语句与我的SQL语句相结合了。
select name,
( 3959 * acos( cos( radians(42.290763) )
* cos( radians( locations.lat ) )
* cos( radians( locations.lng ) - radians(-71.35368) )
+ sin( radians(42.290763) )
* sin( radians( locations.lat ) ) ) ) AS distance
from locations
where active = 1
and locations.lat between X1 and X2
and locations.Long between y1 and y2
having distance < 10 ORDER BY distance;
我知道用MS SQL,我可以构建一个SQL语句,声明四个浮动(X1, Y1, X2, Y2),并在“主”选择语句之前计算它们,就像我说的,我不知道这是否可以用MySql完成。然而,我仍然倾向于用c#构建这四个点,并将它们作为参数传递给SQL查询。
对不起,我不能提供更多的帮助,如果有人可以回答MySQL和Php的具体部分,请随意编辑这个答案。
下面的MySQL函数发布在这篇博文上。我还没有对它进行太多测试,但从我从帖子中收集到的内容来看,如果你的纬度和经度字段被索引了,这可能对你很有用:
DELIMITER $$
DROP FUNCTION IF EXISTS `get_distance_in_miles_between_geo_locations` $$
CREATE FUNCTION get_distance_in_miles_between_geo_locations(
geo1_latitude decimal(10,6), geo1_longitude decimal(10,6),
geo2_latitude decimal(10,6), geo2_longitude decimal(10,6))
returns decimal(10,3) DETERMINISTIC
BEGIN
return ((ACOS(SIN(geo1_latitude * PI() / 180) * SIN(geo2_latitude * PI() / 180)
+ COS(geo1_latitude * PI() / 180) * COS(geo2_latitude * PI() / 180)
* COS((geo1_longitude - geo2_longitude) * PI() / 180)) * 180 / PI())
* 60 * 1.1515);
END $$
DELIMITER ;
示例用法:
假设有一个名为places的表,其中包含纬度和经度字段:
SELECT get_distance_in_miles_between_geo_locations(-34.017330, 22.809500,
AS distance_from_input FROM places;