我想知道以下内容在性能上是否有区别

SELECT ... FROM ... WHERE someFIELD IN(1,2,3,4)

SELECT ... FROM ... WHERE someFIELD between 0 AND 5

SELECT ... FROM ... WHERE someFIELD = 1 OR someFIELD = 2 OR someFIELD = 3 ... 

或者MySQL会像编译器优化代码一样优化SQL吗?


EDIT

根据评论中说明的原因,将AND改为OR。


当前回答

公认的答案并不能解释原因。

下面引用自高性能MySQL,第三版。

在许多数据库服务器中,In()只是多个OR子句的同义词,因为这两个子句在逻辑上是等价的。在MySQL中不是这样,它对in()列表中的值进行排序,并使用快速的二进制搜索来查看一个值是否在列表中。这是列表大小的O(Log n),而等效的OR子句系列的列表大小是O(n)(即,对于大列表来说要慢得多)

其他回答

我知道,只要在Field上有一个索引,BETWEEN就会使用它快速找到一端,然后遍历到另一端。这是最有效的。

我看过的每一个解释都是“IN(…)”和“……”或…”是可互换的,同样有效。这是您所期望的,因为优化器无法知道它们是否包含一个间隔。它也等价于单个值上的UNION ALL SELECT。

我还为未来的谷歌员工做了一个测试。返回的结果总数为7264 / 10000

SELECT * FROM item WHERE id = 1 OR id = 2 ... id = 10000

该查询耗时0.1239秒

SELECT * FROM item WHERE id IN (1,2,3,...10000)

这个查询花费了0.0433秒

IN比OR快3倍

2018: IN(…)更快。但是>= && <=比IN还要快。

这是我的基准。

根据我对编译器优化这些类型查询的方式的理解,使用IN子句比多个OR子句更有效。如果您有可以使用BETWEEN子句的值,那么仍然更有效。

这取决于你在做什么;范围有多宽,数据类型是什么(我知道你的例子使用数字数据类型,但你的问题也可以适用于许多不同的数据类型)。

这是一个你想以两种方式编写查询的实例;让它工作,然后使用EXPLAIN来找出执行差异。

我相信这个问题有一个具体的答案,但这就是我如何,实际上,找出我给定问题的答案。

这可能会有一些帮助:http://forge.mysql.com/wiki/Top10SQLPerformanceTips

问候, 弗兰克