我想知道以下内容在性能上是否有区别

SELECT ... FROM ... WHERE someFIELD IN(1,2,3,4)

SELECT ... FROM ... WHERE someFIELD between 0 AND 5

SELECT ... FROM ... WHERE someFIELD = 1 OR someFIELD = 2 OR someFIELD = 3 ... 

或者MySQL会像编译器优化代码一样优化SQL吗?


EDIT

根据评论中说明的原因,将AND改为OR。


当前回答

OR是最慢的。IN还是BETWEEN更快取决于你的数据,但我希望BETWEEN通常更快,因为它可以简单地从索引中获取一个范围(假设someField被索引)。

其他回答

我敢打赌它们是一样的,你可以通过执行以下操作来运行测试:

循环遍历“in(1,2,3,4)”500次,看看需要多长时间。循环“=1 or= 2 or=3…”版本500次,看看它运行了多长时间。

你也可以尝试一个连接的方式,如果someField是一个索引,你的表很大,它可以更快…

SELECT ... 
    FROM ... 
        INNER JOIN (SELECT 1 as newField UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4) dt ON someFIELD =newField

我在我的SQL Server上尝试了上面的join方法,它几乎与in(1,2,3,4)相同,它们都导致了一个聚集索引查找。我不确定MySQL将如何处理它们。

我认为BETWEEN会更快,因为它应该转换为:

Field >= 0 AND Field <= 5

我的理解是,不管怎样,一个IN语句都会被转换成一堆OR语句。IN的价值是易用性。(节省了必须多次键入每个列名,也使它更容易与现有逻辑一起使用-您不必担心and /OR优先级,因为IN是一个语句。对于一堆OR语句,你必须确保用圆括号将它们括起来,以确保它们作为一个条件进行计算。)

对你的问题唯一真正的答案是分析你的查询。然后你就会知道在你的特定情况下什么是最好的。

我需要确定这一点,所以我对这两种方法都进行了基准测试。我始终发现IN比OR要快得多。

不要相信那些发表“意见”的人,科学就是测试和证据。

我运行了1000倍的等效查询循环(为了一致性,我使用sql_no_cache):

: 2.34969592094秒

或者:5.83781504631秒

更新: (我没有原始测试的源代码,因为它是6年前的,尽管它返回的结果与此测试相同)

为了要求一些示例代码来测试这一点,这里是最简单的可能用例。使用Eloquent来简化语法,原始的SQL等价执行相同的操作。

$t = microtime(true); 
for($i=0; $i<10000; $i++):
$q = DB::table('users')->where('id',1)
    ->orWhere('id',2)
    ->orWhere('id',3)
    ->orWhere('id',4)
    ->orWhere('id',5)
    ->orWhere('id',6)
    ->orWhere('id',7)
    ->orWhere('id',8)
    ->orWhere('id',9)
    ->orWhere('id',10)
    ->orWhere('id',11)
    ->orWhere('id',12)
    ->orWhere('id',13)
    ->orWhere('id',14)
    ->orWhere('id',15)
    ->orWhere('id',16)
    ->orWhere('id',17)
    ->orWhere('id',18)
    ->orWhere('id',19)
    ->orWhere('id',20)->get();
endfor;
$t2 = microtime(true); 
echo $t."\n".$t2."\n".($t2-$t)."\n";

1482080514.3635 1482080517.3713 3.0078368186951

$t = microtime(true); 
for($i=0; $i<10000; $i++): 
$q = DB::table('users')->whereIn('id',[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20])->get(); 
endfor; 
$t2 = microtime(true); 
echo $t."\n".$t2."\n".($t2-$t)."\n";

1482080534.0185 1482080536.178 2.1595389842987

我认为对sunseeker的观察的一个解释是,MySQL实际上对in语句中的值进行排序,如果它们都是静态值,并且使用二进制搜索,这比普通或替代方法更有效。我不记得在哪里读到过,但圣汐者的结果似乎是一个证明。

我知道,只要在Field上有一个索引,BETWEEN就会使用它快速找到一端,然后遍历到另一端。这是最有效的。

我看过的每一个解释都是“IN(…)”和“……”或…”是可互换的,同样有效。这是您所期望的,因为优化器无法知道它们是否包含一个间隔。它也等价于单个值上的UNION ALL SELECT。