在MySQL中，选择DISTINCT或GROUP BY哪个更快?

如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值，什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

SELECT u.profession FROM users u GROUP BY u.profession

当前回答

对于单个列上的DISTINCT和单个列上的GROUP BY，上面的所有答案都是正确的。每个db引擎都有自己的实现和优化，如果你只关心一点点差异(在大多数情况下)，那么你必须针对特定的服务器和特定的版本进行测试!由于实现可能会改变…

但是，如果在查询中选择多个列，则DISTINCT本质上是不同的!因为在这种情况下，它将比较所有行的所有列，而不仅仅是一列。

如果你有这样的东西:

// This will NOT return unique by [id], but unique by (id,name)
SELECT DISTINCT id, name FROM some_query_with_joins

// This will select unique by [id].
SELECT id, name FROM some_query_with_joins GROUP BY id

认为DISTINCT关键字通过指定的第一列来区分行是一个常见的错误，但DISTINCT是这种方式的通用关键字。

所以朋友们，你们要小心，不要把上面的答案当成所有情况下的正确答案……你可能会感到困惑，得到错误的结果，而你想要的只是优化!

2013-05-16 10:49:53

其他回答

在postgres的某些情况下，distinct可能比group by慢(不知道其他dbs)。

测试的例子:

postgres=# select count(*) from (select distinct i from g) a;

count 

10001
(1 row)

Time: 1563,109 ms

postgres=# select count(*) from (select i from g group by i) a;

count
10001
(1 row)

Time: 594,481 ms

http://www.pgsql.cz/index.php/PostgreSQL_SQL_Tricks_I

所以要小心……：）

2011-11-18 13:56:26

似乎这些查询并不完全相同。至少对MySQL是这样。

比较:

描述从northwind.products中选择不同的产品名称描述从北风选择的产品名称。产品组按产品名称

第二个查询在Extra中额外给出了“Using filesort”。

2009-02-24 12:20:18

如果可以，尽量选择最简单、最简短的答案——DISTINCT似乎更符合你的要求，因为它会给你你需要的答案，而且只有这个答案!

2009-02-24 13:37:28

如果你不需要执行任何组函数(如果你想将数值数据添加到表中，可以使用sum, average等)，请使用SELECT DISTINCT。我怀疑它更快，但我没有任何表现。

在任何情况下，如果您担心速度，可以在列上创建索引。