如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值,什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

or

SELECT u.profession FROM users u GROUP BY u.profession

?


当前回答

SELECT DISTINCT总是和GROUP BY一样,或者比GROUP BY更快。在某些系统上(例如Oracle),对于大多数查询,它可能被优化为与DISTINCT相同。在其他的(如SQL Server)上,它可能要快得多。

其他回答

它们本质上是等价的(事实上,这就是一些数据库在底层实现DISTINCT的方式)。

如果其中一个更快,它就是DISTINCT。这是因为,尽管两者是相同的,但查询优化器必须捕获这样一个事实,即GROUP BY没有利用任何组成员,只利用了它们的键。DISTINCT将此显式化,因此可以使用稍微笨一点的优化器。

有疑问的时候,测试一下!

在postgres的某些情况下,distinct可能比group by慢(不知道其他dbs)。

测试的例子:

postgres=# select count(*) from (select distinct i from g) a;

count 

10001
(1 row)

Time: 1563,109 ms

postgres=# select count(*) from (select i from g group by i) a;

count
10001
(1 row)

Time: 594,481 ms

http://www.pgsql.cz/index.php/PostgreSQL_SQL_Tricks_I

所以要小心……:)

这不是规则

对于每个查询....试着分开,然后按…分组比较完成每个查询的时间,并使用更快的....

在我的项目中,有时我使用group by和other distinct

如果你不需要执行任何组函数(如果你想将数值数据添加到表中,可以使用sum, average等),请使用SELECT DISTINCT。我怀疑它更快,但我没有任何表现。

在任何情况下,如果您担心速度,可以在列上创建索引。

如果你有一个关于职业的索引,这两个是同义词。

如果没有,那么使用DISTINCT。

MySQL中的GROUP BY对结果进行排序。你甚至可以这样做:

SELECT u.profession FROM users u GROUP BY u.profession DESC

把你的职业按照DESC的顺序排序。

DISTINCT创建一个临时表并使用它存储副本。GROUP BY执行同样的操作,但随后对不同的结果进行排序。

So

SELECT DISTINCT u.profession FROM users u

更快,如果你没有职业索引的话。