如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值,什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

or

SELECT u.profession FROM users u GROUP BY u.profession

?


当前回答

对于单个列上的DISTINCT和单个列上的GROUP BY,上面的所有答案都是正确的。 每个db引擎都有自己的实现和优化,如果你只关心一点点差异(在大多数情况下),那么你必须针对特定的服务器和特定的版本进行测试!由于实现可能会改变…

但是,如果在查询中选择多个列,则DISTINCT本质上是不同的!因为在这种情况下,它将比较所有行的所有列,而不仅仅是一列。

如果你有这样的东西:

// This will NOT return unique by [id], but unique by (id,name)
SELECT DISTINCT id, name FROM some_query_with_joins

// This will select unique by [id].
SELECT id, name FROM some_query_with_joins GROUP BY id

认为DISTINCT关键字通过指定的第一列来区分行是一个常见的错误,但DISTINCT是这种方式的通用关键字。

所以朋友们,你们要小心,不要把上面的答案当成所有情况下的正确答案……你可能会感到困惑,得到错误的结果,而你想要的只是优化!

其他回答

经过大量的测试,我们得出的结论是GROUP BY更快

选择sql_no_cache opnamegroep_intern 从telwerken WHERE opnemergroep IN (7,8,9,10,11,12,13) group by opnamegroep_intern

总共0.0944秒 显示记录0 - 29(共635条,查询持续0.0484秒)

选择sql_no_cache 不同的(opnamegroep_intern) 从telwerken WHERE opnemergroep IN (7,8,9,10,11,12,13)

635总共0.2117秒(几乎慢了100%) 韦格弗面包车记录0 - 29(总共635,查询时间0.3468秒)

如果可以,尽量选择最简单、最简短的答案——DISTINCT似乎更符合你的要求,因为它会给你你需要的答案,而且只有这个答案!

如果你不需要执行任何组函数(如果你想将数值数据添加到表中,可以使用sum, average等),请使用SELECT DISTINCT。我怀疑它更快,但我没有任何表现。

在任何情况下,如果您担心速度,可以在列上创建索引。

它们本质上是等价的(事实上,这就是一些数据库在底层实现DISTINCT的方式)。

如果其中一个更快,它就是DISTINCT。这是因为,尽管两者是相同的,但查询优化器必须捕获这样一个事实,即GROUP BY没有利用任何组成员,只利用了它们的键。DISTINCT将此显式化,因此可以使用稍微笨一点的优化器。

有疑问的时候,测试一下!

如果你有一个关于职业的索引,这两个是同义词。

如果没有,那么使用DISTINCT。

MySQL中的GROUP BY对结果进行排序。你甚至可以这样做:

SELECT u.profession FROM users u GROUP BY u.profession DESC

把你的职业按照DESC的顺序排序。

DISTINCT创建一个临时表并使用它存储副本。GROUP BY执行同样的操作,但随后对不同的结果进行排序。

So

SELECT DISTINCT u.profession FROM users u

更快,如果你没有职业索引的话。