如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值,什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

or

SELECT u.profession FROM users u GROUP BY u.profession

?


当前回答

如果问题允许,请尝试使用EXISTS,因为它被优化为只要找到结果就结束(并且不缓冲任何响应),因此,如果您只是试图为这样的WHERE子句规范化数据

SELECT FROM SOMETHING S WHERE S.ID IN ( SELECT DISTINCT DCR.SOMETHING_ID FROM DIFF_CARDINALITY_RELATIONSHIP DCR ) -- to keep same cardinality

更快的回答是:

SELECT FROM SOMETHING S WHERE EXISTS ( SELECT 1 FROM DIFF_CARDINALITY_RELATIONSHIP DCR WHERE DCR.SOMETHING_ID = S.ID )

这并不总是可行的,但当可用时,你会看到一个更快的响应。

其他回答

似乎这些查询并不完全相同。至少对MySQL是这样。

比较:

描述从northwind.products中选择不同的产品名称 描述从北风选择的产品名称。产品组按产品名称

第二个查询在Extra中额外给出了“Using filesort”。

如果你有一个关于职业的索引,这两个是同义词。

如果没有,那么使用DISTINCT。

MySQL中的GROUP BY对结果进行排序。你甚至可以这样做:

SELECT u.profession FROM users u GROUP BY u.profession DESC

把你的职业按照DESC的顺序排序。

DISTINCT创建一个临时表并使用它存储副本。GROUP BY执行同样的操作,但随后对不同的结果进行排序。

So

SELECT DISTINCT u.profession FROM users u

更快,如果你没有职业索引的话。

这不是规则

对于每个查询....试着分开,然后按…分组比较完成每个查询的时间,并使用更快的....

在我的项目中,有时我使用group by和other distinct

在MySQL中,“Group By”使用了一个额外的步骤:文件排序。我意识到DISTINCT比GROUP BY快,这是一个惊喜。

Group by比Distinct代价更大,因为Group by对结果进行排序,而Distinct则避免排序。但如果你想让group by产生与distinct相同的结果,请给order by null ..

SELECT DISTINCT u.profession FROM users u

等于

SELECT u.profession FROM users u GROUP BY u.profession order by null