在MySQL中，选择DISTINCT或GROUP BY哪个更快?

如果我有一张桌子

CREATE TABLE users (
  id int(10) unsigned NOT NULL auto_increment,
  name varchar(255) NOT NULL,
  profession varchar(255) NOT NULL,
  employer varchar(255) NOT NULL,
  PRIMARY KEY  (id)
)

我想获得所有专业领域的独特价值，什么会更快(或建议):

SELECT DISTINCT u.profession FROM users u

SELECT u.profession FROM users u GROUP BY u.profession

当前回答

如果你有一个关于职业的索引，这两个是同义词。

如果没有，那么使用DISTINCT。

MySQL中的GROUP BY对结果进行排序。你甚至可以这样做:

SELECT u.profession FROM users u GROUP BY u.profession DESC

把你的职业按照DESC的顺序排序。

DISTINCT创建一个临时表并使用它存储副本。GROUP BY执行同样的操作，但随后对不同的结果进行排序。

SELECT DISTINCT u.profession FROM users u

更快，如果你没有职业索引的话。

2009-02-27 14:50:08

其他回答

如果问题允许，请尝试使用EXISTS，因为它被优化为只要找到结果就结束(并且不缓冲任何响应)，因此，如果您只是试图为这样的WHERE子句规范化数据

SELECT FROM SOMETHING S WHERE S.ID IN ( SELECT DISTINCT DCR.SOMETHING_ID FROM DIFF_CARDINALITY_RELATIONSHIP DCR ) -- to keep same cardinality

更快的回答是:

SELECT FROM SOMETHING S WHERE EXISTS ( SELECT 1 FROM DIFF_CARDINALITY_RELATIONSHIP DCR WHERE DCR.SOMETHING_ID = S.ID )

这并不总是可行的，但当可用时，你会看到一个更快的响应。

2014-06-09 19:37:04

下面是一个简单的方法，它将为每个查询打印2个不同的运行时间。

DECLARE @t1 DATETIME;
DECLARE @t2 DATETIME;

SET @t1 = GETDATE();
SELECT DISTINCT u.profession FROM users u; --Query with DISTINCT
SET @t2 = GETDATE();
PRINT 'Elapsed time (ms): ' + CAST(DATEDIFF(millisecond, @t1, @t2) AS varchar);

SET @t1 = GETDATE();
SELECT u.profession FROM users u GROUP BY u.profession; --Query with GROUP BY
SET @t2 = GETDATE();
PRINT 'Elapsed time (ms): ' + CAST(DATEDIFF(millisecond, @t1, @t2) AS varchar);

或尝试设置统计时间(Transact-SQL)

SET STATISTICS TIME ON;
SELECT DISTINCT u.profession FROM users u; --Query with DISTINCT
SELECT u.profession FROM users u GROUP BY u.profession; --Query with GROUP BY
SET STATISTICS TIME OFF;

它简单地显示了解析、编译和执行每条语句所需的毫秒数，如下所示:

 SQL Server Execution Times:
   CPU time = 0 ms,  elapsed time = 2 ms.

2016-06-03 09:56:42

它们本质上是等价的(事实上，这就是一些数据库在底层实现DISTINCT的方式)。

如果其中一个更快，它就是DISTINCT。这是因为，尽管两者是相同的，但查询优化器必须捕获这样一个事实，即GROUP BY没有利用任何组成员，只利用了它们的键。DISTINCT将此显式化，因此可以使用稍微笨一点的优化器。

有疑问的时候，测试一下!

2009-02-24 12:09:22

SELECT DISTINCT总是和GROUP BY一样，或者比GROUP BY更快。在某些系统上(例如Oracle)，对于大多数查询，它可能被优化为与DISTINCT相同。在其他的(如SQL Server)上，它可能要快得多。

2009-02-27 14:55:01

在MySQL中，“Group By”使用了一个额外的步骤:文件排序。我意识到DISTINCT比GROUP BY快，这是一个惊喜。

2014-02-11 18:27:20

在MySQL中，选择DISTINCT或GROUP BY哪个更快?

推荐文章

最新文章

标签