在多个列上计数DISTINCT

是否有更好的方法来执行这样的查询:

SELECT COUNT(*) 
FROM (SELECT DISTINCT DocumentId, DocumentSessionId
      FROM DocumentOutputItems) AS internalQuery

我需要数一下这个表中不同项的数量，但不同项超过两列。

我的查询工作得很好，但我想知道我是否可以只使用一个查询(不使用子查询)得到最终结果

当前回答

一些SQL数据库可以使用元组表达式，所以你可以这样做:

SELECT COUNT(DISTINCT (DocumentId, DocumentSessionId))
      FROM DocumentOutputItems;

如果你的数据库不支持这个，可以根据@oncel-umut-的建议来模拟CHECKSUM或其他提供良好唯一性的标量函数。 COUNT(DISTINCT CONCAT(documententid， ':'， DocumentSessionId)))。

MySQL特别支持COUNT(DISTINCT expr, expr，…)，这是非sql标准语法。它还指出，在标准SQL中，您必须在COUNT(DISTINCT…)中对所有表达式进行连接。

元组的一个相关用法是执行IN查询，例如:

SELECT * FROM DocumentOutputItems
WHERE (DocumentId, DocumentSessionId) in (('a', '1'), ('b', '2'));

其他回答

下面是不带subselect的简短版本:

SELECT COUNT(DISTINCT DocumentId, DocumentSessionId) FROM DocumentOutputItems

它在MySQL中工作得很好，我认为优化器更容易理解这一点。

编辑:显然我误解了MSSQL和MySQL -对不起，但也许它有帮助。

你可以使用Count函数两次。

在这种情况下，它将是:

SELECT COUNT (DISTINCT DocumentId), COUNT (DISTINCT DocumentSessionId) 
FROM DocumentOutputItems

如果你只有一个字段可以“DISTINCT”，你可以使用:

SELECT COUNT(DISTINCT DocumentId) 
FROM DocumentOutputItems

并且返回与原始的相同的查询计划，正如SET SHOWPLAN_ALL ON测试的那样。然而，你正在使用两个字段，所以你可以尝试一些疯狂的东西，如:

    SELECT COUNT(DISTINCT convert(varchar(15),DocumentId)+'|~|'+convert(varchar(15), DocumentSessionId)) 
    FROM DocumentOutputItems

但如果涉及到null，就会出现问题。我还是用原来的问题吧。

当我在谷歌上搜索我自己的问题时，发现如果你计算DISTINCT对象，你会得到正确的返回数(我使用MySQL)

SELECT COUNT(DISTINCT DocumentID) AS Count1, 
  COUNT(DISTINCT DocumentSessionId) AS Count2
  FROM DocumentOutputItems

比如:

select count(*)
from
  (select count(*) cnt
   from DocumentOutputItems
   group by DocumentId, DocumentSessionId) t1

可能只是做了和你已经做的一样的事情，但是它避免了DISTINCT。

推荐文章