计数（*）与计数（1）-SQL Server

只是想知道你们中是否有人使用Count（1）而不是Count（*），是否在性能上有明显的差异，或者这只是过去几天养成的传统习惯？

特定的数据库是SQL Server 2005。

当前回答

在所有RDBMS中，这两种计数方式在产生什么结果方面是等价的。关于性能，我没有在SQL Server中观察到任何性能差异，但值得指出的是，一些RDBMS，例如PostgreSQL 11，在检查参数表达式的可空性时，COUNT（1）的实现不太理想，如本文所示。

我发现运行以下命令时，1M行的性能差异为10%：

-- Faster
SELECT COUNT(*) FROM t;

-- 10% slower
SELECT COUNT(1) FROM t;

其他回答

我希望优化器能够确保在奇怪的边缘情况之外没有真正的差异。

与任何事情一样，唯一真正的方法就是衡量你的具体情况。

也就是说，我一直使用COUNT（*）。

在SQL Server中，这些语句产生相同的计划。

与流行的观点相反，在甲骨文公司，他们也是如此。

Oracle中的SYS_GUID（）是一个计算密集型函数。

在我的测试数据库中，t_even是一个包含1000000行的表

此查询：

SELECT  COUNT(SYS_GUID())
FROM    t_even

运行48秒，因为函数需要计算返回的每个SYS_GUID（），以确保它不是NULL。

但是，此查询：

SELECT  COUNT(*)
FROM    (
        SELECT  SYS_GUID()
        FROM    t_even
        )

运行仅2秒，因为它甚至不尝试计算SYS_GUID（）（尽管*是COUNT（*）的参数）

随着这个问题一次又一次地出现，这里还有一个答案。我希望在这里为初学者添加一些关于“最佳实践”的内容。

SELECT COUNT（*）FROM something计数记录，这是一项简单的任务。

SELECT COUNT（1）FROM从某个对象中检索每条记录的1，然后对不为空的1进行计数，这实际上是对记录进行计数，只是更复杂。

话虽如此：好的dbms注意到，第二条语句将产生与第一条语句相同的计数，并相应地重新解释它，以免做不必要的工作。因此，通常这两个语句将产生相同的执行计划，并花费相同的时间。

但是，从可读性的角度来看，您应该使用第一条语句。您要计算记录，所以要计算记录而不是表达式。仅当您希望计算某个事件的非空出现时，才使用COUNT（表达式）。

我发现运行以下命令时，1M行的性能差异为10%：

-- Faster
SELECT COUNT(*) FROM t;

-- 10% slower
SELECT COUNT(1) FROM t;

COUNT（*）和COUNT（1）在结果和性能方面是相同的。

推荐文章