计数（*）与计数（1）-SQL Server

只是想知道你们中是否有人使用Count（1）而不是Count（*），是否在性能上有明显的差异，或者这只是过去几天养成的传统习惯？

特定的数据库是SQL Server 2005。

当前回答

我在一个8GB的RAM超级存储箱上对SQL Server 2012进行了快速测试。您可以自己查看结果。在运行这些测试时，我没有运行除SQLServerManagementStudio之外的任何其他窗口应用程序。

我的表架构：

CREATE TABLE [dbo].[employee](
    [Id] [bigint] IDENTITY(1,1) NOT NULL,
    [Name] [nvarchar](50) NOT NULL,
 CONSTRAINT [PK_employee] PRIMARY KEY CLUSTERED 
(
    [Id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]

GO

雇员表中的记录总数：178090131（约1.78亿行）

第一个查询：

Set Statistics Time On
Go    
Select Count(*) From Employee
Go    
Set Statistics Time Off
Go

第一次查询的结果：

 SQL Server parse and compile time: 
 CPU time = 0 ms, elapsed time = 35 ms.

 (1 row(s) affected)

 SQL Server Execution Times:
   CPU time = 10766 ms,  elapsed time = 70265 ms.
 SQL Server parse and compile time: 
   CPU time = 0 ms, elapsed time = 0 ms.

第二个查询：

    Set Statistics Time On
    Go    
    Select Count(1) From Employee
    Go    
    Set Statistics Time Off
    Go

第二次查询的结果：

 SQL Server parse and compile time: 
   CPU time = 14 ms, elapsed time = 14 ms.

(1 row(s) affected)

 SQL Server Execution Times:
   CPU time = 11031 ms,  elapsed time = 70182 ms.
 SQL Server parse and compile time: 
   CPU time = 0 ms, elapsed time = 0 ms.

您可以注意到有83（=70265-70182）毫秒的差异，这很容易归因于运行查询时的确切系统条件。我也做了一次跑步，所以如果我做了几次跑步并做了一些平均，这种差异会变得更准确。如果对于如此庞大的数据集，差异小于100毫秒，那么我们可以很容易地得出结论，这两个查询没有SQL Server引擎表现出的任何性能差异。

注意：在两次运行中，RAM的使用率接近100%。在开始两次运行之前，我重新启动了SQL Server服务。

2016-08-20 03:54:41

其他回答

有一篇文章显示，Oracle上的COUNT（1）只是COUNT的别名（*），并提供了相关证据。

我将引用一些部分：

数据库软件的一部分叫做“Optimizer”，在官方文档中定义为“内置数据库软件，可确定执行SQL语句”。优化器的一个组件叫做“变压器”，其作用是确定重写将原始SQL语句转换为语义等价的SQL语句这可能更有效。您想看看优化器在编写查询时做什么吗使用COUNT（1）？

对于具有ALTER SESSION权限的用户，您可以放置tracefile_identifier，启用优化器跟踪并运行COUNT（1）select，例如：select/*test-1*/COUNT（1，FROM employees；。

之后，您需要本地化跟踪文件，这可以通过SELECT VALUE FROM V$DIAG_INFO WHERE NAME='DIAG trace'；来完成；。稍后在文件中，您将发现：

SELECT COUNT(*) “COUNT(1)” FROM “COURSE”.”EMPLOYEES” “EMPLOYEES”

如您所见，它只是COUNT（*）的别名。

另一个重要的评论是：20年前，在Oracle 7.3之前，COUNT（*）确实更快：

自7.3以来，计数（1）已重写为计数（*），因为Oracle类似自动调整mythic语句。在早期的Oracle7中，oracle必须在确定之前对每一行求值（1），作为函数存在非确定性。20年前，count（*）更快

对于另一个数据库（如SqlServer），应分别对每个数据库进行研究。

我知道这个问题是针对SQL Server的，但SO中关于同一主题的其他问题（没有提到特定的数据库）已关闭，并标记为与此答案重复。

2018-05-16 12:54:01

随着这个问题一次又一次地出现，这里还有一个答案。我希望在这里为初学者添加一些关于“最佳实践”的内容。

SELECT COUNT（*）FROM something计数记录，这是一项简单的任务。

SELECT COUNT（1）FROM从某个对象中检索每条记录的1，然后对不为空的1进行计数，这实际上是对记录进行计数，只是更复杂。

话虽如此：好的dbms注意到，第二条语句将产生与第一条语句相同的计数，并相应地重新解释它，以免做不必要的工作。因此，通常这两个语句将产生相同的执行计划，并花费相同的时间。

但是，从可读性的角度来看，您应该使用第一条语句。您要计算记录，所以要计算记录而不是表达式。仅当您希望计算某个事件的非空出现时，才使用COUNT（表达式）。

2014-05-05 10:43:08

COUNT（*）和COUNT（1）在结果和性能方面是相同的。

2009-08-03 13:10:13

我希望优化器能够确保在奇怪的边缘情况之外没有真正的差异。

与任何事情一样，唯一真正的方法就是衡量你的具体情况。

也就是说，我一直使用COUNT（*）。

2009-08-03 10:17:05

在SQL-92标准中，COUNT（*）特别表示“表表达式的基数”（可以是基表、`VIEW、派生表、CTE等）。

我认为COUNT（*）很容易解析。使用任何其他表达式都需要解析器确保它不引用任何列（COUNT（'a'），其中a是文本，COUNT（a），如果a是列，可以产生不同的结果）。

同样，COUNT（*）可以由熟悉SQL标准的程序员轻松识别，这是一种在使用多个供应商的SQL产品时非常有用的技能。

此外，在特殊情况下，SELECT COUNT（*）FROM MyPersistedTable；，其思想是DBMS可能保存表基数的统计信息。

因此，因为COUNT（1）和COUNT（*）在语义上是等价的，所以我使用COUNT（*）。

2011-05-13 10:36:40

计数（*）与计数（1）-SQL Server

推荐文章

最新文章

标签