我有以下疑问:

select column_name, count(column_name)
from table
group by column_name
having count(column_name) > 1;

如果我将所有对count(column_name)的调用替换为count(*),会有什么不同?

这个问题的灵感来自于如何在Oracle中查找表中的重复值。


为了澄清接受的答案(可能是我的问题),将count(column_name)替换为count(*)将在结果中返回一个额外的行,其中包含null值和列中空值的计数。


当前回答

另一个细微的区别是,在某些数据库实现中,count(*)是通过查看相关表上的索引来计算的,而不是实际的数据行。由于没有指定特定的列,因此不需要考虑实际的行及其值(如果计算特定的列,就会遇到这种情况)。允许数据库使用索引数据比让它计算“真实的”行要快得多。

其他回答

文档中的解释有助于解释这一点:

COUNT(*)返回组中的项数,包括NULL值和重复项。 COUNT(表达式)计算组中每一行的表达式,并返回非空值的数目。

所以count(*)包含空值,其他方法不包含。

另一个细微的区别是,在某些数据库实现中,count(*)是通过查看相关表上的索引来计算的,而不是实际的数据行。由于没有指定特定的列,因此不需要考虑实际的行及其值(如果计算特定的列,就会遇到这种情况)。允许数据库使用索引数据比让它计算“真实的”行要快得多。

正如前面的回答中提到的,Count(*)甚至对NULL列进行计数,而Count(Columnname)仅在列有值时计数。

最好的做法是避免* (Select *, count *,…)

基本上COUNT(*)函数返回表中的所有行,而COUNT(COLUMN_NAME)不返回;也就是说它排除了空值在座的各位也都回答过了。 但最有趣的部分是为了优化查询和数据库,最好使用COUNT(*),除非进行多个计数或复杂的查询,而不是COUNT(COLUMN_NAME)。否则,在处理大量数据时,这会降低您的DB性能。

进一步细化@SQLMeance和@Brannon给出的答案,使用OP提到但@SQLMenace的回答中没有出现的GROUP by子句

CREATE TABLE table1 ( 
id INT 
);
INSERT INTO table1 VALUES 
(1), 
(2), 
(NULL), 
(2), 
(NULL), 
(3), 
(1), 
(4), 
(NULL), 
(2);
SELECT * FROM table1;
+------+
| id   |
+------+
|    1 |
|    2 |
| NULL |
|    2 |
| NULL |
|    3 |
|    1 |
|    4 |
| NULL |
|    2 |
+------+
10 rows in set (0.00 sec)
SELECT id, COUNT(*) FROM table1 GROUP BY id;
+------+----------+
| id   | COUNT(*) |
+------+----------+
|    1 |        2 |
|    2 |        3 |
| NULL |        3 |
|    3 |        1 |
|    4 |        1 |
+------+----------+
5 rows in set (0.00 sec)

这里,COUNT(*)计数每种类型的id(包括NULL)的出现次数

SELECT id, COUNT(id) FROM table1 GROUP BY id;
+------+-----------+
| id   | COUNT(id) |
+------+-----------+
|    1 |         2 |
|    2 |         3 |
| NULL |         0 |
|    3 |         1 |
|    4 |         1 |
+------+-----------+
5 rows in set (0.00 sec)

这里,COUNT(id)计算每种类型的id的出现次数,但不计算NULL的出现次数

SELECT id, COUNT(DISTINCT id) FROM table1 GROUP BY id;
+------+--------------------+
| id   | COUNT(DISTINCT id) |
+------+--------------------+
| NULL |                  0 |
|    1 |                  1 |
|    2 |                  1 |
|    3 |                  1 |
|    4 |                  1 |
+------+--------------------+
5 rows in set (0.00 sec)

这里,COUNT(DISTINCT id)只计算每种类型id的出现次数一次(不计算重复次数),也不计算NULL的出现次数