是否可以做一个简单的查询来计算我在一个确定的时间段内有多少记录,比如一年,一个月,或者一天,有一个TIMESTAMP字段,比如:
SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR
甚至:
SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH
每月进行统计。
谢谢!
是否可以做一个简单的查询来计算我在一个确定的时间段内有多少记录,比如一年,一个月,或者一天,有一个TIMESTAMP字段,比如:
SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR
甚至:
SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH
每月进行统计。
谢谢!
当前回答
这里还有一种方法。这使用[MySQL的LAST_DAY()函数][1]将每个时间戳映射到它的月份。如果在record_date上有索引,它还能够通过有效的范围扫描按年进行过滤。
SELECT LAST_DAY(record_date) month_ending, COUNT(*) record_count
FROM stats
WHERE record_date >= '2000-01-01'
AND record_date < '2000-01-01' + INTERVAL 1 YEAR
GROUP BY LAST_DAY(record_date)
如果希望按天计算结果,请使用DATE(record_date)。
如果您希望按日历季度获得结果,请使用YEAR(record_date), quarter (record_date)。
这是一个记录。https://www.plumislandmedia.net/mysql/sql-reporting-time-intervals/ [1]: https://dev.mysql.com/doc/refman/8.0/en/date-and-time-functions.html # function_last-day
其他回答
如果你想获得一个每月统计数据,每个月的行数按最近一个月排序,那么试试这个:
SELECT count(id),
YEAR(record_date),
MONTH(record_date)
FROM `table`
GROUP BY YEAR(record_date),
MONTH(record_date)
ORDER BY YEAR(record_date) DESC,
MONTH(record_date) DESC
如果你的搜索已经超过几年了,你仍然想每月分组,我建议:
版本1:
SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')
版本#2(更有效):
SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)
我在一个大表上比较了这些版本,有1,357,918行(innodb), 第二个版本的效果似乎更好。
版本1(平均执行10次):1.404秒 版本2(平均执行10次):0.780秒
(增加SQL_NO_CACHE键,防止MySQL对查询进行缓存。)
我更喜欢这样优化一年期组的选择:
SELECT COUNT(*)
FROM stats
WHERE record_date >= :year
AND record_date < :year + INTERVAL 1 YEAR;
这样你就可以把年份绑定在一起。'2009',带有命名参数,无需担心添加'-01-01'或单独传入'2010'。
另外,假设我们只是计算行数,id从不为NULL,我更喜欢COUNT(*)而不是COUNT(id)。
如果你想过滤特定年份(例如2000年)的记录,那么优化WHERE子句,如下所示:
SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.
而不是:
WHERE YEAR(date_column) = 2000
-- average 0.132 sec.
结果是根据一个包含300k行和date列索引的表生成的。
至于GROUP BY子句,我根据上面提到的表测试了三个变体;以下是调查结果:
SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.
SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.
SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.
最后一个是赢家。
试试这个
SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)
EXTRACT(unit FROM date)函数更好,因为使用较少的分组,并且函数返回一个数字值。
分组时的比较条件将比DATE_FORMAT函数(返回字符串值)快。尝试使用函数|字段返回非字符串值的SQL比较条件(WHERE, HAVING, ORDER BY, GROUP BY)。