我理解GROUP BY x的观点。

但GROUP BY x,y是如何工作的,它意味着什么?


当前回答

这里我不仅要解释GROUP子句的用法,还要解释Aggregate函数的用法。

GROUP BY子句与聚合函数一起使用,以按一列或多列对结果集进行分组。例如。:

-- GROUP BY with one parameter:
SELECT column_name, AGGREGATE_FUNCTION(column_name)
FROM table_name
WHERE column_name operator value
GROUP BY column_name;

-- GROUP BY with two parameters:
SELECT
    column_name1,
    column_name2,
    AGGREGATE_FUNCTION(column_name3)
FROM
    table_name
GROUP BY
    column_name1,
    column_name2;

记住以下顺序:

SELECT(用于从数据库中选择数据)FROM(子句用于列出表)WHERE(子句用于过滤记录)GROUP BY(子句可以在SELECT语句中用于收集数据跨多个记录并按一列或多列对结果进行分组)HAVING(子句与GROUP BY子句一起使用将返回的行组限制为仅满足以下条件的行为TRUE)ORDER BY(关键字用于对结果集排序)

如果使用的是聚合函数,则可以使用所有这些函数,这是必须设置它们的顺序,否则可能会出现错误。

聚合函数包括:

MIN()返回给定列中的最小值MAX()返回给定列中的最大值。SUM()返回给定列中数值的和AVG()返回给定列的平均值COUNT()返回给定列中的值总数COUNT(*)返回表中的行数

有关使用聚合函数的SQL脚本示例:

假设我们需要找到总销售额大于950美元的销售订单。我们结合HAVING子句和GROUP BY子句来实现这一点:

SELECT 
    orderId, SUM(unitPrice * qty) Total
FROM
    OrderDetails
GROUP BY orderId
HAVING Total > 950;

统计所有订单并将其分组为customerID,并对结果进行排序。我们结合了COUNT函数和GROUP BY、ORDER BY子句以及ASC:

SELECT 
    customerId, COUNT(*)
FROM
    Orders
GROUP BY customerId
ORDER BY COUNT(*) ASC;

使用AVG函数结合GROUP BY和HAVING子句检索平均单价大于10美元的类别:

SELECT 
    categoryName, AVG(unitPrice)
FROM
    Products p
INNER JOIN
    Categories c ON c.categoryId = p.categoryId
GROUP BY categoryName
HAVING AVG(unitPrice) > 10;

使用子查询中的MIN函数按每个类别获取较便宜的产品:

SELECT categoryId,
       productId,
       productName,
       unitPrice
FROM Products p1
WHERE unitPrice = (
                SELECT MIN(unitPrice)
                FROM Products p2
                WHERE p2.categoryId = p1.categoryId)

下面将向您展示如何在子查询中使用MAX函数选择最新的日期项“productDate”:

SELECT categoryId,
       productId,
       productName,
       unitPrice,
       productDate
FROM Products p1
WHERE productDate= (
                  SELECT MAX(productDate) 
                  FROM Products p2
                  WHERE p2.categoryId = p1.categoryId)

以下语句将categoryId和productId列中具有相同值的行分组:

SELECT 
    categoryId, categoryName, productId, SUM(unitPrice)
FROM
    Products p
INNER JOIN
    Categories c ON c.categoryId = p.categoryId
GROUP BY categoryId, productId

其他回答

用两个参数的GROUPBY的简单英语,我们要做的是寻找相似的值对,并将计数设置为第三列。

查看以下示例以供参考。这里我使用的是1872年至2020年的国际足球比赛成绩

+----------+----------------+--------+---+---+--------+---------+-------------------+-----+
|       _c0|             _c1|     _c2|_c3|_c4|     _c5|      _c6|                _c7|  _c8|
+----------+----------------+--------+---+---+--------+---------+-------------------+-----+
|1872-11-30|        Scotland| England|  0|  0|Friendly|  Glasgow|           Scotland|FALSE|
|1873-03-08|         England|Scotland|  4|  2|Friendly|   London|            England|FALSE|
|1874-03-07|        Scotland| England|  2|  1|Friendly|  Glasgow|           Scotland|FALSE|
|1875-03-06|         England|Scotland|  2|  2|Friendly|   London|            England|FALSE|
|1876-03-04|        Scotland| England|  3|  0|Friendly|  Glasgow|           Scotland|FALSE|
|1876-03-25|        Scotland|   Wales|  4|  0|Friendly|  Glasgow|           Scotland|FALSE|
|1877-03-03|         England|Scotland|  1|  3|Friendly|   London|            England|FALSE|
|1877-03-05|           Wales|Scotland|  0|  2|Friendly|  Wrexham|              Wales|FALSE|
|1878-03-02|        Scotland| England|  7|  2|Friendly|  Glasgow|           Scotland|FALSE|
|1878-03-23|        Scotland|   Wales|  9|  0|Friendly|  Glasgow|           Scotland|FALSE|
|1879-01-18|         England|   Wales|  2|  1|Friendly|   London|            England|FALSE|
|1879-04-05|         England|Scotland|  5|  4|Friendly|   London|            England|FALSE|
|1879-04-07|           Wales|Scotland|  0|  3|Friendly|  Wrexham|              Wales|FALSE|
|1880-03-13|        Scotland| England|  5|  4|Friendly|  Glasgow|           Scotland|FALSE|
|1880-03-15|           Wales| England|  2|  3|Friendly|  Wrexham|              Wales|FALSE|
|1880-03-27|        Scotland|   Wales|  5|  1|Friendly|  Glasgow|           Scotland|FALSE|
|1881-02-26|         England|   Wales|  0|  1|Friendly|Blackburn|            England|FALSE|
|1881-03-12|         England|Scotland|  1|  6|Friendly|   London|            England|FALSE|
|1881-03-14|           Wales|Scotland|  1|  5|Friendly|  Wrexham|              Wales|FALSE|
|1882-02-18|Northern Ireland| England|  0| 13|Friendly|  Belfast|Republic of Ireland|FALSE|
+----------+----------------+--------+---+---+--------+---------+-------------------+-----+

现在我将通过GROUPBY操作按类似的国家(列_c7)和锦标赛(列_c5)值对分组,

SELECT `_c5`,`_c7`,count(*)  FROM res GROUP BY `_c5`,`_c7`

+--------------------+-------------------+--------+
|                 _c5|                _c7|count(1)|
+--------------------+-------------------+--------+
|            Friendly|  Southern Rhodesia|      11|
|            Friendly|            Ecuador|      68|
|African Cup of Na...|           Ethiopia|      41|
|Gold Cup qualific...|Trinidad and Tobago|       9|
|AFC Asian Cup qua...|             Bhutan|       7|
|African Nations C...|              Gabon|       2|
|            Friendly|           China PR|     170|
|FIFA World Cup qu...|             Israel|      59|
|FIFA World Cup qu...|              Japan|      61|
|UEFA Euro qualifi...|            Romania|      62|
|AFC Asian Cup qua...|              Macau|       9|
|            Friendly|        South Sudan|       1|
|CONCACAF Nations ...|           Suriname|       3|
|         Copa Newton|          Argentina|      12|
|            Friendly|        Philippines|      38|
|FIFA World Cup qu...|              Chile|      68|
|African Cup of Na...|         Madagascar|      29|
|FIFA World Cup qu...|       Burkina Faso|      30|
| UEFA Nations League|            Denmark|       4|
|        Atlantic Cup|           Paraguay|       2|
+--------------------+-------------------+--------+

解说:第一排的意思是在南罗得西亚总共举行了11场友谊赛。

注意:在这种情况下,必须使用计数器列。

这里我不仅要解释GROUP子句的用法,还要解释Aggregate函数的用法。

GROUP BY子句与聚合函数一起使用,以按一列或多列对结果集进行分组。例如。:

-- GROUP BY with one parameter:
SELECT column_name, AGGREGATE_FUNCTION(column_name)
FROM table_name
WHERE column_name operator value
GROUP BY column_name;

-- GROUP BY with two parameters:
SELECT
    column_name1,
    column_name2,
    AGGREGATE_FUNCTION(column_name3)
FROM
    table_name
GROUP BY
    column_name1,
    column_name2;

记住以下顺序:

SELECT(用于从数据库中选择数据)FROM(子句用于列出表)WHERE(子句用于过滤记录)GROUP BY(子句可以在SELECT语句中用于收集数据跨多个记录并按一列或多列对结果进行分组)HAVING(子句与GROUP BY子句一起使用将返回的行组限制为仅满足以下条件的行为TRUE)ORDER BY(关键字用于对结果集排序)

如果使用的是聚合函数,则可以使用所有这些函数,这是必须设置它们的顺序,否则可能会出现错误。

聚合函数包括:

MIN()返回给定列中的最小值MAX()返回给定列中的最大值。SUM()返回给定列中数值的和AVG()返回给定列的平均值COUNT()返回给定列中的值总数COUNT(*)返回表中的行数

有关使用聚合函数的SQL脚本示例:

假设我们需要找到总销售额大于950美元的销售订单。我们结合HAVING子句和GROUP BY子句来实现这一点:

SELECT 
    orderId, SUM(unitPrice * qty) Total
FROM
    OrderDetails
GROUP BY orderId
HAVING Total > 950;

统计所有订单并将其分组为customerID,并对结果进行排序。我们结合了COUNT函数和GROUP BY、ORDER BY子句以及ASC:

SELECT 
    customerId, COUNT(*)
FROM
    Orders
GROUP BY customerId
ORDER BY COUNT(*) ASC;

使用AVG函数结合GROUP BY和HAVING子句检索平均单价大于10美元的类别:

SELECT 
    categoryName, AVG(unitPrice)
FROM
    Products p
INNER JOIN
    Categories c ON c.categoryId = p.categoryId
GROUP BY categoryName
HAVING AVG(unitPrice) > 10;

使用子查询中的MIN函数按每个类别获取较便宜的产品:

SELECT categoryId,
       productId,
       productName,
       unitPrice
FROM Products p1
WHERE unitPrice = (
                SELECT MIN(unitPrice)
                FROM Products p2
                WHERE p2.categoryId = p1.categoryId)

下面将向您展示如何在子查询中使用MAX函数选择最新的日期项“productDate”:

SELECT categoryId,
       productId,
       productName,
       unitPrice,
       productDate
FROM Products p1
WHERE productDate= (
                  SELECT MAX(productDate) 
                  FROM Products p2
                  WHERE p2.categoryId = p1.categoryId)

以下语句将categoryId和productId列中具有相同值的行分组:

SELECT 
    categoryId, categoryName, productId, SUM(unitPrice)
FROM
    Products p
INNER JOIN
    Categories c ON c.categoryId = p.categoryId
GROUP BY categoryId, productId

按X分组意味着将X值相同的所有分组放在一个组中。

按X、Y分组意味着将X和Y值相同的所有分组放在一个组中。

为了用一个例子来说明,假设我们有下表,与谁在大学学习什么科目有关:

Table: Subject_Selection

+---------+----------+----------+
| Subject | Semester | Attendee |
+---------+----------+----------+
| ITB001  |        1 | John     |
| ITB001  |        1 | Bob      |
| ITB001  |        1 | Mickey   |
| ITB001  |        2 | Jenny    |
| ITB001  |        2 | James    |
| MKB114  |        1 | John     |
| MKB114  |        1 | Erica    |
+---------+----------+----------+

仅在主题列上使用分组依据时;说:

select Subject, Count(*)
from Subject_Selection
group by Subject

您将得到以下内容:

+---------+-------+
| Subject | Count |
+---------+-------+
| ITB001  |     5 |
| MKB114  |     2 |
+---------+-------+

…因为ITB001有5个条目,MKB114有2个条目

如果我们按两列分组:

select Subject, Semester, Count(*)
from Subject_Selection
group by Subject, Semester

我们会得到:

+---------+----------+-------+
| Subject | Semester | Count |
+---------+----------+-------+
| ITB001  |        1 |     3 |
| ITB001  |        2 |     2 |
| MKB114  |        1 |     2 |
+---------+----------+-------+

这是因为,当我们按两列进行分组时,它表示“将它们分组,以便所有具有相同主题和学期的人都在同一组中,然后计算每个组的所有聚合函数(Count、Sum、Average等)”。在本例中,这一点可以通过以下事实得到证明:当我们计算他们时,第一学期有三个人在做ITB001,第二学期有两个人在做。两个做MKB114的人都在第一学期,所以第二学期没有排(“MKB114,第二学期”组中没有数据)

希望这是合理的。