SQL仅选择列上具有最大值的行

我有一张文件表（此处为简化版）：

id	rev	content
1	1	...
2	1	...
1	2	...
1	3	...

如何为每个id选择一行，并且仅选择最大的rev？对于上面的数据，结果应该包含两行：[1，3，…]和[2，1，…]。我使用的是MySQL。

目前，我在while循环中使用检查来检测和重写结果集中的旧版本。但这是实现结果的唯一方法吗？没有SQL解决方案吗？

当前回答

我惊讶地发现，没有答案提供SQL窗口函数解决方案：

SELECT a.id, a.rev, a.contents
  FROM (SELECT id, rev, contents,
               ROW_NUMBER() OVER (PARTITION BY id ORDER BY rev DESC) ranked_order
          FROM YourTable) a
 WHERE a.ranked_order = 1

在SQL标准ANSI/ISO标准SQL:2003中添加了窗口（或窗口）功能，后来又用ANSI/ISO标准SQL：2008进行了扩展。有更多类型的秩函数可用于处理平局问题：rank、DENSE_rank、PERSENT_rank。

2016-08-09 15:29:17

其他回答

唯一标识符？对唯一标识符！

开发MySQL数据库的最佳方法之一是使用每个id AUTOINCREMENT（SourceMySQL.com）。这有很多优点，这里无法介绍。这个问题的问题是它的示例有重复的id。这忽视了唯一标识符的这些巨大优势，同时也让熟悉这一点的人感到困惑。

最清洁的解决方案

数据库Fiddle

较新版本的MySQL默认情况下启用了ONLY_FUL_GROUP_BY，这里的许多解决方案在测试中都会失败。

即使如此，我们也可以简单地选择DISTINCT someuniquefield、MAX（要选择的任何其他字段）、（*somethirdfield）等，而不必担心会了解结果或查询的工作方式：

SELECT DISTINCT t1.id, MAX(t1.rev), MAX(t2.content)
FROM Table1 AS t1
JOIN Table1 AS t2 ON t2.id = t1.id AND t2.rev = (
    SELECT MAX(rev) FROM Table1 t3 WHERE t3.id = t1.id
)
GROUP BY t1.id;

SELECT DISTINCT Table1.id，max（Table1.rev），max（Table2.content）：返回DISTINCT somefield，max（）某个其他字段，最后一个max（）是多余的，因为我知道它只是一行，但查询需要它。FROM雇员：在上搜索了表。JOIN Table1 AS Table2 ON Table2.rev=Table1.rev：在第一个表上加入第二个表，因为我们需要得到max（Table1.rev）的注释。GROUP BY Table1.id：强制将每个员工的排名靠前的薪资行作为返回结果。

请注意，由于OP的问题中“内容”是“…”，因此无法测试这是否有效。因此，我将其更改为“..a”，“..b”，因此，我们现在可以看到结果是正确的：

id  max(Table1.rev) max(Table2.content)
1   3   ..d
2   1   ..b

为什么它是干净的？DISTINCT（）、MAX（）等都很好地利用了MySQL索引。这会更快。或者，如果您有索引，并将其与查看所有行的查询进行比较，则速度会快得多。

原始解决方案

在ONLY_FUL_GROUP_BY被禁用的情况下，我们仍然可以使用GROUP BY，但是我们只在Salary上使用它，而不在id上使用它：

SELECT *
FROM
    (SELECT *
    FROM Employee
    ORDER BY Salary DESC)
AS employeesub
GROUP BY employeesub.Salary;

SELECT*：返回所有字段。FROM雇员：在上搜索了表。（SELECT*…）子查询：返回所有人员，按薪资排序。GROUP BY employeesub。Salary：强制将每个员工的顶部排序的Salary行作为返回结果。

唯一行解决方案

请注意关系数据库的定义：“表中的每一行都有自己的唯一键。”这意味着，在问题的示例中，id必须是唯一的，在这种情况下，我们可以这样做：

SELECT *
FROM Employee
WHERE Employee.id = 12345
ORDER BY Employee.Salary DESC
LIMIT 1

希望这是一个解决问题的解决方案，帮助每个人更好地了解数据库中发生的事情。

2016-09-14 00:28:36

另一种解决方案是使用相关子查询：

select yt.id, yt.rev, yt.contents
    from YourTable yt
    where rev = 
        (select max(rev) from YourTable st where yt.id=st.id)

在（id，rev）上设置索引几乎可以将子查询呈现为一个简单的查找。。。

以下是与@AdrianCarneiro的答案（subquery，leftjoin）中的解决方案的比较，基于MySQL的测量结果，InnoDB表的记录约为100万条，组大小为：1-3。

虽然对于全表扫描，子查询/左连接/相关定时彼此之间的关系为6/8/9，但当涉及到直接查找或批处理（（1，2，3）中的id）时，子查询比其他查询慢得多（由于重新运行子查询）。然而，我无法在速度上区分左连接和相关解决方案。

最后一点，当leftjoin在组中创建n*（n+1）/2个连接时，它的性能会受到组大小的严重影响。。。

2014-01-23 14:16:11

我喜欢使用基于NOT EXIST的解决方案来解决这个问题：

SELECT 
  id, 
  rev
  -- you can select other columns here
FROM YourTable t
WHERE NOT EXISTS (
   SELECT * FROM YourTable t WHERE t.id = id AND rev > t.rev
)

这将选择组中具有最大值的所有记录，并允许您选择其他列。

2014-09-05 21:58:28

这是另一个解决方案，希望它能帮助某人

Select a.id , a.rev, a.content from Table1 a
inner join 
(SELECT id, max(rev) rev FROM Table1 GROUP BY id) x on x.id =a.id and x.rev =a.rev

2017-06-20 10:10:35

下面是另一个解决方案，用于仅检索具有该字段最大值的字段的记录。这适用于我工作的平台SQL400。在本例中，字段FIELD5中具有最大值的记录将由以下SQL语句检索。

SELECT A.KEYFIELD1, A.KEYFIELD2, A.FIELD3, A.FIELD4, A.FIELD5
  FROM MYFILE A
 WHERE RRN(A) IN
   (SELECT RRN(B) 
      FROM MYFILE B
     WHERE B.KEYFIELD1 = A.KEYFIELD1 AND B.KEYFIELD2 = A.KEYFIELD2
     ORDER BY B.FIELD5 DESC
     FETCH FIRST ROW ONLY)

2017-10-16 23:48:32

SQL仅选择列上具有最大值的行

推荐文章

最新文章

标签