为另一列的每个不同值获取某列的Max值的行

表:

UserId, Value, Date.

我想获得UserId，为每个UserId的最大值(日期)的值。也就是说，具有最新日期的每个UserId的值。有没有一种方法可以在SQL中简单地做到这一点?(最好是Oracle)

更新:为任何歧义道歉:我需要得到所有的用户id。但是对于每个UserId，只有该用户拥有最新日期的行。

当前回答

这将检索my_date列值等于该用户id的my_date最大值的所有行。这可能会为最大日期位于多行上的用户id检索多行。

select userid,
       my_date,
       ...
from
(
select userid,
       my_date,
       ...
       max(my_date) over (partition by userid) max_my_date
from   users
)
where my_date = max_my_date

“解析函数摇滚”

编辑:关于第一条评论……

“使用分析查询和自连接违背了分析查询的目的”

这段代码中没有自连接。相反，在包含分析函数的内联视图的结果上放置了一个谓词——这是非常不同的事情，完全是标准的实践。

Oracle的默认窗口是从分区的第一行到当前一行

加窗条款仅适用于存在按顺序条款的情况。如果没有按子句排序，默认情况下就不会应用任何窗口子句，也不能显式地指定任何窗口子句。

代码可以工作。

2008-09-23 14:41:11

其他回答

我没有Oracle来测试它，但最有效的解决方案是使用分析查询。它应该看起来像这样:

SELECT DISTINCT
    UserId
  , MaxValue
FROM (
    SELECT UserId
      , FIRST (Value) Over (
          PARTITION BY UserId
          ORDER BY Date DESC
        ) MaxValue
    FROM SomeTable
  )

我怀疑您可以摆脱外部查询，并在内部放置distinct，但我不确定。与此同时，我知道这招管用。

如果您想了解分析查询，我建议您阅读http://www.orafaq.com/node/55和http://www.akadia.com/services/ora_analytic_functions.html。这是一个简短的总结。

在底层，分析查询对整个数据集进行排序，然后按顺序进行处理。当你处理它的时候，你根据特定的标准对数据集进行分区，然后对每一行查看一些窗口(默认为当前行分区中的第一个值-默认也是最有效的)，并可以使用许多分析函数(其列表非常类似于聚合函数)计算值。

在本例中，下面是内部查询的功能。整个数据集先按UserId排序，再按Date DESC排序，然后一次处理。对于每一行，您返回UserId和该UserId看到的第一个日期(因为日期是按DESC排序的，所以这是最大日期)。这就得到了重复行的答案。然后外部的DISTINCT压缩重复项。

这并不是一个特别引人注目的分析查询示例。如果想获得更大的胜利，可以考虑制作一张财务收据表格，计算每个用户和收据的总花费。分析查询可以有效地解决这个问题。其他解决方案效率较低。这就是为什么它们是2003 SQL标准的一部分。(不幸的是Postgres还没有。叽阿…)

2008-09-23 15:47:54

难道一个qualified子句不是既简单又最好吗?

select userid, my_date, ...
from users
qualify rank() over (partition by userid order by my_date desc) = 1

对于上下文，在Teradata这里一个像样的大小测试运行在17秒与这个合格版本和在23秒与“内联视图”/Aldridge解决方案#1。

2011-10-19 16:17:08

我想这应该有用吧?

Select
T1.UserId,
(Select Top 1 T2.Value From Table T2 Where T2.UserId = T1.UserId Order By Date Desc) As 'Value'
From
Table T1
Group By
T1.UserId
Order By
T1.UserId

2008-09-23 15:05:01

我想是这样的。(请原谅我的语法错误;在这一点上，我习惯使用HQL !)

编辑:也误解了问题!修正了查询…

SELECT UserId, Value
FROM Users AS user
WHERE Date = (
    SELECT MAX(Date)
    FROM Users AS maxtest
    WHERE maxtest.UserId = user.UserId
)

2008-09-23 14:36:59

只是需要在工作中写一个“活”的例子:)

它支持在同一日期为UserId设置多个值。

列: 用户id，值，日期

SELECT
   DISTINCT UserId,
   MAX(Date) OVER (PARTITION BY UserId ORDER BY Date DESC),
   MAX(Values) OVER (PARTITION BY UserId ORDER BY Date DESC)
FROM
(
   SELECT UserId, Date, SUM(Value) As Values
   FROM <<table_name>>
   GROUP BY UserId, Date
)

您可以使用FIRST_VALUE而不是MAX，并在解释计划中查找它。我没有时间玩它。

当然，如果搜索巨大的表，在查询中使用FULL提示可能会更好。

2010-06-29 13:45:48

为另一列的每个不同值获取某列的Max值的行

推荐文章

最新文章

标签