我有一个Python对象列表,我想按每个对象的特定属性排序:

>>> ut
[Tag(name="toe", count=10), Tag(name="leg", count=2), ...]

我如何按.count降序排序列表?


# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)

# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)

更多关于按键排序的信息。


向对象类添加丰富的比较运算符,然后使用列表的sort()方法。 参见python中的丰富比较。


更新:虽然这种方法可以工作,但我认为来自tritych的解决方案更适合你的情况,因为更简单。


它看起来很像Django ORM模型实例的列表。

为什么不这样排序呢:

ut = Tag.objects.order_by('-count')

一种最快的方法是使用operator.attrgetter("count"),尤其是当列表中有很多记录时。但是,这可能运行在Python的预操作符版本上,因此最好有一个备用机制。那么,你可能想做以下事情:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it's faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)

读者应该注意到key=方法:

ut.sort(key=lambda x: x.count, reverse=True)

比向对象添加丰富的比较操作符快很多倍。读到这篇文章时我很惊讶(《Python in a Nutshell》第485页)。你可以通过在这个小程序上运行测试来确认这一点:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

我的,非常小的,测试显示第一种排序要慢10倍以上,但书上说它一般只慢5倍左右。他们说的原因是由于python中使用的高度优化的排序算法(timsort)。

然而,.sort(lambda)比普通的.sort()更快,这是非常奇怪的。我希望他们能解决这个问题。


面向对象的方法

将对象排序逻辑(如果适用的话)作为类的一个属性,而不是合并到每个需要排序的实例中,这是一个很好的实践。

这确保了一致性并消除了对样板代码的需要。

至少,你应该为它指定__eq__和__lt__操作。然后使用sorted(list_of_objects)。

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

如果要排序的属性是属性,则可以避免导入操作符。Attrgetter并使用属性的fget方法。

例如,对于一个具有属性半径的类Circle,我们可以按照半径对圆圈列表进行排序,如下所示:

result = sorted(circles, key=Circle.radius.fget)

这并不是最著名的特性,但它常常为我节省一行导入。


此外,如果有人想对包含字符串和数字的列表进行排序。

 eglist=[
     "some0thing3",
     "some0thing2",
     "some1thing2",
     "some1thing0",
     "some3thing10",
     "some3thing2",
     "some1thing1",
     "some0thing1"]

下面是它的代码:

import re

def atoi(text):
    return int(text) if text.isdigit() else text

def natural_keys(text):
    return [ atoi(c) for c in re.split(r'(\d+)', text) ]

eglist=[
         "some0thing3",
         "some0thing2",
         "some1thing2",
         "some1thing0",
         "some3thing10",
         "some3thing2",
         "some1thing1",
         "some0thing1"
]

eglist.sort(key=natural_keys)
print(eglist)