在Python中创建按字母顺序排序的列表的最佳方法是什么?
当前回答
老问题了,但如果你想在不设置locale的情况下进行locale感知排序。LC_ALL你可以通过使用以下答案所建议的PyICU库来实现:
import icu # PyICU
def sorted_strings(strings, locale=None):
if locale is None:
return sorted(strings)
collator = icu.Collator.createInstance(icu.Locale(locale))
return sorted(strings, key=collator.getSortKey)
然后用例如:
new_list = sorted_strings(list_of_strings, "de_DE.utf8")
这对我来说很有效,不需要安装任何区域设置或更改其他系统设置。
(这一点已经在上面的评论中提到了,但我想让它更加突出,因为我自己一开始也没有注意到。)
其他回答
list.sort()
真的就是这么简单:)
l =['abc' , 'cd' , 'xy' , 'ba' , 'dc']
l.sort()
print(l1)
结果
['abc', 'ba', 'cd', 'dc', 'xy']
基本的回答:
mylist = ["b", "C", "A"]
mylist.sort()
这将修改您的原始列表(即就地排序)。在不改变原始列表的情况下,使用sorted()函数获得列表的排序副本:
for x in sorted(mylist):
print x
然而,上面的例子有点幼稚,因为它们没有考虑区域设置,而是执行区分大小写的排序。您可以利用可选参数key来指定自定义排序顺序(使用cmp的替代方法是一种已弃用的解决方案,因为它必须计算多次- key只计算每个元素一次)。
因此,要根据当前的语言环境进行排序,考虑到特定于语言的规则(cmp_to_key是functools中的辅助函数):
sorted(mylist, key=cmp_to_key(locale.strcoll))
最后,如果你需要,你可以为排序指定一个自定义区域:
import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']
最后注意:您将看到使用lower()方法的不区分大小写排序的示例-这些是不正确的,因为它们只适用于字符的ASCII子集。对于任何非英语数据,这两个都是错误的:
# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)
但是这是如何处理特定于语言的排序规则的呢?它是否考虑了地区因素?
不是,list.sort()是一个泛型排序函数。如果希望根据Unicode规则进行排序,则必须定义一个自定义排序键函数。您可以尝试使用pyuca模块,但我不知道它是否完整。
值得注意的是sorted()函数:
for x in sorted(list):
print x
这将返回一个新的、排序的列表版本,而不改变原始列表。