我有一个数字列表:

myList = [1, 2, 3, 100, 5]

现在如果我对这个列表进行排序得到[1,2,3,5,100]。 我想要的是元素的下标 原始列表的排序顺序,即[0,1,2,4,3] ——ala MATLAB的排序函数,返回两者 值和索引。


当前回答

其他答案都是错误的。

运行一次argsort并不是解决方案。 例如,以下代码:

import numpy as np
x = [3,1,2]
np.argsort(x)

生成数组([1,2,0],dtype=int64),这不是我们想要的。

答案应该是运行argsort两次:

import numpy as np
x = [3,1,2]
np.argsort(np.argsort(x))

按预期给出数组([2,0,1],dtype=int64)。

其他回答

s = [2, 3, 1, 4, 5]
print([sorted(s, reverse=False).index(val) for val in s]) 

对于一个有重复元素的列表,它将返回不带联系的秩,例如。

s = [2, 2, 1, 4, 5]
print([sorted(s, reverse=False).index(val) for val in s]) 

返回

[1, 1, 0, 3, 4]

将numpy导入为np

对指数

S=[11,2,44,55,66,0,10,3,33]

r=np.argsort(S)

[output]=array([5, 1, 7, 6, 0, 8, 2, 3, 4])

argsort按顺序返回S的索引

价值

np.sort(S)

[output]=array([ 0,  2,  3, 10, 11, 33, 44, 55, 66])

其他答案都是错误的。

运行一次argsort并不是解决方案。 例如,以下代码:

import numpy as np
x = [3,1,2]
np.argsort(x)

生成数组([1,2,0],dtype=int64),这不是我们想要的。

答案应该是运行argsort两次:

import numpy as np
x = [3,1,2]
np.argsort(np.argsort(x))

按预期给出数组([2,0,1],dtype=int64)。

RustyRob答案的一个变体(它已经是最高性能的纯Python解决方案),当你排序集合时可能会更好:

不是一个序列(例如,它是一个集合,并且有一个合理的理由希望索引对应于迭代器必须前进多远才能到达项目),或者 是一个没有O(1)索引的序列(在Python包含的电池中,collections.deque是一个显著的例子)

情况#1不太可能有用,但情况#2更可能有意义。无论哪种情况,你都有两个选择:

转换为列表/元组并使用转换后的版本,或 使用基于迭代顺序分配键的技巧

这个答案为第2点提供了解决方案。请注意,它不能保证按照语言标准工作;该语言表示每个键将被计算一次,但不表示它们的计算顺序。到目前为止,在CPython(引用解释器)的每个版本中,它都是按照从头到尾的顺序预先计算的,所以这是可行的,但请注意,这并不能保证。在任何情况下,代码是:

sizediterable = ...
sorted_indices = sorted(range(len(sizediterable)), key=lambda _, it=iter(sizediterable): next(it))

All that does is provide a key function that ignores the value it's given (an index) and instead provides the next item from an iterator preconstructed from the original container (cached as a defaulted argument to allow it to function as a one-liner). As a result, for something like a large collections.deque, where using its .__getitem__ involves O(n) work (and therefore computing all the keys would involve O(n²) work), sequential iteration remains O(1), so generating the keys remains just O(n).

如果您需要使用内置类型来保证语言标准的工作,Roman的解决方案将具有与此解决方案相同的算法效率(因为它们都不依赖于索引原始容器的算法效率)。

需要明确的是,对于collections.deque的建议用例,deque必须非常大;Deques有一个相当大的常量除数用于索引,所以只有真正巨大的才会有问题。当然,出于同样的原因,如果输入比较小/便宜,排序的成本是非常小的,所以如果输入足够大,有效的排序很重要,那么它们也足够大,有效的索引也很重要。

我用perfplot(我的一个项目)快速检查了这些功能的性能,发现很难推荐其他功能

np.argsort(x)

(注意对数刻度):


代码重现情节:

import perfplot
import numpy as np


def sorted_enumerate(seq):
    return [i for (v, i) in sorted((v, i) for (i, v) in enumerate(seq))]


def sorted_enumerate_key(seq):
    return [x for x, y in sorted(enumerate(seq), key=lambda x: x[1])]


def sorted_range(seq):
    return sorted(range(len(seq)), key=seq.__getitem__)


b = perfplot.bench(
    setup=np.random.rand,
    kernels=[sorted_enumerate, sorted_enumerate_key, sorted_range, np.argsort],
    n_range=[2 ** k for k in range(15)],
    xlabel="len(x)",
)
b.save("out.png")