如何在NumPy数组中获得N个最大值的索引?

NumPy提出了一种通过np.argmax获取数组最大值索引的方法。

我想要一个类似的东西，但返回N个最大值的索引。

例如，如果我有一个数组[1,3,2,4,5]，那么nargmax(array, n=3)将返回对应于元素[5,4,3]的下标[4,3,1]。

当前回答

您可以简单地使用字典来查找numpy数组中的前k个值和下标。例如，如果你想找到前2个最大值和索引

import numpy as np
nums = np.array([0.2, 0.3, 0.25, 0.15, 0.1])


def TopK(x, k):
    a = dict([(i, j) for i, j in enumerate(x)])
    sorted_a = dict(sorted(a.items(), key = lambda kv:kv[1], reverse=True))
    indices = list(sorted_a.keys())[:k]
    values = list(sorted_a.values())[:k]
    return (indices, values)

print(f"Indices: {TopK(nums, k = 2)[0]}")
print(f"Values: {TopK(nums, k = 2)[1]}")


Indices: [1, 2]
Values: [0.3, 0.25]

2021-08-25 19:15:07

其他回答

如果你碰巧在使用一个多维数组，那么你需要平展和解开索引:

def largest_indices(ary, n):
    """Returns the n largest indices from a numpy array."""
    flat = ary.flatten()
    indices = np.argpartition(flat, -n)[-n:]
    indices = indices[np.argsort(-flat[indices])]
    return np.unravel_index(indices, ary.shape)

例如:

>>> xs = np.sin(np.arange(9)).reshape((3, 3))
>>> xs
array([[ 0.        ,  0.84147098,  0.90929743],
       [ 0.14112001, -0.7568025 , -0.95892427],
       [-0.2794155 ,  0.6569866 ,  0.98935825]])
>>> largest_indices(xs, 3)
(array([2, 0, 0]), array([2, 2, 1]))
>>> xs[largest_indices(xs, 3)]
array([ 0.98935825,  0.90929743,  0.84147098])

2016-08-10 21:42:27

较新的NumPy版本(1.8及以上)有一个名为argpartition的函数。要得到四个最大元素的索引，请执行以下操作

>>> a = np.array([9, 4, 4, 3, 3, 9, 0, 4, 6, 0])
>>> a
array([9, 4, 4, 3, 3, 9, 0, 4, 6, 0])

>>> ind = np.argpartition(a, -4)[-4:]
>>> ind
array([1, 5, 8, 0])

>>> top4 = a[ind]
>>> top4
array([4, 9, 6, 9])

与argsort不同，这个函数在最坏的情况下以线性时间运行，但返回的索引没有排序，这可以从求值a[ind]的结果中看出。如果你也需要，那就把它们分类:

>>> ind[np.argsort(a[ind])]
array([1, 8, 5, 0])

以这种方式获得排在前k位的元素需要O(n + k log k)时间。

2014-05-19 09:32:20

这段代码适用于numpy 2D矩阵数组:

mat = np.array([[1, 3], [2, 5]]) # numpy matrix
 
n = 2  # n
n_largest_mat = np.sort(mat, axis=None)[-n:] # n_largest 
tf_n_largest = np.zeros((2,2), dtype=bool) # all false matrix
for x in n_largest_mat: 
  tf_n_largest = (tf_n_largest) | (mat == x) # true-false  

n_largest_elems = mat[tf_n_largest] # true-false indexing

这将产生一个true-false的n_maximum矩阵索引，也可以从矩阵数组中提取n_maximum元素

2019-10-23 04:28:40

方法np。Argpartition只返回k个最大的索引，执行局部排序，比np快。当数组相当大时，Argsort(执行完全排序)。但是返回的索引不是升序或降序。让我们举个例子:

我们可以看到如果你想要一个严格的升序前k个指标，np。Argpartition不会返回你想要的。

除了在np后手动进行排序。argpartition，我的解决方案是使用PyTorch, torch。topk，一个神经网络构建工具，提供numpy类api，同时支持CPU和GPU。它和NumPy的MKL一样快，如果你需要大型矩阵/向量计算，它还提供了GPU的提升。

严格的上升/下降上k指数代码将是:

注意那个火炬。topk接受一个torch张量，并返回torch. tensor类型的topk值和topk索引。与np、torch类似。Topk还接受轴参数，以便处理多维数组/张量。

2018-01-25 05:00:29

Use:

from operator import itemgetter
from heapq import nlargest
result = nlargest(N, enumerate(your_list), itemgetter(1))

现在，结果列表将包含N个元组(index, value)，其中value是最大的。

2016-04-17 10:06:35

如何在NumPy数组中获得N个最大值的索引?

推荐文章

最新文章

标签