我有一个2D NumPy数组,想用255.0替换其中大于或等于阈值T的所有值。据我所知,最基本的方法是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255

最简洁和python化的方法是什么? 是否有更快(可能不那么简洁和/或不那么python化)的方法来做到这一点?

这将是人类头部MRI扫描的窗口/水平调整子程序的一部分。2D numpy数组是图像像素数据。


当前回答

你可以考虑使用numpy.putmask:

np.putmask(arr, arr>=T, 255.0)

下面是Numpy内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop

其他回答

你也可以使用&,|(和/或)来获得更大的灵活性:

值在5到10之间:A[(A>5)&(A<10)]

值大于10或小于5:A[(A<5)|(A>10)]

Np.where()工作得很好!

np.where(arr > 255, 255, arr)

例子:

FF = np.array([[0, 0],
              [1, 0],
              [0, 1],
              [1, 1]])
np.where(FF == 1, '+', '-')
Out[]: 
array([['-', '-'],
       ['+', '-'],
       ['-', '+'],
       ['+', '+']], dtype='<U1')

你可以考虑使用numpy.putmask:

np.putmask(arr, arr>=T, 255.0)

下面是Numpy内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop

我认为最快和最简洁的方法是使用NumPy内置的Fancy索引。如果你有一个名为arr的ndarray,你可以用一个值x替换所有>255的元素,如下所示:

arr[arr > 255] = x

我在我的机器上运行了一个500 x 500的随机矩阵,将所有值>0.5替换为5,平均耗时7.59ms。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop

让我们假设您有一个numpy数组,其中包含从0到20的值,并且您想用0替换大于10的数字

import numpy as np

my_arr = np.arange(0,21) # creates an array
my_arr[my_arr > 10] = 0 # modifies the value

请注意,这将修改原始数组,以避免覆盖原始数组,尝试使用arr.copy()来创建一个新的原始数组的分离副本,并修改它。

import numpy as np

my_arr = np.arange(0,21)
my_arr_copy = my_arr.copy() # creates copy of the orignal array

my_arr_copy[my_arr_copy > 10] = 0