比较两个NumPy数组相等性的最简单方法是什么(其中相等性定义为:A = B iff对于所有索引i: A[i] == B[i])?
简单地使用==给我一个布尔数组:
>>> numpy.array([1,1,1]) == numpy.array([1,1,1])
array([ True, True, True], dtype=bool)
我是否需要和这个数组的元素来确定数组是否相等,或者有更简单的比较方法吗?
比较两个NumPy数组相等性的最简单方法是什么(其中相等性定义为:A = B iff对于所有索引i: A[i] == B[i])?
简单地使用==给我一个布尔数组:
>>> numpy.array([1,1,1]) == numpy.array([1,1,1])
array([ True, True, True], dtype=bool)
我是否需要和这个数组的元素来确定数组是否相等,或者有更简单的比较方法吗?
当前回答
为了完整起见。我将添加 比较两个数组的Pandas方法:
import numpy as np
a = np.arange(0.0, 10.2, 0.12)
b = np.arange(0.0, 10.2, 0.12)
ap = pd.DataFrame(a)
bp = pd.DataFrame(b)
ap.equals(bp)
True
供你参考:如果你正在寻找如何 比较向量,数组或R中的数据框架。 你可以用:
identical(iris1, iris2)
#[1] TRUE
all.equal(array1, array2)
#> [1] TRUE
其他回答
为了完整起见。我将添加 比较两个数组的Pandas方法:
import numpy as np
a = np.arange(0.0, 10.2, 0.12)
b = np.arange(0.0, 10.2, 0.12)
ap = pd.DataFrame(a)
bp = pd.DataFrame(b)
ap.equals(bp)
True
供你参考:如果你正在寻找如何 比较向量,数组或R中的数据框架。 你可以用:
identical(iris1, iris2)
#[1] TRUE
all.equal(array1, array2)
#> [1] TRUE
让我们使用下面的代码段来衡量性能。
import numpy as np
import time
exec_time0 = []
exec_time1 = []
exec_time2 = []
sizeOfArray = 5000
numOfIterations = 200
for i in xrange(numOfIterations):
A = np.random.randint(0,255,(sizeOfArray,sizeOfArray))
B = np.random.randint(0,255,(sizeOfArray,sizeOfArray))
a = time.clock()
res = (A==B).all()
b = time.clock()
exec_time0.append( b - a )
a = time.clock()
res = np.array_equal(A,B)
b = time.clock()
exec_time1.append( b - a )
a = time.clock()
res = np.array_equiv(A,B)
b = time.clock()
exec_time2.append( b - a )
print 'Method: (A==B).all(), ', np.mean(exec_time0)
print 'Method: np.array_equal(A,B),', np.mean(exec_time1)
print 'Method: np.array_equiv(A,B),', np.mean(exec_time2)
输出
Method: (A==B).all(), 0.03031857
Method: np.array_equal(A,B), 0.030025185
Method: np.array_equiv(A,B), 0.030141515
根据上面的结果,numpy方法似乎比==运算符和all()方法的组合更快,通过比较numpy方法,最快的方法似乎是numpy。array_equal方法。
(A==B).all()解决方案非常简洁,但有一些用于此任务的内置函数。即array_equal, allclose和array_equiv。
(尽管,一些快速的测试似乎表明(A==B).all()方法是最快的,这有点奇怪,因为它必须分配一个全新的数组。)
通常两个数组会有一些小的数值错误,
你可以使用numpy.allclose(A,B),而不是(A==B).all()。返回bool值True/False
在其他答案之上,你现在可以使用断言:
numpy.testing.assert_array_equal(x, y)
还有类似的函数,如numpy.testing.assert_almost_equal()
https://numpy.org/doc/stable/reference/generated/numpy.testing.assert_array_equal.html