NumPy的np有什么区别?数组和np.asarray?什么时候我应该使用其中一种而不是另一种?它们似乎产生了相同的输出。


当前回答

这种差异可以通过下面的例子来证明:

Generate a matrix. >>> A = numpy.matrix(numpy.ones((3, 3))) >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 1., 1., 1.]]) Use numpy.array to modify A. Doesn't work because you are modifying a copy. >>> numpy.array(A)[2] = 2 >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 1., 1., 1.]]) Use numpy.asarray to modify A. It worked because you are modifying A itself. >>> numpy.asarray(A)[2] = 2 >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 2., 2., 2.]])

其他回答

asarray(x)类似于array(x, copy=False)

当你想要确保x在任何其他操作完成之前是一个数组时,使用asarray(x)。如果x已经是一个数组,则不会进行复制。它不会导致冗余的性能损失。

下面是一个函数的例子,它确保x首先被转换成一个数组。

def mysum(x):
    return np.asarray(x).sum()

在array和asarray的文档中清楚地提到了它们的区别。区别在于参数列表,因此函数的操作取决于这些形参。

函数定义如下:

numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)

and

numpy.asarray(a, dtype=None, order=None)

以下参数可以传递给array,而不是文档中提到的asarray:

copy : bool, optional If true (default), then the object is copied. Otherwise, a copy will only be made if __array__ returns a copy, if obj is a nested sequence, or if a copy is needed to satisfy any of the other requirements (dtype, order, etc.). subok : bool, optional If True, then sub-classes will be passed-through, otherwise the returned array will be forced to be a base-class array (default). ndmin : int, optional Specifies the minimum number of dimensions that the resulting array should have. Ones will be pre-pended to the shape as needed to meet this requirement.

这种差异可以通过下面的例子来证明:

Generate a matrix. >>> A = numpy.matrix(numpy.ones((3, 3))) >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 1., 1., 1.]]) Use numpy.array to modify A. Doesn't work because you are modifying a copy. >>> numpy.array(A)[2] = 2 >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 1., 1., 1.]]) Use numpy.asarray to modify A. It worked because you are modifying A itself. >>> numpy.asarray(A)[2] = 2 >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 2., 2., 2.]])

由于其他问题都被重定向到这个问题,即asanyarray或其他数组创建例程,因此可能有必要简要总结一下它们各自的功能。

区别主要在于什么时候不加改动地返回输入,而不是创建一个新数组作为副本。

Array提供了各种各样的选项(大多数其他函数都是围绕它的薄包装器),包括用于确定何时复制的标志。一个完整的解释将花费和文档一样长的时间(请参阅数组创建,但简单地,这里有一些例子:

假设a是一个ndarray, m是一个矩阵,它们的dtype都是float32:

Np.array (a)和Np.array (m)将复制两者,因为这是默认行为。 np。数组(a, copy=False)和np。array(m, copy=False)将复制m但不复制a,因为m不是ndarray。 np。数组(a, copy=False, subok=True)和np。array(m, copy=False, subok=True)两者都不会复制,因为m是一个矩阵,是ndarray的子类。 np。array(a, dtype=int, copy=False, subok=True)会同时复制两者,因为dtype不兼容。

大多数其他函数都是数组的薄包装器,用于控制复制发生的时间:

asarray: The input will be returned uncopied iff it's a compatible ndarray (copy=False). asanyarray: The input will be returned uncopied iff it's a compatible ndarray or subclass like matrix (copy=False, subok=True). ascontiguousarray: The input will be returned uncopied iff it's a compatible ndarray in contiguous C order (copy=False, order='C'). asfortranarray: The input will be returned uncopied iff it's a compatible ndarray in contiguous Fortran order (copy=False, order='F'). require: The input will be returned uncopied iff it's compatible with the specified requirements string. copy: The input is always copied. fromiter: The input is treated as an iterable (so, e.g., you can construct an array from an iterator's elements, instead of an object array with the iterator); always copied.

还有一些方便的函数,如asarray_chkfinite(与asarray相同的复制规则,但如果有任何nan或inf值,则会引发ValueError),以及用于子类(如matrix)或特殊情况(如记录数组)的构造函数,当然还有实际的ndarray构造函数(它允许您直接在缓冲区上跨步创建数组)。

asarray的定义是:

def asarray(a, dtype=None, order=None):
    return array(a, dtype, copy=False, order=order)

它很像array,只是选项更少,copy=False。array默认copy=True。

主要的区别是,array(默认情况下)将创建对象的副本,而asarray除非必要,否则不会。