NumPy的np有什么区别?数组和np.asarray?什么时候我应该使用其中一种而不是另一种?它们似乎产生了相同的输出。
asarray的定义是:
def asarray(a, dtype=None, order=None):
return array(a, dtype, copy=False, order=order)
它很像array,只是选项更少,copy=False。array默认copy=True。
主要的区别是,array(默认情况下)将创建对象的副本,而asarray除非必要,否则不会。
在array和asarray的文档中清楚地提到了它们的区别。区别在于参数列表,因此函数的操作取决于这些形参。
函数定义如下:
numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)
and
numpy.asarray(a, dtype=None, order=None)
以下参数可以传递给array,而不是文档中提到的asarray:
copy : bool, optional If true (default), then the object is copied. Otherwise, a copy will only be made if __array__ returns a copy, if obj is a nested sequence, or if a copy is needed to satisfy any of the other requirements (dtype, order, etc.). subok : bool, optional If True, then sub-classes will be passed-through, otherwise the returned array will be forced to be a base-class array (default). ndmin : int, optional Specifies the minimum number of dimensions that the resulting array should have. Ones will be pre-pended to the shape as needed to meet this requirement.
这种差异可以通过下面的例子来证明:
Generate a matrix. >>> A = numpy.matrix(numpy.ones((3, 3))) >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 1., 1., 1.]]) Use numpy.array to modify A. Doesn't work because you are modifying a copy. >>> numpy.array(A)[2] = 2 >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 1., 1., 1.]]) Use numpy.asarray to modify A. It worked because you are modifying A itself. >>> numpy.asarray(A)[2] = 2 >>> A matrix([[ 1., 1., 1.], [ 1., 1., 1.], [ 2., 2., 2.]])
这里有一个简单的例子可以说明这种区别。
主要区别是数组会复制原始数据,而使用不同的对象我们可以修改原始数组中的数据。
import numpy as np
a = np.arange(0.0, 10.2, 0.12)
int_cvr = np.asarray(a, dtype = np.int64)
数组(a)中的内容保持不变,并且仍然可以使用另一个对象对数据执行任何操作,而无需修改原始数组中的内容。
由于其他问题都被重定向到这个问题,即asanyarray或其他数组创建例程,因此可能有必要简要总结一下它们各自的功能。
区别主要在于什么时候不加改动地返回输入,而不是创建一个新数组作为副本。
Array提供了各种各样的选项(大多数其他函数都是围绕它的薄包装器),包括用于确定何时复制的标志。一个完整的解释将花费和文档一样长的时间(请参阅数组创建,但简单地,这里有一些例子:
假设a是一个ndarray, m是一个矩阵,它们的dtype都是float32:
Np.array (a)和Np.array (m)将复制两者,因为这是默认行为。 np。数组(a, copy=False)和np。array(m, copy=False)将复制m但不复制a,因为m不是ndarray。 np。数组(a, copy=False, subok=True)和np。array(m, copy=False, subok=True)两者都不会复制,因为m是一个矩阵,是ndarray的子类。 np。array(a, dtype=int, copy=False, subok=True)会同时复制两者,因为dtype不兼容。
大多数其他函数都是数组的薄包装器,用于控制复制发生的时间:
asarray: The input will be returned uncopied iff it's a compatible ndarray (copy=False). asanyarray: The input will be returned uncopied iff it's a compatible ndarray or subclass like matrix (copy=False, subok=True). ascontiguousarray: The input will be returned uncopied iff it's a compatible ndarray in contiguous C order (copy=False, order='C'). asfortranarray: The input will be returned uncopied iff it's a compatible ndarray in contiguous Fortran order (copy=False, order='F'). require: The input will be returned uncopied iff it's compatible with the specified requirements string. copy: The input is always copied. fromiter: The input is treated as an iterable (so, e.g., you can construct an array from an iterator's elements, instead of an object array with the iterator); always copied.
还有一些方便的函数,如asarray_chkfinite(与asarray相同的复制规则,但如果有任何nan或inf值,则会引发ValueError),以及用于子类(如matrix)或特殊情况(如记录数组)的构造函数,当然还有实际的ndarray构造函数(它允许您直接在缓冲区上跨步创建数组)。
asarray(x)类似于array(x, copy=False)
当你想要确保x在任何其他操作完成之前是一个数组时,使用asarray(x)。如果x已经是一个数组,则不会进行复制。它不会导致冗余的性能损失。
下面是一个函数的例子,它确保x首先被转换成一个数组。
def mysum(x):
return np.asarray(x).sum()
让我们通过下面的例子来理解np.array()和np.asarray()之间的区别: np.array():将输入数据(列表、元组、数组或其他序列类型)转换为ndarray并默认复制输入数据。 np.asarray():将输入数据转换为ndarray,但如果输入已经是ndarray,则不复制。
#Create an array...
arr = np.ones(5); # array([1., 1., 1., 1., 1.])
#Now I want to modify `arr` with `array` method. Let's see...
arr = np.array(arr)[3] = 200; # array([1., 1., 1., 1., 1.])
数组没有变化,因为我们修改了arr的副本。
现在,使用asarray()方法修改arr。
arr = np.asarray(arr)[3] = 200; # array([1., 200, 1., 1., 1.])
这个数组发生了变化,因为我们现在使用的是原始数组。
推荐文章
- python中的assertEquals和assertEqual
- 如何保持Python打印不添加换行符或空格?
- 为什么Python的无穷散列中有π的数字?
- Python 3.7数据类中的类继承
- 如何在PyTorch中初始化权重?
- 计数唯一的值在一列熊猫数据框架像在Qlik?
- 使用Pandas将列转换为行
- 从matplotlib中的颜色映射中获取单个颜色
- Javascript reduce()在对象
- 将Pandas或Numpy Nan替换为None以用于MysqlDB
- 使用pandas对同一列进行多个聚合
- 使用Python解析HTML
- django MultiValueDictKeyError错误,我如何处理它
- 如何在for循环期间修改列表条目?
- Java数组有最大大小吗?