如何将简单的列表转换为numpy数组?行是单独的子列表,每行包含子列表中的元素。
当前回答
正如在其他回答中提到的,np.vstack()将允许您将列表的列表(嵌套列表)转换为子列表的1维数组。但是如果你想把列表的列表转换成2维的numpy.ndarray。然后可以使用numpy.asarray()函数。
例如,如果你有一个名为y_true的列表,看起来像:
[[0, 1, 0], [1, 0, 0], [0, 0, 1], [1, 0, 0], [0, 1, 0], [0, 0, 1], [1, 0, 0]]
<class 'list'>
这一行y_true = np.asarray(y_true)将把列表的列表转换为一个2维numpy ndarray,看起来像这样:
[[0 1 0]
[1 0 0]
[0 0 1]
[1 0 0]
[0 1 0]
[0 0 1]
[1 0 0]]
<class 'numpy.ndarray'>
此外,您还可以像np一样指定dtype参数。Asarray (y_true, dtype = float)将数组值设置为所需的数据类型。
其他回答
我有一个等长的列表。即使在那时,伊格纳西奥·巴斯克斯-艾布拉姆斯的答案对我来说也不奏效。我得到了一个一维numpy数组,它的元素是列表。如果你遇到同样的问题,你可以使用下面的方法
使用numpy.vstack
import numpy as np
np_array = np.empty((0,4), dtype='float')
for i in range(10)
row_data = ... # get row_data as list
np_array = np.vstack((np_array, np.array(row_data)))
正如在其他回答中提到的,np.vstack()将允许您将列表的列表(嵌套列表)转换为子列表的1维数组。但是如果你想把列表的列表转换成2维的numpy.ndarray。然后可以使用numpy.asarray()函数。
例如,如果你有一个名为y_true的列表,看起来像:
[[0, 1, 0], [1, 0, 0], [0, 0, 1], [1, 0, 0], [0, 1, 0], [0, 0, 1], [1, 0, 0]]
<class 'list'>
这一行y_true = np.asarray(y_true)将把列表的列表转换为一个2维numpy ndarray,看起来像这样:
[[0 1 0]
[1 0 0]
[0 0 1]
[1 0 0]
[0 1 0]
[0 0 1]
[1 0 0]]
<class 'numpy.ndarray'>
此外,您还可以像np一样指定dtype参数。Asarray (y_true, dtype = float)将数组值设置为所需的数据类型。
如果列表的列表包含元素数量不同的列表,那么Ignacio Vazquez-Abrams的答案将不起作用。相反,至少有3种选择:
1)创建数组的数组:
x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>
2)创建一个列表数组:
x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>
3)首先让列表的长度相等:
x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>> [1, 2, 3],
>>> [1, None, None]], dtype=object)
就用熊猫吧
list(pd.DataFrame(listofstuff).melt().values)
这只适用于列表的列表
如果你有一个列表的列表的列表,你可能想尝试一些沿着
lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
由于这是谷歌上将列表列表转换为Numpy数组的顶级搜索,我将提供以下内容,尽管这个问题已经存在4年了:
>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]
当我第一次想到这样做的时候,我对自己很满意,因为它太简单了。然而,在用一个更大的列表来计时之后,这样做实际上更快:
>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]
注意,@Bastiaan的答案#1没有形成一个连续的列表,因此我添加了连接。
无论如何……我更喜欢hstack方法,因为它优雅地使用了Numpy。