我有一个dataframe df从一个Excel文档导入,就像这样:
cluster load_date budget actual fixed_price
A 1/1/2014 1000 4000 Y
A 2/1/2014 12000 10000 Y
A 3/1/2014 36000 2000 Y
B 4/1/2014 15000 10000 N
B 4/1/2014 12000 11500 N
B 4/1/2014 90000 11000 N
C 7/1/2014 22000 18000 N
C 8/1/2014 30000 28960 N
C 9/1/2014 53000 51200 N
我希望能够返回列1 df['cluster']的内容作为列表,这样我就可以在上面运行for循环,并为每个集群创建一个Excel工作表。
是否也可以将整个列或行的内容返回到列表中?如。
list = [], list[column1] or list[df.ix(row1)]
当您将Pandas DataFrame列取出时,它们就是Pandas Series,然后您可以调用x.tolist()将它们转换为Python列表。或者使用list(x)强制转换。
import pandas as pd
data_dict = {'one': pd.Series([1, 2, 3], index=['a', 'b', 'c']),
'two': pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(data_dict)
print(f"DataFrame:\n{df}\n")
print(f"column types:\n{df.dtypes}")
col_one_list = df['one'].tolist()
col_one_arr = df['one'].to_numpy()
print(f"\ncol_one_list:\n{col_one_list}\ntype:{type(col_one_list)}")
print(f"\ncol_one_arr:\n{col_one_arr}\ntype:{type(col_one_arr)}")
输出:
DataFrame:
one two
a 1.0 1
b 2.0 2
c 3.0 3
d NaN 4
column types:
one float64
two int64
dtype: object
col_one_list:
[1.0, 2.0, 3.0, nan]
type:<class 'list'>
col_one_arr:
[ 1. 2. 3. nan]
type:<class 'numpy.ndarray'>
转换示例:
>熊猫数据帧->列表从一个熊猫列
Numpy数组
data = np.array([[10,20,30], [20,30,60], [30,60,90]])
将numpy数组转换为Panda数据帧
dataPd = pd.DataFrame(data = data)
print(dataPd)
0 1 2
0 10 20 30
1 20 30 60
2 30 60 90
将一个Panda列转换为列表
pdToList = list(dataPd['2'])