这可能是一个简单的问题,但我不知道该怎么做。假设有两个变量。
a = 2
b = 3
我想从这个构建一个数据框架:
df2 = pd.DataFrame({'A':a,'B':b})
这会产生一个错误:
ValueError:如果使用所有标量值,则必须传递一个索引
我也试过这个:
df2 = (pd.DataFrame({'a':a,'b':b})).reset_index()
这将给出相同的错误消息。
这可能是一个简单的问题,但我不知道该怎么做。假设有两个变量。
a = 2
b = 3
我想从这个构建一个数据框架:
df2 = pd.DataFrame({'A':a,'B':b})
这会产生一个错误:
ValueError:如果使用所有标量值,则必须传递一个索引
我也试过这个:
df2 = (pd.DataFrame({'a':a,'b':b})).reset_index()
这将给出相同的错误消息。
当前回答
将字典转换为数据帧
col_dict_df = pd.Series(col_dict).to_frame('new_col').reset_index()
为列指定新名称
col_dict_df.columns = ['col1', 'col2']
其他回答
你也可以使用pd.DataFrame.from_records,这在你已经有字典的情况下更方便:
df = pd.DataFrame.from_records([{ 'A':a,'B':b }])
你也可以设置索引,如果你想,通过:
df = pd.DataFrame.from_records([{ 'A':a,'B':b }], index='A')
你需要提供可迭代对象作为Pandas DataFrame列的值:
df2 = pd.DataFrame({'A':[a],'B':[b]})
我对numpy数组也有同样的问题,解决方案是将它们压平:
data = {
'b': array1.flatten(),
'a': array2.flatten(),
}
df = pd.DataFrame(data)
我通常使用以下方法从字典快速创建一个小表。
假设你有一个dict,其中键是文件名,值是对应的文件大小,你可以使用以下代码将它放入一个DataFrame(注意dict上的.items()调用):
files = {'A.txt':12, 'B.txt':34, 'C.txt':56, 'D.txt':78}
filesFrame = pd.DataFrame(files.items(), columns=['filename','size'])
print(filesFrame)
filename size
0 A.txt 12
1 B.txt 34
2 C.txt 56
3 D.txt 78
另一个选项是使用Dictionary Comprehension动态地将标量转换为列表:
df = pd.DataFrame(data={k: [v] for k, v in mydict.items()})
表达式{…}创建一个新的字典,其值是一个包含1个元素的列表。例如:
In [20]: mydict
Out[20]: {'a': 1, 'b': 2}
In [21]: mydict2 = { k: [v] for k, v in mydict.items()}
In [22]: mydict2
Out[22]: {'a': [1], 'b': [2]}