将Pandas数据帧转换为字典

我有一个四列的数据框架。我想把这个DataFrame转换成一个python字典。我希望第一列的元素是键，而同一行中其他列的元素是值。

DataFrame:

    ID   A   B   C
0   p    1   3   2
1   q    4   3   2
2   r    4   0   9

输出应该是这样的:

字典:

{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}

当前回答

一本字典应该是:

{'red': '0.500', 'yellow': '0.250', 'blue': '0.125'}

被要求出一个数据框架，像这样:

        a      b
0     red  0.500
1  yellow  0.250
2    blue  0.125

最简单的方法是:

dict(df.values)

工作代码片段如下:

import pandas as pd
df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
dict(df.values)

2020-05-05 13:52:15

其他回答

to_dict()方法将列名设置为字典键，因此您需要稍微重塑DataFrame。设置'ID'列作为索引，然后转置DataFrame是实现这一点的一种方法。

To_dict()还接受一个'orient'参数，您将需要它来为每一列输出一个值列表。否则，将为每一列返回一个形式为{index: value}的字典。

这些步骤可以用下面这行代码完成:

>>> df.set_index('ID').T.to_dict('list')
{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

如果需要不同的字典格式，这里有一些可能的orient参数示例。考虑以下简单的DataFrame:

>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
>>> df
        a      b
0     red  0.500
1  yellow  0.250
2    blue  0.125

那么选项如下。

Dict -默认:列名是键，值是索引:数据对的字典

>>> df.to_dict('dict')
{'a': {0: 'red', 1: 'yellow', 2: 'blue'}, 
 'b': {0: 0.5, 1: 0.25, 2: 0.125}}

列表-键是列的名称，值是列数据的列表

>>> df.to_dict('list')
{'a': ['red', 'yellow', 'blue'], 
 'b': [0.5, 0.25, 0.125]}

series -类似于“列表”，但值是series

>>> df.to_dict('series')
{'a': 0       red
      1    yellow
      2      blue
      Name: a, dtype: object, 

 'b': 0    0.500
      1    0.250
      2    0.125
      Name: b, dtype: float64}

拆分——将列/数据/索引拆分为键，值为列名，数据值分别按行和索引标签拆分

>>> df.to_dict('split')
{'columns': ['a', 'b'],
 'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]],
 'index': [0, 1, 2]}

记录-每一行都成为一个字典，其中键是列名，值是单元格中的数据

>>> df.to_dict('records')
[{'a': 'red', 'b': 0.5}, 
 {'a': 'yellow', 'b': 0.25}, 
 {'a': 'blue', 'b': 0.125}]

类似索引的“记录”，但是是字典的字典，键作为索引标签(而不是列表)

>>> df.to_dict('index')
{0: {'a': 'red', 'b': 0.5},
 1: {'a': 'yellow', 'b': 0.25},
 2: {'a': 'blue', 'b': 0.125}}

2014-11-03 14:55:51

df = pd.DataFrame([['p',1,3,2], ['q',4,3,2], ['r',4,0,9]], columns=['ID','A','B','C'])
my_dict = {k:list(v) for k,v in zip(df['ID'], df.drop(columns='ID').values)}
print(my_dict)

与输出

{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

2021-02-22 08:28:43

尝试使用Zip

df = pd.read_csv("file")
d= dict([(i,[a,b,c ]) for i, a,b,c in zip(df.ID, df.A,df.B,df.C)])
print d

输出:

{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

2014-11-03 14:55:08

使用这种方法，dataframe的列将是键，而dataframe的系列将是值。

data_dict = dict()
for col in dataframe.columns:
    data_dict[col] = dataframe[col].values.tolist()

2021-07-30 16:22:34

也可以使用字典理解和iterrows()方法来获得所需的输出。

result = {row.ID: [row.A, row.B, row.C] for (index, row) in df.iterrows()}

2021-11-07 07:25:27

将Pandas数据帧转换为字典

推荐文章

最新文章

标签