Pandas数据帧到字典列表

我有以下数据框架:

customer    item1      item2    item3
1           apple      milk     tomato
2           water      orange   potato
3           juice      mango    chips

我想把它翻译成每行的字典列表

rows = [
    {
        'customer': 1,
        'item1': 'apple',
        'item2': 'milk',
        'item3': 'tomato'
    }, {
        'customer': 2,
        'item1':
        'water',
        'item2': 'orange',
        'item3': 'potato'
    }, {
        'customer': 3,
        'item1': 'juice',
        'item2': 'mango',
        'item3': 'chips'
    }
]

当前回答

作为John Galt答案的延伸——

对于以下DataFrame，

   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

如果你想获得一个包含索引值的字典列表，你可以这样做，

df.to_dict('index')

它输出一个字典的字典，其中父字典的键是索引值。在这种情况下，

{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}

2016-11-13 02:30:53

其他回答

你也可以遍历行:

rows = []
for index, row in df[['customer', 'item1', 'item2', 'item3']].iterrows():
    rows.append({
            'customer': row['customer'],
            'item1': row['item1'],
            'item2': row['item2'],
            'item3': row['item3'],
            })

2021-08-03 01:08:31

使用df.to_dict('records')——提供输出而不必在外部转置。

In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2015-04-23 07:08:44

如果您只对选择一列感兴趣，这是可行的。

df[["item1"]].to_dict("records")

下面的将不会工作，并产生一个TypeError:不支持的类型:。我相信这是因为它试图将一个序列转换为字典，而不是将数据帧转换为字典。

df["item1"].to_dict("records")

我只需要选择一列，并将其转换为以列名为键的字典列表，并在此停留了一段时间，所以我想分享一下。

2020-04-30 16:02:16

使用df.T.to_dict().values()，如下所示:

In [1]: df
Out[1]:
   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2015-04-23 06:36:59