我有以下数据框架:
customer item1 item2 item3
1 apple milk tomato
2 water orange potato
3 juice mango chips
我想把它翻译成每行的字典列表
rows = [
{
'customer': 1,
'item1': 'apple',
'item2': 'milk',
'item3': 'tomato'
}, {
'customer': 2,
'item1':
'water',
'item2': 'orange',
'item3': 'potato'
}, {
'customer': 3,
'item1': 'juice',
'item2': 'mango',
'item3': 'chips'
}
]
你也可以遍历行:
rows = []
for index, row in df[['customer', 'item1', 'item2', 'item3']].iterrows():
rows.append({
'customer': row['customer'],
'item1': row['item1'],
'item2': row['item2'],
'item3': row['item3'],
})
作为John Galt答案的延伸——
对于以下DataFrame,
customer item1 item2 item3
0 1 apple milk tomato
1 2 water orange potato
2 3 juice mango chips
如果你想获得一个包含索引值的字典列表,你可以这样做,
df.to_dict('index')
它输出一个字典的字典,其中父字典的键是索引值。在这种情况下,
{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}
使用df.to_dict('records')——提供输出而不必在外部转置。
In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
{'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
{'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]
你也可以遍历行:
rows = []
for index, row in df[['customer', 'item1', 'item2', 'item3']].iterrows():
rows.append({
'customer': row['customer'],
'item1': row['item1'],
'item2': row['item2'],
'item3': row['item3'],
})
使用df.T.to_dict().values(),如下所示:
In [1]: df
Out[1]:
customer item1 item2 item3
0 1 apple milk tomato
1 2 water orange potato
2 3 juice mango chips
In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
{'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
{'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]