将Pandas数据帧转换为字典

我有一个四列的数据框架。我想把这个DataFrame转换成一个python字典。我希望第一列的元素是键，而同一行中其他列的元素是值。

DataFrame:

    ID   A   B   C
0   p    1   3   2
1   q    4   3   2
2   r    4   0   9

输出应该是这样的:

字典:

{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}

当前回答

遵循以下步骤:

假设你的数据框架如下:

>>> df
   A  B  C ID
0  1  3  2  p
1  4  3  2  q
2  4  0  9  r

1. 使用set_index将ID列设置为数据帧索引。

    df.set_index("ID", drop=True, inplace=True)

2. 使用orient=index参数将索引作为字典键。

    dictionary = df.to_dict(orient="index")

结果如下:

    >>> dictionary
    {'q': {'A': 4, 'B': 3, 'D': 2}, 'p': {'A': 1, 'B': 3, 'D': 2}, 'r': {'A': 4, 'B': 0, 'D': 9}}

3.如果您需要将每个示例作为列表运行以下代码。确定列的顺序

column_order= ["A", "B", "C"] #  Determine your preferred order of columns
d = {} #  Initialize the new dictionary as an empty dictionary
for k in dictionary:
    d[k] = [dictionary[k][column_name] for column_name in column_order]

2016-06-26 21:28:26

其他回答

to_dict()方法将列名设置为字典键，因此您需要稍微重塑DataFrame。设置'ID'列作为索引，然后转置DataFrame是实现这一点的一种方法。

To_dict()还接受一个'orient'参数，您将需要它来为每一列输出一个值列表。否则，将为每一列返回一个形式为{index: value}的字典。

这些步骤可以用下面这行代码完成:

>>> df.set_index('ID').T.to_dict('list')
{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

如果需要不同的字典格式，这里有一些可能的orient参数示例。考虑以下简单的DataFrame:

>>> df = pd.DataFrame({'a': ['red', 'yellow', 'blue'], 'b': [0.5, 0.25, 0.125]})
>>> df
        a      b
0     red  0.500
1  yellow  0.250
2    blue  0.125

那么选项如下。

Dict -默认:列名是键，值是索引:数据对的字典

>>> df.to_dict('dict')
{'a': {0: 'red', 1: 'yellow', 2: 'blue'}, 
 'b': {0: 0.5, 1: 0.25, 2: 0.125}}

列表-键是列的名称，值是列数据的列表

>>> df.to_dict('list')
{'a': ['red', 'yellow', 'blue'], 
 'b': [0.5, 0.25, 0.125]}

series -类似于“列表”，但值是series

>>> df.to_dict('series')
{'a': 0       red
      1    yellow
      2      blue
      Name: a, dtype: object, 

 'b': 0    0.500
      1    0.250
      2    0.125
      Name: b, dtype: float64}

拆分——将列/数据/索引拆分为键，值为列名，数据值分别按行和索引标签拆分

>>> df.to_dict('split')
{'columns': ['a', 'b'],
 'data': [['red', 0.5], ['yellow', 0.25], ['blue', 0.125]],
 'index': [0, 1, 2]}

记录-每一行都成为一个字典，其中键是列名，值是单元格中的数据

>>> df.to_dict('records')
[{'a': 'red', 'b': 0.5}, 
 {'a': 'yellow', 'b': 0.25}, 
 {'a': 'blue', 'b': 0.125}]

类似索引的“记录”，但是是字典的字典，键作为索引标签(而不是列表)

>>> df.to_dict('index')
{0: {'a': 'red', 'b': 0.5},
 1: {'a': 'yellow', 'b': 0.25},
 2: {'a': 'blue', 'b': 0.125}}

2014-11-03 14:55:51

大多数答案都不能处理ID在数据框架中可能存在多次的情况。如果ID可以在Dataframe df中复制，你想使用一个列表来存储值(也就是列表的列表)，按ID分组:

{k: [g['A'].tolist(), g['B'].tolist(), g['C'].tolist()] for k,g in df.groupby('ID')}

2022-01-03 01:33:34

使用这种方法，dataframe的列将是键，而dataframe的系列将是值。

data_dict = dict()
for col in dataframe.columns:
    data_dict[col] = dataframe[col].values.tolist()

2021-07-30 16:22:34

也可以使用字典理解和iterrows()方法来获得所需的输出。

result = {row.ID: [row.A, row.B, row.C] for (index, row) in df.iterrows()}

2021-11-07 07:25:27

df = pd.DataFrame([['p',1,3,2], ['q',4,3,2], ['r',4,0,9]], columns=['ID','A','B','C'])
my_dict = {k:list(v) for k,v in zip(df['ID'], df.drop(columns='ID').values)}
print(my_dict)

与输出

{'p': [1, 3, 2], 'q': [4, 3, 2], 'r': [4, 0, 9]}

2021-02-22 08:28:43

将Pandas数据帧转换为字典

推荐文章

最新文章

标签