这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?
例如:
df=
gi ptt_loc
0 384444683 593
1 384444684 594
2 384444686 596
To,
df=
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
:
df['index1'] = df.index
或者,.reset_index:
df = df.reset_index(level=0)
所以,如果你有一个3级索引的多索引框架,比如:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
你想转换第1 (tick)和第3 (obs)级别的索引到列,你会做:
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303
如果你想使用reset_index方法,同时保留你现有的索引,你应该使用:
df.reset_index().set_index('index', drop=False)
或者就地改变:
df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)
例如:
print(df)
gi ptt_loc
0 384444683 593
4 384444684 594
9 384444686 596
print(df.reset_index())
index gi ptt_loc
0 0 384444683 593
1 4 384444684 594
2 9 384444686 596
print(df.reset_index().set_index('index', drop=False))
index gi ptt_loc
index
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
如果你想去掉索引标签,你可以这样做:
df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
index gi ptt_loc
0 0 384444683 593
4 4 384444684 594
9 9 384444686 596
在最新版本的pandas 1.5.0中,您可以使用函数reset_index和新的参数names来指定您想要给出索引列的名称列表。下面是一个具有一个索引列的可重复示例:
import pandas as pd
df = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
gi ptt
0 232 342
1 66 56
2 34 662
3 43 123
df.reset_index(names=['new'])
输出:
new gi ptt
0 0 232 342
1 1 66 56
2 2 34 662
3 3 43 123
这也可以很容易地应用于MultiIndex。把你想要的名字列一个清单。
:
df['index1'] = df.index
或者,.reset_index:
df = df.reset_index(level=0)
所以,如果你有一个3级索引的多索引框架,比如:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
你想转换第1 (tick)和第3 (obs)级别的索引到列,你会做:
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303