这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?
例如:
df=
gi ptt_loc
0 384444683 593
1 384444684 594
2 384444686 596
To,
df=
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
为了更清楚一点,让我们来看看一个索引(MultiIndex)中有两个级别的DataFrame。
index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])
df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))
reset_index方法(使用默认参数调用)将所有索引级别转换为列,并使用简单的RangeIndex作为新索引。
df.reset_index()
使用level参数控制将哪些索引级别转换为列。如果可能的话,使用更明确的关卡名称。如果没有级别名称,您可以通过其整数位置来引用每个级别,该位置从外部的0开始。您可以在这里使用标量值,也可以使用要重置的所有索引的列表。
df.reset_index(level='State') # same as df.reset_index(level=0)
在极少数情况下,您希望保留索引并将索引转换为列,您可以执行以下操作:
# for a single level
df.assign(State=df.index.get_level_values('State'))
# for all levels
df.assign(**df.index.to_frame())
:
df['index1'] = df.index
或者,.reset_index:
df = df.reset_index(level=0)
所以,如果你有一个3级索引的多索引框架,比如:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
你想转换第1 (tick)和第3 (obs)级别的索引到列,你会做:
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303
为了更清楚一点,让我们来看看一个索引(MultiIndex)中有两个级别的DataFrame。
index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])
df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))
reset_index方法(使用默认参数调用)将所有索引级别转换为列,并使用简单的RangeIndex作为新索引。
df.reset_index()
使用level参数控制将哪些索引级别转换为列。如果可能的话,使用更明确的关卡名称。如果没有级别名称,您可以通过其整数位置来引用每个级别,该位置从外部的0开始。您可以在这里使用标量值,也可以使用要重置的所有索引的列表。
df.reset_index(level='State') # same as df.reset_index(level=0)
在极少数情况下,您希望保留索引并将索引转换为列,您可以执行以下操作:
# for a single level
df.assign(State=df.index.get_level_values('State'))
# for all levels
df.assign(**df.index.to_frame())
Rename_axis + reset_index
你可以先把你的索引重命名为一个想要的标签,然后提升到一个系列:
df = df.rename_axis('index1').reset_index()
print(df)
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
这也适用于MultiIndex数据框架:
print(df)
# val
# tick tag obs
# 2016-02-26 C 2 0.0139
# 2016-02-27 A 2 0.5577
# 2016-02-28 C 6 0.0303
df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()
print(df)
index1 index2 index3 val
0 2016-02-26 C 2 0.0139
1 2016-02-27 A 2 0.5577
2 2016-02-28 C 6 0.0303