这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?

例如:

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

To,

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

当前回答

我通常是这样做的:

df = df.assign(index1=df.index)

其他回答

:

df['index1'] = df.index

或者,.reset_index:

df = df.reset_index(level=0)

所以,如果你有一个3级索引的多索引框架,比如:

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

你想转换第1 (tick)和第3 (obs)级别的索引到列,你会做:

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

对于MultiIndex,您可以使用

df['si_name'] = R.index.get_level_values('si_name') 

其中si_name是子索引的名称。

df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

为了更清楚一点,让我们来看看一个索引(MultiIndex)中有两个级别的DataFrame。

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

reset_index方法(使用默认参数调用)将所有索引级别转换为列,并使用简单的RangeIndex作为新索引。

df.reset_index()

使用level参数控制将哪些索引级别转换为列。如果可能的话,使用更明确的关卡名称。如果没有级别名称,您可以通过其整数位置来引用每个级别,该位置从外部的0开始。您可以在这里使用标量值,也可以使用要重置的所有索引的列表。

df.reset_index(level='State') # same as df.reset_index(level=0)

在极少数情况下,您希望保留索引并将索引转换为列,您可以执行以下操作:

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

我通常是这样做的:

df = df.assign(index1=df.index)