熊猫:从多级列索引中下降一级?

如果我有一个多级列索引:

>>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")])
>>> pd.DataFrame([[1,2], [3,4]], columns=cols)

    a
   ---+--
    b | c
--+---+--
0 | 1 | 2
1 | 3 | 4

我如何删除索引的“a”级别，所以我最终得到:

    b | c
--+---+--
0 | 1 | 2
1 | 3 | 4

当前回答

从Pandas 0.24.0开始，我们现在可以使用datafframe . dropllevel ():

cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")])
df = pd.DataFrame([[1,2], [3,4]], columns=cols)

df.droplevel(0, axis=1) 

#   b  c
#0  1  2
#1  3  4

如果你想保持你的DataFrame方法链滚动，这是非常有用的。

2019-05-10 15:02:11

其他回答

我一直在努力解决这个问题，因为我不知道为什么我的droplevel()函数不工作。通过几个练习，你会发现表中的' a '是列名，' b '， ' c '是索引。这样做会有帮助吗

df.columns.name = None
df.reset_index() #make index become label

2018-02-17 17:58:52

删除索引的另一种方法是使用列表推导式:

df.columns = [col[1] for col in df.columns]

   b  c
0  1  2
1  3  4

如果你想把两个级别的名字组合在一起，这个策略也很有用，就像下面的例子，最底层包含两个“y”:

cols = pd.MultiIndex.from_tuples([("A", "x"), ("A", "y"), ("B", "y")])
df = pd.DataFrame([[1,2, 8 ], [3,4, 9]], columns=cols)

   A     B
   x  y  y
0  1  2  8
1  3  4  9

删除顶层将留下两个索引为“y”的列。可以通过将名称与列表理解式连接来避免这种情况。

df.columns = ['_'.join(col) for col in df.columns]

    A_x A_y B_y
0   1   2   8
1   3   4   9

这是我在做分组后遇到的一个问题，我花了一段时间才找到另一个解决它的问题。我把这个解用在了具体的情况下。

2017-06-28 21:22:27

你可以使用multiindex . dropllevel:

>>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")])
>>> df = pd.DataFrame([[1,2], [3,4]], columns=cols)
>>> df
   a   
   b  c
0  1  2
1  3  4

[2 rows x 2 columns]
>>> df.columns = df.columns.droplevel()
>>> df
   b  c
0  1  2
1  3  4

[2 rows x 2 columns]

2014-03-06 19:08:47

你也可以通过重命名列来实现:

df。列= ['a'， 'b']

这涉及到一个手动步骤，但可能是一个选项，特别是如果你最终要重命名你的数据帧。

2015-06-23 00:29:18

另一种方法是根据df的横截面重新分配df，使用.xs方法。

>>> df

    a
    b   c
0   1   2
1   3   4

>>> df = df.xs('a', axis=1, drop_level=True)

    # 'a' : key on which to get cross section
    # axis=1 : get cross section of column
    # drop_level=True : returns cross section without the multilevel index

>>> df

    b   c
0   1   2
1   3   4

2016-04-17 21:57:21

熊猫:从多级列索引中下降一级?

推荐文章

最新文章

标签