如何更改DataFrame列的顺序？

我有以下DataFrame（df）：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10, 5))

我通过分配添加更多列：

df['mean'] = df.mean(1)

如何将列的意思移到前面，即将其设置为第一列，而其他列的顺序保持不变？

当前回答

我自己也遇到了一个类似的问题，只是想补充一下我已经解决的问题。我喜欢用于更改列顺序的reindex_axis（）方法。这是有效的：

df = df.reindex_axis(['mean'] + list(df.columns[:-1]), axis=1)

另一种基于@Jorge评论的方法：

df = df.reindex(columns=['mean'] + list(df.columns[:-1]))

虽然reindex_axis在微基准测试中似乎比reindex稍快，但我认为我更喜欢后者，因为它的直接性。

2014-08-27 19:49:31

其他回答

我相信，如果你知道另一列的位置，@Aman的答案是最好的。

如果您不知道mean的位置，但只有它的名称，则不能直接使用cols=cols[-1:]+cols[：-1]。以下是我接下来能想到的最好的东西：

meanDf = pd.DataFrame(df.pop('mean'))
# now df doesn't contain "mean" anymore. Order of join will move it to left or right:
meanDf.join(df) # has mean as first column
df.join(meanDf) # has mean as last column

2015-03-22 14:43:03

这里有一个函数可以对任意数量的列执行此操作。

def mean_first(df):
    ncols = df.shape[1]        # Get the number of columns
    index = list(range(ncols)) # Create an index to reorder the columns
    index.insert(0,ncols)      # This puts the last column at the front
    return(df.assign(mean=df.mean(1)).iloc[:,index]) # new df with last column (mean) first

2018-01-29 18:57:18

简单地说，

df = df[['mean'] + df.columns[:-1].tolist()]

2015-04-28 09:50:19

另一种选择是使用set_index（）方法，后跟reset_index（）。请注意，我们首先pop（）将要移动到数据帧前面的列，以便在重置索引时避免名称冲突：

df.set_index(df.pop('column_name'), inplace=True)
df.reset_index(inplace=True)

有关详细信息，请参阅How to change the order of dataframe columns in panda。

2021-08-15 22:41:00

我想在一个数据帧前面加上两列，我不知道所有列的确切名称，因为它们是从之前的pivot语句生成的。所以，如果你也遇到同样的情况：把你知道名字的列放在前面，然后让它们跟着“所有其他列”，我提出了以下一般解决方案：

df = df.reindex_axis(['Col1','Col2'] + list(df.columns.drop(['Col1','Col2'])), axis=1)

2017-07-27 09:21:39

如何更改DataFrame列的顺序？

推荐文章

最新文章

标签