如何更改DataFrame列的顺序？

我有以下DataFrame（df）：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10, 5))

我通过分配添加更多列：

df['mean'] = df.mean(1)

如何将列的意思移到前面，即将其设置为第一列，而其他列的顺序保持不变？

当前回答

我相信，如果你知道另一列的位置，@Aman的答案是最好的。

如果您不知道mean的位置，但只有它的名称，则不能直接使用cols=cols[-1:]+cols[：-1]。以下是我接下来能想到的最好的东西：

meanDf = pd.DataFrame(df.pop('mean'))
# now df doesn't contain "mean" anymore. Order of join will move it to left or right:
meanDf.join(df) # has mean as first column
df.join(meanDf) # has mean as last column

2015-03-22 14:43:03

其他回答

你也可以这样做：

df = df[['mean', '0', '1', '2', '3']]

您可以通过以下方式获取列列表：

cols = list(df.columns.values)

输出将产生：

['0', '1', '2', '3', 'mean']

…然后，在将其放入第一个函数之前，可以手动重新排列

2014-05-19 15:20:33

我认为这是一个略为简洁的解决方案：

df.insert(0, 'mean', df.pop("mean"))

这个解决方案有点类似于@JoeHeffer的解决方案，但这是一条直线。

这里，我们从数据帧中删除列“mean”，并将其附加到具有相同列名的索引0。

2019-11-05 16:33:40

使用T怎么样？

df = df.T.reindex(['mean', 0, 1, 2, 3, 4]).T

2016-06-26 23:46:28

您需要按所需的顺序创建一个新的列列表，然后使用df=df[cols]以新的顺序重新排列列。

cols = ['mean']  + [col for col in df if col != 'mean']
df = df[cols]

您也可以使用更通用的方法。在本例中，最后一列（由-1表示）作为第一列插入。

cols = [df.columns[-1]] + [col for col in df if col != df.columns[-1]]
df = df[cols]

如果DataFrame中存在列，也可以使用此方法按所需顺序重新排序列。

inserted_cols = ['a', 'b', 'c']
cols = ([col for col in inserted_cols if col in df] 
        + [col for col in df if col not in inserted_cols])
df = df[cols]

2015-08-21 02:18:52

我很喜欢Shoresh的回答：当你不知道位置时，使用集合功能来删除列，但这不符合我的目的，因为我需要保持原始的列顺序（具有任意的列标签）。

不过，我通过使用boltons包中的IndexedSet实现了这一点。

我还需要重新添加多个列标签，因此对于更一般的情况，我使用了以下代码：

from boltons.setutils import IndexedSet
cols = list(IndexedSet(df.columns.tolist()) - set(['mean', 'std']))
cols[0:0] =['mean', 'std']
df = df[cols]

希望这对搜索此线程以寻求通用解决方案的任何人都有用。

2017-12-09 04:14:45

如何更改DataFrame列的顺序？

推荐文章

最新文章

标签