如何更改DataFrame列的顺序？

我有以下DataFrame（df）：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10, 5))

我通过分配添加更多列：

df['mean'] = df.mean(1)

如何将列的意思移到前面，即将其设置为第一列，而其他列的顺序保持不变？

当前回答

import numpy as np
import pandas as pd
df = pd.DataFrame()
column_names = ['x','y','z','mean']
for col in column_names: 
    df[col] = np.random.randint(0,100, size=10000)

您可以尝试以下解决方案：

解决方案1：

df = df[ ['mean'] + [ col for col in df.columns if col != 'mean' ] ]

解决方案2：

df = df[['mean', 'x', 'y', 'z']]

解决方案3：

col = df.pop("mean")
df = df.insert(0, col.name, col)

解决方案4：

df.set_index(df.columns[-1], inplace=True)
df.reset_index(inplace=True)

解决方案5：

cols = list(df)
cols = [cols[-1]] + cols[:-1]
df = df[cols]

解决方案6：

order = [1,2,3,0] # setting column's order
df = df[[df.columns[i] for i in order]]

时间比较：

解决方案1：

CPU时间：用户1.05 ms，sys:35µs，总计：1.08 ms壁时间：995µs

解决方案2：

CPU时间：用户933µs，系统：0 ns，总计：933µ壁时间：800µs

解决方案3：

CPU时间：用户0 ns，sys:1.35 ms，总计：1.35 ms壁时间：1.08 ms

解决方案4：

CPU时间：用户1.23毫秒，系统：45µs，总计：1.27毫秒壁时间：986µs

解决方案5：

CPU时间：用户1.09 ms，系统：19µs，总计：1.11 ms壁时间：949µs

解决方案6：

CPU时间：用户955µs，系统：34µs，总计：989µs壁时间：859µs

2019-11-09 06:24:12

其他回答

一种简单的方法是用列列表重新分配数据帧，根据需要重新排列。

这就是你现在拥有的：

In [6]: df
Out[6]:
          0         1         2         3         4      mean
0  0.445598  0.173835  0.343415  0.682252  0.582616  0.445543
1  0.881592  0.696942  0.702232  0.696724  0.373551  0.670208
2  0.662527  0.955193  0.131016  0.609548  0.804694  0.632596
3  0.260919  0.783467  0.593433  0.033426  0.512019  0.436653
4  0.131842  0.799367  0.182828  0.683330  0.019485  0.363371
5  0.498784  0.873495  0.383811  0.699289  0.480447  0.587165
6  0.388771  0.395757  0.745237  0.628406  0.784473  0.588529
7  0.147986  0.459451  0.310961  0.706435  0.100914  0.345149
8  0.394947  0.863494  0.585030  0.565944  0.356561  0.553195
9  0.689260  0.865243  0.136481  0.386582  0.730399  0.561593

In [7]: cols = df.columns.tolist()

In [8]: cols
Out[8]: [0L, 1L, 2L, 3L, 4L, 'mean']

按任意方式重新排列列。这是我将最后一个元素移动到第一个位置的方式：

In [12]: cols = cols[-1:] + cols[:-1]

In [13]: cols
Out[13]: ['mean', 0L, 1L, 2L, 3L, 4L]

然后重新排序数据帧，如下所示：

In [16]: df = df[cols]  #    OR    df = df.ix[:, cols]

In [17]: df
Out[17]:
       mean         0         1         2         3         4
0  0.445543  0.445598  0.173835  0.343415  0.682252  0.582616
1  0.670208  0.881592  0.696942  0.702232  0.696724  0.373551
2  0.632596  0.662527  0.955193  0.131016  0.609548  0.804694
3  0.436653  0.260919  0.783467  0.593433  0.033426  0.512019
4  0.363371  0.131842  0.799367  0.182828  0.683330  0.019485
5  0.587165  0.498784  0.873495  0.383811  0.699289  0.480447
6  0.588529  0.388771  0.395757  0.745237  0.628406  0.784473
7  0.345149  0.147986  0.459451  0.310961  0.706435  0.100914
8  0.553195  0.394947  0.863494  0.585030  0.565944  0.356561
9  0.561593  0.689260  0.865243  0.136481  0.386582  0.730399

2012-10-30 22:38:49

我很喜欢Shoresh的回答：当你不知道位置时，使用集合功能来删除列，但这不符合我的目的，因为我需要保持原始的列顺序（具有任意的列标签）。

不过，我通过使用boltons包中的IndexedSet实现了这一点。

我还需要重新添加多个列标签，因此对于更一般的情况，我使用了以下代码：

from boltons.setutils import IndexedSet
cols = list(IndexedSet(df.columns.tolist()) - set(['mean', 'std']))
cols[0:0] =['mean', 'std']
df = df[cols]

希望这对搜索此线程以寻求通用解决方案的任何人都有用。

2017-12-09 04:14:45

您可以使用以下名称列表对数据帧列进行重新排序：

df=df.filter（list_of_col_name）

2021-04-13 13:36:15

这里有一个函数可以对任意数量的列执行此操作。

def mean_first(df):
    ncols = df.shape[1]        # Get the number of columns
    index = list(range(ncols)) # Create an index to reorder the columns
    index.insert(0,ncols)      # This puts the last column at the front
    return(df.assign(mean=df.mean(1)).iloc[:,index]) # new df with last column (mean) first

2018-01-29 18:57:18

import numpy as np
import pandas as pd
df = pd.DataFrame()
column_names = ['x','y','z','mean']
for col in column_names: 
    df[col] = np.random.randint(0,100, size=10000)

您可以尝试以下解决方案：

解决方案1：

df = df[ ['mean'] + [ col for col in df.columns if col != 'mean' ] ]

解决方案2：

df = df[['mean', 'x', 'y', 'z']]

解决方案3：

col = df.pop("mean")
df = df.insert(0, col.name, col)

解决方案4：

df.set_index(df.columns[-1], inplace=True)
df.reset_index(inplace=True)

解决方案5：

cols = list(df)
cols = [cols[-1]] + cols[:-1]
df = df[cols]

解决方案6：

order = [1,2,3,0] # setting column's order
df = df[[df.columns[i] for i in order]]

时间比较：

解决方案1：

CPU时间：用户1.05 ms，sys:35µs，总计：1.08 ms壁时间：995µs

解决方案2：

CPU时间：用户933µs，系统：0 ns，总计：933µ壁时间：800µs

解决方案3：

CPU时间：用户0 ns，sys:1.35 ms，总计：1.35 ms壁时间：1.08 ms

解决方案4：

CPU时间：用户1.23毫秒，系统：45µs，总计：1.27毫秒壁时间：986µs

解决方案5：

CPU时间：用户1.09 ms，系统：19µs，总计：1.11 ms壁时间：949µs

解决方案6：

CPU时间：用户955µs，系统：34µs，总计：989µs壁时间：859µs

2019-11-09 06:24:12

如何更改DataFrame列的顺序？

推荐文章

最新文章

标签