在Pandas中重命名列名

我想从

['$a', '$b', '$c', '$d', '$e']

['a', 'b', 'c', 'd', 'e']

当前回答

Pandas 0.21+答案

0.21版中的列重命名有一些重要更新。

重命名方法添加了可以设置为columns或1的axis参数。此更新使此方法与panda API的其余部分相匹配。它仍然具有索引和列参数，但不再强制您使用它们。intlace设置为False的set_axis方法允许您使用列表重命名所有索引或列标签。

Pandas 0.21示例+

构造示例DataFrame：

df = pd.DataFrame({'$a':[1,2], '$b': [3,4], 
                   '$c':[5,6], '$d':[7,8], 
                   '$e':[9,10]})

   $a  $b  $c  $d  $e
0   1   3   5   7   9
1   2   4   6   8  10

使用axis='columns'或axis=1的重命名

df.rename({'$a':'a', '$b':'b', '$c':'c', '$d':'d', '$e':'e'}, axis='columns')

df.rename({'$a':'a', '$b':'b', '$c':'c', '$d':'d', '$e':'e'}, axis=1)

两者都会导致以下结果：

   a  b  c  d   e
0  1  3  5  7   9
1  2  4  6  8  10

仍然可以使用旧方法签名：

df.rename(columns={'$a':'a', '$b':'b', '$c':'c', '$d':'d', '$e':'e'})

重命名函数还接受将应用于每个列名的函数。

df.rename(lambda x: x[1:], axis='columns')

df.rename(lambda x: x[1:], axis=1)

将set_axis与列表一起使用，inplace=False

可以为set_axis方法提供一个长度等于列数（或索引）的列表。目前，inplace默认为True，但在未来的版本中，inplace将默认为False。

df.set_axis(['a', 'b', 'c', 'd', 'e'], axis='columns', inplace=False)

df.set_axis(['a', 'b', 'c', 'd', 'e'], axis=1, inplace=False)

为什么不使用df.columns=[‘a’，‘b’，‘c’，‘d’，‘e’]？

像这样直接分配列没有错。这是一个非常好的解决方案。

使用set_axis的优点是它可以作为方法链的一部分使用，并返回DataFrame的新副本。如果没有它，在重新分配列之前，必须将链的中间步骤存储到另一个变量。

# new for pandas 0.21+
df.some_method1()
  .some_method2()
  .set_axis()
  .some_method3()

# old way
df1 = df.some_method1()
        .some_method2()
df1.columns = columns
df1.some_method3()

2017-10-24 13:39:15

其他回答

请注意，前面答案中的方法不适用于MultiIndex。对于MultiIndex，您需要执行以下操作：

>>> df = pd.DataFrame({('$a','$x'):[1,2], ('$b','$y'): [3,4], ('e','f'):[5,6]})
>>> df
   $a $b  e
   $x $y  f
0  1  3  5
1  2  4  6
>>> rename = {('$a','$x'):('a','x'), ('$b','$y'):('b','y')}
>>> df.columns = pandas.MultiIndex.from_tuples([
        rename.get(item, item) for item in df.columns.tolist()])
>>> df
   a  b  e
   x  y  f
0  1  3  5
1  2  4  6

2016-08-29 21:27:20

由于您只想删除所有列名中的$符号，因此只需执行以下操作：

df = df.rename(columns=lambda x: x.replace('$', ''))

df.rename(columns=lambda x: x.replace('$', ''), inplace=True)

2014-03-26 10:20:45

假设您可以使用正则表达式，则此解决方案无需使用正则表达式进行手动编码：

import pandas as pd
import re

srch = re.compile(r"\w+")

data = pd.read_csv("CSV_FILE.csv")
cols = data.columns
new_cols = list(map(lambda v:v.group(), (list(map(srch.search, cols)))))
data.columns = new_cols

2019-04-11 15:08:57

如“使用文本数据：

df.columns = df.columns.str.replace('$', '')

2015-05-30 13:24:05

df.columns = ['a', 'b', 'c', 'd', 'e']

它将按照您提供的顺序用您提供的名称替换现有名称。

2016-03-22 08:59:12

在Pandas中重命名列名

推荐文章

最新文章

标签