从Pandas DataFrame中删除列

要删除DataFrame中的列，我可以成功使用：

del df['column_name']

但为什么我不能使用以下选项？

del df.column_name

由于可以通过df.column_name访问该系列，所以我希望这能奏效。

当前回答

按索引删除

删除第一列、第二列和第四列：

df.drop(df.columns[[0,1,3]], axis=1, inplace=True)

删除第一列：

df.drop(df.columns[[0]], axis=1, inplace=True)

此处有一个可选参数可以在不创建副本的情况下修改数据。

被逮捕的

列选择、添加、删除

删除列列名：

df.pop('column-name')

示例：

df = DataFrame.from_items([('A', [1, 2, 3]), ('B', [4, 5, 6]), ('C', [7,8, 9])], orient='index', columns=['one', 'two', 'three'])

打印df:

   one  two  three
A    1    2      3
B    4    5      6
C    7    8      9

df.drop（df.columns[[0]，axis=1，inplace=True）打印df:

   two  three
A    2      3
B    5      6
C    8      9

三=df.pop（“三”）打印df:

   two
A    2
B    5
C    8

2015-07-15 13:37:23

其他回答

一个很好的补充是，只有列存在时才可以删除它们。这样，您可以覆盖更多的用例，并且它只会从传递给它的标签中删除现有列：

例如，只需添加errors='ignore'：

df.drop(['col_name_1', 'col_name_2', ..., 'col_name_N'], inplace=True, axis=1, errors='ignore')

这是熊猫0.16.1以后的新版本。文档在这里。

2016-01-03 12:29:49

总是使用[]符号是一个很好的做法。一个原因是属性表示法（df.column_name）不适用于编号索引：

In [1]: df = DataFrame([[1, 2, 3], [4, 5, 6]])

In [2]: df[1]
Out[2]:
0    2
1    5
Name: 1

In [3]: df.1
  File "<ipython-input-3-e4803c0d1066>", line 1
    df.1
       ^
SyntaxError: invalid syntax

2012-11-16 11:33:47

点语法在JavaScript中有效，但在Python中无效。

Python:del df['column_name]JavaScript：del df['column_name]或del df.column_name

2016-04-20 15:55:38

在Pandas 0.16.1+中，只有当列按照eiTan LaVi发布的解决方案存在时，才能删除它们。在此版本之前，您可以通过条件列表理解获得相同的结果：

df.drop([col for col in ['col_name_1','col_name_2',...,'col_name_N'] if col in df],
        axis=1, inplace=True)

2016-02-13 21:58:33

Pandas 0.21+答案

Pandas 0.21版略微更改了drop方法，以包括索引和列参数，以匹配重命名和重新索引方法的签名。

df.drop(columns=['column_a', 'column_c'])

就我个人而言，我更喜欢使用axis参数来表示列或索引，因为它是几乎所有panda方法中使用的主要关键字参数。但是，现在您在0.21版中增加了一些选择。

2017-10-24 14:31:03

从Pandas DataFrame中删除列

推荐文章

最新文章

标签