要删除DataFrame中的列,我可以成功使用:

del df['column_name']

但为什么我不能使用以下选项?

del df.column_name

由于可以通过df.column_name访问该系列,所以我希望这能奏效。


当前回答

从版本0.16.1开始,您可以

df.drop(['column_name'], axis = 1, inplace = True, errors = 'ignore')

其他回答

点语法在JavaScript中有效,但在Python中无效。

Python:del df['column_name]JavaScript:del df['column_name]或del df.column_name

如果原始数据帧df不太大,没有内存限制,只需要保留几列,或者,如果事先不知道不需要的所有额外列的名称,那么不妨创建一个只包含所需列的新数据帧:

new_df = df[['spam', 'sausage']]

这里的大多数答案都忽略了实际提出的问题:

为什么不能使用del df.column_name?

首先,我们需要了解这个问题,这需要我们深入研究Python的神奇方法。

正如韦斯在回答中指出的那样,deldf['column']映射到Python的神奇方法df__delitem__('column'),它在Pandas中实现以删除列。

然而,正如上面关于Python魔术方法的链接中所指出的:

事实上,__del__几乎永远不应该被使用,因为它被称为;小心使用!

您可以认为不应该使用或鼓励del df['column_name],因此甚至不应该考虑del df.column_name。

然而,理论上,deldf.column_name可以使用魔术方法__delattr_在Pandas中实现。然而,这确实会带来某些问题,deldf['column_name]实现已经存在的问题,但程度较低。

示例问题

如果我在数据帧中定义了一个名为“dtypes”或“columns”的列,该怎么办?

然后假设我想删除这些列。

deldf.dtypes会使__delattr_方法混淆,好像它应该删除“dtypes”属性或“dtype”列一样。

这个问题背后的建筑问题

数据帧是列的集合吗?数据帧是行的集合吗?列是数据帧的属性吗?

熊猫回答:

是的,在所有方面不,但如果您想这样做,可以使用.ix、.loc或.iloc方法。也许,你想读取数据吗?那么是的,除非该属性的名称已经被属于数据帧的另一个属性所采用。是否要修改数据?那就没有了。

太长,读不下去了

你不能做deldf.column_name,因为Pandas有一个相当广泛的架构,需要重新考虑,以避免用户出现这种认知失调。

专业提示:

不要使用df.column_name。它可能很漂亮,但会导致认知失调。

Python之禅引用如下:

删除列有多种方法。

应该有一种——最好只有一种——明显的方法来实现。

列有时是属性,但有时不是。

特殊情况不足以打破规则。

del df.dtypes是否删除dtypes属性或dtypes列?

面对模棱两可的问题,拒绝猜测。

Pandas 0.21+答案

Pandas 0.21版略微更改了drop方法,以包括索引和列参数,以匹配重命名和重新索引方法的签名。

df.drop(columns=['column_a', 'column_c'])

就我个人而言,我更喜欢使用axis参数来表示列或索引,因为它是几乎所有panda方法中使用的主要关键字参数。但是,现在您在0.21版中增加了一些选择。

通过使用自动补全或“IntelliSense”而不是字符串文字来获得优势:

del df[df.column1.name]

# or

df.drop(df.column1.name, axis=1, inplace=True)

它适用于当前的Pandas版本。