从Pandas DataFrame中删除列

要删除DataFrame中的列，我可以成功使用：

del df['column_name']

但为什么我不能使用以下选项？

del df.column_name

由于可以通过df.column_name访问该系列，所以我希望这能奏效。

当前回答

从Python的一般观点来看，如果可以删除属性column_name，del obj.column_name是有意义的。它需要是一个常规属性，或者是一个定义了删除器的属性。

这不适用于Pandas，也不适用于Pandas数据帧的原因如下：

考虑df.column_name是一个“虚拟属性”，它本身不是一个东西，它不是该列的“座位”，它只是访问该列的一种方式。很像没有删除器的属性。

其他回答

在Pandas DataFrame中删除列的另一种方法

如果您不希望就地删除，则可以通过使用DataFrame（…）函数指定列来创建一个新的DataFrame：

my_dict = { 'name' : ['a','b','c','d'], 'age' : [10,20,25,22], 'designation' : ['CEO', 'VP', 'MD', 'CEO']}

df = pd.DataFrame(my_dict)

创建新的DataFrame作为

newdf = pd.DataFrame(df, columns=['name', 'age'])

你得到的结果和del/drop一样好。

在Pandas中执行此操作的最佳方法是使用drop：

df = df.drop('column_name', axis=1)

其中1是轴号（0表示行，1表示列。）

或者，drop（）方法接受索引/列关键字作为指定轴的替代方法。所以我们现在可以做：

df = df.drop(columns=['column_nameA', 'column_nameB'])

这是在v0.21.0中引入的（2017年10月27日）

要删除列而不必重新分配df，可以执行以下操作：

df.drop('column_name', axis=1, inplace=True)

最后，要按列编号而不是按列标签删除，请尝试删除，例如，第1列、第2列和第4列：

df = df.drop(df.columns[[0, 1, 3]], axis=1)  # df.columns is zero-based pd.Index

同时使用列的“text”语法：

df.drop(['column_nameA', 'column_nameB'], axis=1, inplace=True)

使用数据帧和切片的iloc函数删除列，当我们有一个带有不需要的值的典型列名时：

df = df.iloc[:,1:] # Removing an unnamed index column

这里0是默认行，1是第一列，因此：，1:是删除第一列的参数。

我们可以通过drop（）方法删除或删除一个或多个指定列。

假设df是一个数据帧。

要删除的列=列0

代码：

df = df.drop(column0, axis=1)

要删除多个列col1、col2、，coln，我们必须在列表中插入所有需要删除的列。然后通过drop（）方法删除它们。

代码：

df = df.drop([col1, col2, . . . , coln], axis=1)

正如您所猜测的，正确的语法是

del df['column_name']

由于Python中的语法限制，很难使del df.column_name正常工作。deldf[name]被翻译成df__delitem__（name）在Python的封面下。

推荐文章