要删除DataFrame中的列,我可以成功使用:
del df['column_name']
但为什么我不能使用以下选项?
del df.column_name
由于可以通过df.column_name访问该系列,所以我希望这能奏效。
要删除DataFrame中的列,我可以成功使用:
del df['column_name']
但为什么我不能使用以下选项?
del df.column_name
由于可以通过df.column_name访问该系列,所以我希望这能奏效。
当前回答
正如您所猜测的,正确的语法是
del df['column_name']
由于Python中的语法限制,很难使del df.column_name正常工作。deldf[name]被翻译成df__delitem__(name)在Python的封面下。
其他回答
从版本0.16.1开始,您可以
df.drop(['column_name'], axis = 1, inplace = True, errors = 'ignore')
Use:
df.drop('columnname', axis =1, inplace = True)
或者你可以和
del df['colname']
基于列编号删除多个列的步骤
df.drop(df.iloc[:,1:3], axis = 1, inplace = True)
基于列名删除多个列的步骤
df.drop(['col1','col2',..'coln'], axis = 1, inplace = True)
按索引删除
删除第一列、第二列和第四列:
df.drop(df.columns[[0,1,3]], axis=1, inplace=True)
删除第一列:
df.drop(df.columns[[0]], axis=1, inplace=True)
此处有一个可选参数可以在不创建副本的情况下修改数据。
被逮捕的
列选择、添加、删除
删除列列名:
df.pop('column-name')
示例:
df = DataFrame.from_items([('A', [1, 2, 3]), ('B', [4, 5, 6]), ('C', [7,8, 9])], orient='index', columns=['one', 'two', 'three'])
打印df:
one two three
A 1 2 3
B 4 5 6
C 7 8 9
df.drop(df.columns[[0],axis=1,inplace=True)打印df:
two three
A 2 3
B 5 6
C 8 9
三=df.pop(“三”)打印df:
two
A 2
B 5
C 8
在Pandas 0.16.1+中,只有当列按照eiTan LaVi发布的解决方案存在时,才能删除它们。在此版本之前,您可以通过条件列表理解获得相同的结果:
df.drop([col for col in ['col_name_1','col_name_2',...,'col_name_N'] if col in df],
axis=1, inplace=True)
这里的大多数答案都忽略了实际提出的问题:
为什么不能使用del df.column_name?
首先,我们需要了解这个问题,这需要我们深入研究Python的神奇方法。
正如韦斯在回答中指出的那样,deldf['column']映射到Python的神奇方法df__delitem__('column'),它在Pandas中实现以删除列。
然而,正如上面关于Python魔术方法的链接中所指出的:
事实上,__del__几乎永远不应该被使用,因为它被称为;小心使用!
您可以认为不应该使用或鼓励del df['column_name],因此甚至不应该考虑del df.column_name。
然而,理论上,deldf.column_name可以使用魔术方法__delattr_在Pandas中实现。然而,这确实会带来某些问题,deldf['column_name]实现已经存在的问题,但程度较低。
示例问题
如果我在数据帧中定义了一个名为“dtypes”或“columns”的列,该怎么办?
然后假设我想删除这些列。
deldf.dtypes会使__delattr_方法混淆,好像它应该删除“dtypes”属性或“dtype”列一样。
这个问题背后的建筑问题
数据帧是列的集合吗?数据帧是行的集合吗?列是数据帧的属性吗?
熊猫回答:
是的,在所有方面不,但如果您想这样做,可以使用.ix、.loc或.iloc方法。也许,你想读取数据吗?那么是的,除非该属性的名称已经被属于数据帧的另一个属性所采用。是否要修改数据?那就没有了。
太长,读不下去了
你不能做deldf.column_name,因为Pandas有一个相当广泛的架构,需要重新考虑,以避免用户出现这种认知失调。
专业提示:
不要使用df.column_name。它可能很漂亮,但会导致认知失调。
Python之禅引用如下:
删除列有多种方法。
应该有一种——最好只有一种——明显的方法来实现。
列有时是属性,但有时不是。
特殊情况不足以打破规则。
del df.dtypes是否删除dtypes属性或dtypes列?
面对模棱两可的问题,拒绝猜测。