要删除DataFrame中的列,我可以成功使用:
del df['column_name']
但为什么我不能使用以下选项?
del df.column_name
由于可以通过df.column_name访问该系列,所以我希望这能奏效。
要删除DataFrame中的列,我可以成功使用:
del df['column_name']
但为什么我不能使用以下选项?
del df.column_name
由于可以通过df.column_name访问该系列,所以我希望这能奏效。
当前回答
通过使用自动补全或“IntelliSense”而不是字符串文字来获得优势:
del df[df.column1.name]
# or
df.drop(df.column1.name, axis=1, inplace=True)
它适用于当前的Pandas版本。
其他回答
我们可以通过drop()方法删除或删除一个或多个指定列。
假设df是一个数据帧。
要删除的列=列0
代码:
df = df.drop(column0, axis=1)
要删除多个列col1、col2、,coln,我们必须在列表中插入所有需要删除的列。然后通过drop()方法删除它们。
代码:
df = df.drop([col1, col2, . . . , coln], axis=1)
按索引删除
删除第一列、第二列和第四列:
df.drop(df.columns[[0,1,3]], axis=1, inplace=True)
删除第一列:
df.drop(df.columns[[0]], axis=1, inplace=True)
此处有一个可选参数可以在不创建副本的情况下修改数据。
被逮捕的
列选择、添加、删除
删除列列名:
df.pop('column-name')
示例:
df = DataFrame.from_items([('A', [1, 2, 3]), ('B', [4, 5, 6]), ('C', [7,8, 9])], orient='index', columns=['one', 'two', 'three'])
打印df:
one two three
A 1 2 3
B 4 5 6
C 7 8 9
df.drop(df.columns[[0],axis=1,inplace=True)打印df:
two three
A 2 3
B 5 6
C 8 9
三=df.pop(“三”)打印df:
two
A 2
B 5
C 8
如果原始数据帧df不太大,没有内存限制,只需要保留几列,或者,如果事先不知道不需要的所有额外列的名称,那么不妨创建一个只包含所需列的新数据帧:
new_df = df[['spam', 'sausage']]
总是使用[]符号是一个很好的做法。一个原因是属性表示法(df.column_name)不适用于编号索引:
In [1]: df = DataFrame([[1, 2, 3], [4, 5, 6]])
In [2]: df[1]
Out[2]:
0 2
1 5
Name: 1
In [3]: df.1
File "<ipython-input-3-e4803c0d1066>", line 1
df.1
^
SyntaxError: invalid syntax
Pandas 0.21+答案
Pandas 0.21版略微更改了drop方法,以包括索引和列参数,以匹配重命名和重新索引方法的签名。
df.drop(columns=['column_a', 'column_c'])
就我个人而言,我更喜欢使用axis参数来表示列或索引,因为它是几乎所有panda方法中使用的主要关键字参数。但是,现在您在0.21版中增加了一些选择。