Python dataframe pandas使用int删除列

我知道去掉一列要用df。Drop ('column name'， axis=1)。是否有一种方法可以使用数字索引而不是列名来删除列?

当前回答

您需要根据列在数据框架中的位置来标识它们。例如，如果你想删除(del)列2、3和5，它将是，

df.drop(df.columns[[2,3,5]], axis = 1)

其他回答

如果有两个名称相同的列。一种简单的方法是手动重命名列，就像这样

df.columns = ['column1', 'column2', 'column3']

然后你可以根据你的要求通过列索引，像这样:-

df.drop(df.columns[1], axis=1, inplace=True)

df。列[1]将删除索引1。

记住轴1 =列，轴0 =行。

您可以使用下面的行删除前两列(或任何您不需要的列):

df.drop([df.columns[0], df.columns[1]], axis=1)

参考

感谢我很晚才参加派对，但我也有同样的问题，一个DataFrame有一个MultiIndex。Pandas真的不喜欢非唯一的多索引，在某种程度上，上面的大多数解决方案在这种设置下都不起作用(例如，.drop函数只会错误地带有ValueError:不能处理非唯一的多索引!)

我得到的解决方案是使用.iloc代替。根据文档，use可以使用带有掩码的iloc(=你想保留的列的True/False值列表):

使用长度与列匹配的布尔数组。 df。iloc[:，[正确，错误，正确，错误]]

结合df.columns. duplication()来识别重复的列，你可以以一种高效的、panda -native的方式做到这一点:

df = df.iloc[:, ~df.columns.duplicated()]

由于可以有多个具有相同名称的列，我们应该首先重命名列。下面是解决方案的代码。

df.columns=list(range(0,len(df.columns)))
df.drop(columns=[1,2])#drop second and third columns

您需要根据列在数据框架中的位置来标识它们。例如，如果你想删除(del)列2、3和5，它将是，

df.drop(df.columns[[2,3,5]], axis = 1)

推荐文章