我知道去掉一列要用df。Drop ('column name', axis=1)。是否有一种方法可以使用数字索引而不是列名来删除列?
当前回答
如果有两个名称相同的列。一种简单的方法是手动重命名列,就像这样
df.columns = ['column1', 'column2', 'column3']
然后你可以根据你的要求通过列索引,像这样:-
df.drop(df.columns[1], axis=1, inplace=True)
df。列[1]将删除索引1。
记住轴1 =列,轴0 =行。
其他回答
您需要根据列在数据框架中的位置来标识它们。例如,如果你想删除(del)列2、3和5,它将是,
df.drop(df.columns[[2,3,5]], axis = 1)
你可以像这样删除i索引上的列:
df.drop(df.columns[i], axis=1)
这可能会很奇怪,如果列中有重复的名字,你可以重命名你想要删除的列。或者你可以像这样重新分配数据帧:
df = df.iloc[:, [j for j, c in enumerate(df.columns) if j != i]]
由于可以有多个具有相同名称的列,我们应该首先重命名列。 下面是解决方案的代码。
df.columns=list(range(0,len(df.columns)))
df.drop(columns=[1,2])#drop second and third columns
如果您真的想处理整数(为什么?),那么您可以构建一个字典。
col_dict = {x: col for x, col in enumerate(df.columns)}
那么df = df。Drop (col_dict[0], 1)将按预期工作
编辑:你可以把它放在一个为你做这件事的函数中,尽管这样它会在你每次调用它的时候创建字典
def drop_col_n(df, col_n_to_drop):
col_dict = {x: col for x, col in enumerate(df.columns)}
return df.drop(col_dict[col_n_to_drop], 1)
df = drop_col_n(df, 2)
您可以使用下面的行删除前两列(或任何您不需要的列):
df.drop([df.columns[0], df.columns[1]], axis=1)
参考
推荐文章
- Numpy Max vs amax vs maximum
- 我应该在.gitignore文件中添加Django迁移文件吗?
- 每n行有熊猫
- 实例属性attribute_name定义在__init__之外
- 如何获取在Python中捕获的异常的名称?
- 第一次出现的值大于现有值的Numpy
- 如何从Python函数中返回两个值?
- 前一个月的Python日期
- Python中方括号括起来的列表和圆括号括起来的列表有什么区别?
- Python日志记录不输出任何东西
- 每n秒运行特定代码
- SQLAlchemy是否有与Django的get_or_create等价的函数?
- 如何将python datetime转换为字符串,具有可读格式的日期?
- 美丽的汤和提取div及其内容的ID
- 在Python中重置生成器对象