将特定的选定列作为副本提取到新DataFrame

我有一个熊猫DataFrame 4列，我想创建一个新的DataFrame，只有三个列。这个问题类似于:从数据帧中提取特定的列，但对于熊猫而不是r。下面的代码不起作用，会引发错误，当然不是熊猫的方式。

import pandas as pd
old = pd.DataFrame({'A' : [4,5], 'B' : [10,20], 'C' : [100,50], 'D' : [-30,-50]})
new = pd.DataFrame(zip(old.A, old.C, old.D)) # raises TypeError: data argument can't be an iterator

熊猫式的做法是什么?

当前回答

另一种更简单的方法似乎是:

new = pd.DataFrame([old.A, old.B, old.C]).transpose()

老地方。Column_name将为您提供一个系列。列出所有想要保留的列系列，并将其传递给DataFrame构造函数。我们需要做一个转置来调整形状。

In [14]:pd.DataFrame([old.A, old.B, old.C]).transpose()
Out[14]: 
   A   B    C
0  4  10  100
1  5  20   50

2019-01-15 06:50:18

其他回答

如果你想有一个新的数据帧，那么:

import pandas as pd
old = pd.DataFrame({'A' : [4,5], 'B' : [10,20], 'C' : [100,50], 'D' : [-30,-50]})
new=  old[['A', 'C', 'D']]

2020-01-24 15:41:09

最简单的方法是

new = old[['A','C','D']]

2019-06-11 18:09:12

据我所知，在使用过滤器函数时，不一定需要指定轴。

new = old.filter(['A','B','D'])

返回相同的数据框架

new = old.filter(['A','B','D'], axis=1)

2019-06-11 17:45:51

泛函形式

def select_columns(data_frame, column_names):
    new_frame = data_frame.loc[:, column_names]
    return new_frame

针对你上面的问题

selected_columns = ['A', 'C', 'D']
new = select_columns(old, selected_columns)

2019-04-08 11:04:27

作为替代:

new = pd.DataFrame().assign(A=old['A'], C=old['C'], D=old['D'])

2021-12-14 14:05:17

将特定的选定列作为副本提取到新DataFrame

推荐文章

最新文章

标签