假设我有以下Pandas数据框架:

df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]})
df

     A   B
0    5   1
1    6   2
2    3   3
3    4   5

我可以基于一个特定的值进行子集:

x = df[df['A'] == 3]
x

     A   B
2    3   3

但是如何根据值列表进行子集呢?-就像这样:

list_of_values = [3,6]

y = df[df['A'] in list_of_values]

得到:

     A    B
1    6    2
2    3    3

当前回答

你可以将你的值存储在一个列表中:

lis河=

then

df1 = df[df['A'].isin(lis)]

其他回答

它在f-Strings中更棘手

list_of_values = [3,6]


df.query(f'A in {list_of_values}')

你可以将你的值存储在一个列表中:

lis河=

then

df1 = df[df['A'].isin(lis)]

在速度方面比较的非熊猫解决方案可能是:

filtered_column = set(df.A) - set(list_list_of_values)

另一种方法;

df.loc[df.apply(lambda x: x.A in [3,6], axis=1)]

与isin方法不同,这在确定列表是否包含列a的函数时特别有用。例如,f(a) = 2* a - 5作为函数;

df.loc[df.apply(lambda x: 2*x.A-5 in [3,6], axis=1)]

应该注意的是,这种方法比isin方法慢。

你可以使用query方法:

df.query('A in [6, 3]')
# df.query('A == [6, 3]')

or

lst = [6, 3]
df.query('A in @lst')
# df.query('A == @lst')