我想用一个或条件来过滤我的数据帧,以保持特定列的值超出范围[-0.25,0.25]的行。我尝试了:
df = df[(df['col'] < -0.25) or (df['col'] > 0.25)]
但我得到了错误:
级数的真值不明确。使用a.empty、a.bool()、a.item()、.any()或.all()
我想用一个或条件来过滤我的数据帧,以保持特定列的值超出范围[-0.25,0.25]的行。我尝试了:
df = df[(df['col'] < -0.25) or (df['col'] > 0.25)]
但我得到了错误:
级数的真值不明确。使用a.empty、a.bool()、a.item()、.any()或.all()
当前回答
我在这个命令中遇到了一个错误:
if df != '':
pass
但当我把它改成这样时,它起了作用:
if df is not '':
pass
其他回答
如果您有多个值:
df['col'].all()
如果只有一个值:
df['col'].item()
或者,也可以使用操作员模块。更多详细信息请参见Python文档:
import operator
import numpy as np
import pandas as pd
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5,3), columns=list('ABC'))
df.loc[operator.or_(df.C > 0.25, df.C < -0.25)]
A B C
0 1.764052 0.400157 0.978738
1 2.240893 1.867558 -0.977278
3 0.410599 0.144044 1.454274
4 0.761038 0.121675 0.4438
or和Python语句需要真值。对于panda,这些被认为是不明确的,因此应该使用“按位”|(或)或&(和)操作:
df = df[(df['col'] < -0.25) | (df['col'] > 0.25)]
对于这些类型的数据结构,它们被重载,以生成元素或和。
只是为了给这句话补充一些解释:
当你想得到熊猫的嘘声时,会抛出异常。系列:
>>> import pandas as pd
>>> x = pd.Series([1])
>>> bool(x)
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
您到达了一个位置,在该位置运算符隐式地将操作数转换为布尔值(您使用了或,但它也适用于和、if和while):
>>> x or x
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
>>> x and x
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
>>> if x:
... print('fun')
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
>>> while x:
... print('fun')
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
除了这四个语句之外,还有几个Python函数隐藏了一些bool调用(比如any、all、filter…)。pandas.Series通常不会有问题,但为了完整起见,我想提一下这些。
在您的案例中,例外并没有真正的帮助,因为它没有提到正确的替代方案。对于和和或,如果要按元素进行比较,可以使用:
numpy.logical_或:>>>将numpy导入为np>>>np.逻辑或(x,y)或简单地使用|运算符:>>>x |年numpy.logical_and:>>>np.逻辑和(x,y)或简单地使用&运算符:>>>x和y
如果您使用的是运算符,请确保正确设置括号,因为运算符优先。
有几个逻辑NumPy函数可以在pandas.Series上工作。
如果在执行if或while时遇到异常,则异常中提到的备选方案更适合。我将很快解释其中的每一个:
如果要检查系列是否为空:>>>x=pd.系列([])>>>x.空真的>>>x=pd.系列([1])>>>x.空错误如果没有明确的布尔解释,Python通常会将容器的长度(如列表、元组等)解释为真值。因此,如果您想进行类似Python的检查,可以这样做:如果x.size或如果不是x.empty,而不是如果x。如果“系列”包含且仅包含一个布尔值:>>>x=pd.系列([100])>>>(x>50).bool()真的>>>(x<50).bool()错误如果您想检查Series的第一项也是唯一一项(例如.bool(),但它甚至适用于非布尔内容):>>>x=pd.系列([100])>>>x.项()100如果要检查所有或任何项目是否不为零、不为空或不为False:>>>x=pd.系列([0,1,2])>>>x.all()#因为一个元素为零错误>>>x.any()#,因为一个(或多个)元素非零真的
我在这个命令中遇到了一个错误:
if df != '':
pass
但当我把它改成这样时,它起了作用:
if df is not '':
pass
我在熊猫数据框架中工作时也遇到过同样的问题。
我使用过:numpy.logical_and:
在这里,我试图选择Id与41d7853匹配且degree_type不与Certification匹配的行。
如下所示:
display(df_degrees.loc[np.logical_and(df_degrees['person_id'] == '41d7853' , df_degrees['degree_type'] !='Certification')])
如果我尝试编写如下代码:
display(df_degrees.loc[df_degrees['person_id'] == '41d7853' and df_degrees['degree_type'] !='Certification'])
我们将得到错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我使用了numpy.logical_,它对我很有用。