在Python Pandas中,检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?
我知道函数pd。isnan,但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。
在Python Pandas中,检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?
我知道函数pd。isnan,但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。
当前回答
另一种方法是dropna,检查长度是否相等:
>>> len(df.dropna()) != len(df)
True
>>>
其他回答
因为没有人提到,还有另一个变量叫做hasnans。
df[我]。如果pandas系列中的一个或多个值为NaN, hasnans将输出为True,否则为False。注意,它不是一个函数。
熊猫版本“0.19.2”和“0.20.2”
最好的方法是:
df.isna().any().any()
原因如下。所以isna()被用来定义isnull(),但这两者当然是相同的。
这甚至比公认的答案还要快,并且涵盖了所有2D熊猫数组。
试试下面的方法
df.isnull().sum()
or
df.isna().values.any()
根据您正在处理的数据类型,您还可以在执行EDA时通过将dropna设置为False来获得每列的值计数。
for col in df:
print df[col].value_counts(dropna=False)
适用于分类变量,但当你有很多唯一值时就不那么适用了。
import missingno as msno
msno.matrix(df) # just to visualize. no missing value.