在Python Pandas中,检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?

我知道函数pd。isnan,但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。


当前回答

试试下面的方法

df.isnull().sum()

or

df.isna().values.any()

其他回答

条形表示缺少的值

import missingno
missingno.bar(df)# will give you exact no of values and values missing

由于pandas必须为DataFrame.dropna()找到这一点,我看了看他们是如何实现它的,并发现他们使用了DataFrame.count(),它会计数DataFrame中的所有非空值。参考熊猫源代码。我还没有对这种技术进行基准测试,但我认为库的作者可能已经就如何实现它做出了明智的选择。

最好的方法是:

df.isna().any().any()

原因如下。所以isna()被用来定义isnull(),但这两者当然是相同的。

这甚至比公认的答案还要快,并且涵盖了所有2D熊猫数组。

只是用 math.isnan(x),如果x是NaN(不是数字)则返回True,否则返回False。

或者你可以在DF上使用.info(),例如:

df.info(null_counts=True)返回列中非_null的行数,例如:

<class 'pandas.core.frame.DataFrame'>
Int64Index: 3276314 entries, 0 to 3276313
Data columns (total 10 columns):
n_matches                          3276314 non-null int64
avg_pic_distance                   3276314 non-null float64