如何检查在熊猫数据框架中是否有NaN值

在Python Pandas中，检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?

我知道函数pd。isnan，但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。

当前回答

要找出特定列中哪些行有nan:

nan_rows = df[df['name column'].isnull()]

2017-11-19 13:13:03

其他回答

另一种方法是dropna，检查长度是否相等:

>>> len(df.dropna()) != len(df)
True
>>>

2021-10-18 15:06:15

我一直在使用以下和类型转换为字符串，并检查nan值

   (str(df.at[index, 'column']) == 'nan')

这允许我检查一个系列中的特定值，而不只是返回如果它包含在系列中的某个地方。

2019-05-08 09:29:17

df为Pandas数据框架的名称，任意值为numpy。Nan为空值。

如果你想查看哪些列有空，哪些没有(只有True和False) .any df.isnull () () 如果您只想查看有空值的列 df。loc [: df.isnull () .any ()] .columns 如果您想查看每一列中null的计数 .sum df.isna () () 如果您想查看每一列中空的百分比 .sum df.isna () () / (len (df)) * 100 如果你想查看只有空值的列中空值的百分比:

df.loc[:,list(df.loc[:,df.isnull().any()].columns)].isnull().sum()/(len(df))*100

编辑1:

如果你想从视觉上看到数据缺失的地方:

import missingno
missingdata_df = df.columns[df.isnull().any()].tolist()
missingno.matrix(df[missingdata_df])

2019-07-22 07:29:07

最好的方法是:

df.isna().any().any()

原因如下。所以isna()被用来定义isnull()，但这两者当然是相同的。

这甚至比公认的答案还要快，并且涵盖了所有2D熊猫数组。

2019-06-03 11:00:51

由于pandas必须为DataFrame.dropna()找到这一点，我看了看他们是如何实现它的，并发现他们使用了DataFrame.count()，它会计数DataFrame中的所有非空值。参考熊猫源代码。我还没有对这种技术进行基准测试，但我认为库的作者可能已经就如何实现它做出了明智的选择。

2016-06-16 05:06:18

如何检查在熊猫数据框架中是否有NaN值

推荐文章

最新文章

标签