如何检查在熊猫数据框架中是否有NaN值

在Python Pandas中，检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?

我知道函数pd。isnan，但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。

当前回答

根据您正在处理的数据类型，您还可以在执行EDA时通过将dropna设置为False来获得每列的值计数。

for col in df:
   print df[col].value_counts(dropna=False)

适用于分类变量，但当你有很多唯一值时就不那么适用了。

2016-03-24 02:44:40

其他回答

因为没有人提到，还有另一个变量叫做hasnans。

df[我]。如果pandas系列中的一个或多个值为NaN, hasnans将输出为True，否则为False。注意，它不是一个函数。

熊猫版本“0.19.2”和“0.20.2”

2017-05-05 14:17:24

或者你可以在DF上使用.info()，例如:

df.info(null_counts=True)返回列中非_null的行数，例如:

<class 'pandas.core.frame.DataFrame'>
Int64Index: 3276314 entries, 0 to 3276313
Data columns (total 10 columns):
n_matches                          3276314 non-null int64
avg_pic_distance                   3276314 non-null float64

2018-06-26 11:30:09

如果你需要知道有多少行有“一个或多个nan”:

df.isnull().T.any().T.sum()

或者如果你需要取出这些行并检查它们:

nan_rows = df[df.isnull().T.any()]

2016-05-25 16:17:45

只是用 math.isnan(x)，如果x是NaN(不是数字)则返回True，否则返回False。

2017-11-02 03:06:02

df.apply(axis=0, func=lambda x : any(pd.isnull(x)))

将检查每一列是否包含Nan。

2018-12-24 15:29:56

如何检查在熊猫数据框架中是否有NaN值

推荐文章

最新文章

标签