如何检查在熊猫数据框架中是否有NaN值

在Python Pandas中，检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?

我知道函数pd。isnan，但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。

当前回答

我们可以通过使用seaborn moduleheatmap生成热图来查看数据集中存在的空值

import pandas as pd
import seaborn as sns
dataset=pd.read_csv('train.csv')
sns.heatmap(dataset.isnull(),cbar=False)

2020-05-09 02:53:08

其他回答

因为没有人提到，还有另一个变量叫做hasnans。

df[我]。如果pandas系列中的一个或多个值为NaN, hasnans将输出为True，否则为False。注意，它不是一个函数。

熊猫版本“0.19.2”和“0.20.2”

2017-05-05 14:17:24

试试下面的方法

df.isnull().sum()

df.isna().values.any()

2021-10-06 05:50:13

下面是另一种有趣的查找null并替换为计算值的方法

    #Creating the DataFrame

    testdf = pd.DataFrame({'Tenure':[1,2,3,4,5],'Monthly':[10,20,30,40,50],'Yearly':[10,40,np.nan,np.nan,250]})
    >>> testdf2
       Monthly  Tenure  Yearly
    0       10       1    10.0
    1       20       2    40.0
    2       30       3     NaN
    3       40       4     NaN
    4       50       5   250.0

    #Identifying the rows with empty columns
    nan_rows = testdf2[testdf2['Yearly'].isnull()]
    >>> nan_rows
       Monthly  Tenure  Yearly
    2       30       3     NaN
    3       40       4     NaN

    #Getting the rows# into a list
    >>> index = list(nan_rows.index)
    >>> index
    [2, 3]

    # Replacing null values with calculated value
    >>> for i in index:
        testdf2['Yearly'][i] = testdf2['Monthly'][i] * testdf2['Tenure'][i]
    >>> testdf2
       Monthly  Tenure  Yearly
    0       10       1    10.0
    1       20       2    40.0
    2       30       3    90.0
    3       40       4   160.0
    4       50       5   250.0

2018-08-27 16:11:48

最好的方法是:

df.isna().any().any()

原因如下。所以isna()被用来定义isnull()，但这两者当然是相同的。

这甚至比公认的答案还要快，并且涵盖了所有2D熊猫数组。

2019-06-03 11:00:51

由于pandas必须为DataFrame.dropna()找到这一点，我看了看他们是如何实现它的，并发现他们使用了DataFrame.count()，它会计数DataFrame中的所有非空值。参考熊猫源代码。我还没有对这种技术进行基准测试，但我认为库的作者可能已经就如何实现它做出了明智的选择。

2016-06-16 05:06:18

如何检查在熊猫数据框架中是否有NaN值

推荐文章

最新文章

标签