如何检查在熊猫数据框架中是否有NaN值

在Python Pandas中，检查DataFrame是否有一个(或多个)NaN值的最佳方法是什么?

我知道函数pd。isnan，但这将返回每个元素的布尔值的DataFrame。这篇文章也没有完全回答我的问题。

当前回答

df.isna().any(axis=None)

从v0.23.2开始，您可以使用DataFrame。isna + DataFrame.any(axis=None)，其中axis=None指定整个DataFrame的逻辑缩减。

# Setup
df = pd.DataFrame({'A': [1, 2, np.nan], 'B' : [np.nan, 4, 5]})
df
     A    B
0  1.0  NaN
1  2.0  4.0
2  NaN  5.0

df.isna()

       A      B
0  False   True
1  False  False
2   True  False

df.isna().any(axis=None)
# True

有用的替代方案

numpy.isnan 如果您正在运行旧版本的pandas，则另一个性能选项。

np.isnan(df.values)

array([[False,  True],
       [False, False],
       [ True, False]])

np.isnan(df.values).any()
# True

或者，检查和:

np.isnan(df.values).sum()
# 2

np.isnan(df.values).sum() > 0
# True

Series.hasnans 你也可以迭代地调用Series.hasnans。例如，要检查单个列是否有nan，

df['A'].hasnans
# True

要检查任何列是否具有nan，可以对any使用推导式(这是一种短路操作)。

any(df[c].hasnans for c in df)
# True

这实际上非常快。

2018-12-20 04:33:16

其他回答

你不仅可以检查是否有'NaN'存在，还可以使用下面的方法得到'NaN'在每一列中的百分比，

df = pd.DataFrame({'col1':[1,2,3,4,5],'col2':[6,np.nan,8,9,10]})  
df  

   col1 col2  
0   1   6.0  
1   2   NaN  
2   3   8.0  
3   4   9.0  
4   5   10.0  


df.isnull().sum()/len(df)  
col1    0.0  
col2    0.2  
dtype: float64

2020-02-04 21:50:13

下面是另一种有趣的查找null并替换为计算值的方法

    #Creating the DataFrame

    testdf = pd.DataFrame({'Tenure':[1,2,3,4,5],'Monthly':[10,20,30,40,50],'Yearly':[10,40,np.nan,np.nan,250]})
    >>> testdf2
       Monthly  Tenure  Yearly
    0       10       1    10.0
    1       20       2    40.0
    2       30       3     NaN
    3       40       4     NaN
    4       50       5   250.0

    #Identifying the rows with empty columns
    nan_rows = testdf2[testdf2['Yearly'].isnull()]
    >>> nan_rows
       Monthly  Tenure  Yearly
    2       30       3     NaN
    3       40       4     NaN

    #Getting the rows# into a list
    >>> index = list(nan_rows.index)
    >>> index
    [2, 3]

    # Replacing null values with calculated value
    >>> for i in index:
        testdf2['Yearly'][i] = testdf2['Monthly'][i] * testdf2['Tenure'][i]
    >>> testdf2
       Monthly  Tenure  Yearly
    0       10       1    10.0
    1       20       2    40.0
    2       30       3    90.0
    3       40       4   160.0
    4       50       5   250.0

2018-08-27 16:11:48

因为没有人提到，还有另一个变量叫做hasnans。

df[我]。如果pandas系列中的一个或多个值为NaN, hasnans将输出为True，否则为False。注意，它不是一个函数。

熊猫版本“0.19.2”和“0.20.2”

2017-05-05 14:17:24

根据您正在处理的数据类型，您还可以在执行EDA时通过将dropna设置为False来获得每列的值计数。

for col in df:
   print df[col].value_counts(dropna=False)

适用于分类变量，但当你有很多唯一值时就不那么适用了。

2016-03-24 02:44:40

试试下面的方法

df.isnull().sum()

df.isna().values.any()

2021-10-06 05:50:13

如何检查在熊猫数据框架中是否有NaN值

推荐文章

最新文章

标签