我如何计算在熊猫数据框架一列的NaN值?

我想找出我的数据的每一列中NaN的数量。

当前回答

你可以试试:

In [1]: s = pd.DataFrame('a'=[1,2,5, np.nan, np.nan,3],'b'=[1,3, np.nan, np.nan,3,np.nan])

In [4]: s.isna().sum()   
Out[4]: out = {'a'=2, 'b'=3} # the number of NaN values for each column

如果需要nan的总和:

In [5]: s.isna().sum().sum()
Out[6]: out = 5  #the inline sum of Out[4]

2022-02-22 03:36:36

其他回答

如果你正在使用Jupyter笔记本，如何....

 %%timeit
 df.isnull().any().any()

 %timeit 
 df.isnull().values.sum()

或者，数据中是否存在nan，如果有，在哪里?

 df.isnull().any()

2016-04-19 06:23:08

假设您希望获得一个名为reviews的数据框架中称为price的列(系列)中缺失值(NaN)的数量

#import the dataframe
import pandas as pd

reviews = pd.read_csv("../input/wine-reviews/winemag-data-130k-v2.csv", index_col=0)

用n_missing_prices作为变量来获取缺失的值，简单地做

n_missing_prices = sum(reviews.price.isnull())
print(n_missing_prices)

Sum是这里的关键方法，在我意识到Sum是在这种情况下使用的正确方法之前，我试图使用count

2019-04-10 08:47:06

.sum df.isnull () () 将给出缺失值的列和。

如果你想知道特定列中缺失值的总和，那么以下代码将起作用:

2019-08-23 12:58:43

自从pandas 0.14.1以来，我的建议在value_counts方法中有一个关键字参数已经实现:

import pandas as pd
df = pd.DataFrame({'a':[1,2,np.nan], 'b':[np.nan,1,np.nan]})
for col in df:
    print df[col].value_counts(dropna=False)

2     1
 1     1
NaN    1
dtype: int64
NaN    2
 1     1
dtype: int64

2014-10-09 07:14:27

你可以从非nan值的计数中减去总长度:

count_nan = len(df) - df.count()

你应该根据你的数据计算时间。与isnull解相比，小级数的速度提高了3倍。

2014-10-08 21:05:52

我如何计算在熊猫数据框架一列的NaN值?

推荐文章

最新文章

标签