我如何计算在熊猫数据框架一列的NaN值?

我想找出我的数据的每一列中NaN的数量。

当前回答

数零:

df[df == 0].count(axis=0)

计算NaN:

df.isnull().sum()

df.isna().sum()

2019-07-31 10:59:32

其他回答

自从pandas 0.14.1以来，我的建议在value_counts方法中有一个关键字参数已经实现:

import pandas as pd
df = pd.DataFrame({'a':[1,2,np.nan], 'b':[np.nan,1,np.nan]})
for col in df:
    print df[col].value_counts(dropna=False)

2     1
 1     1
NaN    1
dtype: int64
NaN    2
 1     1
dtype: int64

2014-10-09 07:14:27

根据投票最多的答案，我们可以很容易地定义一个函数，给我们一个数据框架来预览每一列中缺失的值和缺失值的百分比:

def missing_values_table(df):
    mis_val = df.isnull().sum()
    mis_val_percent = 100 * df.isnull().sum() / len(df)
    mis_val_table = pd.concat([mis_val, mis_val_percent], axis=1)
    mis_val_table_ren_columns = mis_val_table.rename(
    columns = {0 : 'Missing Values', 1 : '% of Total Values'})
    mis_val_table_ren_columns = mis_val_table_ren_columns[
        mis_val_table_ren_columns.iloc[:,1] != 0].sort_values(
    '% of Total Values', ascending=False).round(1)
    print ("Your selected dataframe has " + str(df.shape[1]) + " columns.\n"      
        "There are " + str(mis_val_table_ren_columns.shape[0]) +
            " columns that have missing values.")
    return mis_val_table_ren_columns

2016-09-27 21:01:57

假设您希望获得一个名为reviews的数据框架中称为price的列(系列)中缺失值(NaN)的数量

#import the dataframe
import pandas as pd

reviews = pd.read_csv("../input/wine-reviews/winemag-data-130k-v2.csv", index_col=0)

用n_missing_prices作为变量来获取缺失的值，简单地做

n_missing_prices = sum(reviews.price.isnull())
print(n_missing_prices)

Sum是这里的关键方法，在我意识到Sum是在这种情况下使用的正确方法之前，我试图使用count

2019-04-10 08:47:06

df1.isnull().sum()

这样就可以了。

2018-05-13 12:25:54

.sum df.isnull () () 将给出缺失值的列和。

如果你想知道特定列中缺失值的总和，那么以下代码将起作用:

2019-08-23 12:58:43

我如何计算在熊猫数据框架一列的NaN值?

推荐文章

最新文章

标签