如何找到哪些列包含任何NaN值在熊猫数据框架

给定一个pandas数据框架，其中包含可能分散在这里和那里的NaN值:

问:如何确定哪些列包含NaN值?特别是，我能得到包含nan的列名的列表吗?

当前回答

要查看包含nan的列和包含nan的行:

isnulldf = df.isnull()
columns_containing_nulls = isnulldf.columns[isnulldf.any()]
rows_containing_nulls = df[isnulldf[columns_containing_nulls].any(axis='columns')].index
only_nulls_df = df[columns_containing_nulls].loc[rows_containing_nulls]
print(only_nulls_df)

2021-07-09 15:50:42

其他回答

Features_with_na =[feature用于数据帧中的特征。列if dataframe[features].isnull().sum()>0]

对于features_with_na中的feature: Print (feature, np.round(dataframe[feature].isnull().mean()， 4)， '%缺失值') 打印(features_with_na)

它将为dataframe中的每一列提供缺失值的%

2021-08-08 17:19:00

这是其中一种方法。

import pandas as pd
df = pd.DataFrame({'a':[1,2,np.nan], 'b':[np.nan,1,np.nan],'c':[np.nan,2,np.nan], 'd':[np.nan,np.nan,np.nan]})
print(pd.isnull(df).sum())

在这里输入图像描述

2021-06-23 12:33:20

如果您希望查找包含NaN值的列并获得列名列表，则该代码可以工作。

na_names = df.isnull().any()
list(na_names.where(na_names == True).dropna().index)

如果要查找值都是nan的列，可以将any替换为all。

2022-01-26 06:50:59

df.columns[df.isnull().any()].tolist()

它将返回包含空行的列的名称

2021-01-09 02:03:06

这两种方法都有效:

df.isnull().sum()
df.isna().sum()

DataFrame方法isna()或isnull()完全相同。

注意:空字符串”被认为是False(不认为是NA)

2019-05-06 22:00:54

如何找到哪些列包含任何NaN值在熊猫数据框架

推荐文章

最新文章

标签