如何找到哪些列包含任何NaN值在熊猫数据框架

给定一个pandas数据框架，其中包含可能分散在这里和那里的NaN值:

问:如何确定哪些列包含NaN值?特别是，我能得到包含nan的列名的列表吗?

当前回答

我有一个问题，我必须有许多列在屏幕上进行视觉检查，所以一个筛选并返回违规列的短列表比较

nan_cols = [i for i in df.columns if df[i].isnull().any()]

如果这对大家有帮助的话

此外，如果您想过滤掉nan值多于阈值的列，那么就使用85%

Nan_cols85 = [i for i in df.]if df[i].isnull().sum() > 0.85*len(data)]

2019-08-07 07:25:09

其他回答

这两种方法都有效:

df.isnull().sum()
df.isna().sum()

DataFrame方法isna()或isnull()完全相同。

注意:空字符串”被认为是False(不认为是NA)

2019-05-06 22:00:54

这是其中一种方法。

import pandas as pd
df = pd.DataFrame({'a':[1,2,np.nan], 'b':[np.nan,1,np.nan],'c':[np.nan,2,np.nan], 'd':[np.nan,np.nan,np.nan]})
print(pd.isnull(df).sum())

在这里输入图像描述

2021-06-23 12:33:20

df.isna()返回NaN值为True，其余为False。所以,做:

.any df.isna () ()

将返回True的任何列有NaN, False的其余

2020-11-04 14:21:12

如果您希望查找包含NaN值的列并获得列名列表，则该代码可以工作。

na_names = df.isnull().any()
list(na_names.where(na_names == True).dropna().index)

如果要查找值都是nan的列，可以将any替换为all。

2022-01-26 06:50:59

在有大量列的数据集中，最好能看到有多少列包含空值，有多少列不包含空值。

print("No. of columns containing null values")
print(len(df.columns[df.isna().any()]))

print("No. of columns not containing null values")
print(len(df.columns[df.notna().all()]))

print("Total no. of columns in the dataframe")
print(len(df.columns))

例如，在我的数据框架中，它包含82列，其中19列包含至少一个空值。

此外，您还可以自动删除cols和行，这取决于哪个有更多的空值下面是智能执行此操作的代码:

df = df.drop(df.columns[df.isna().sum()>len(df.columns)],axis = 1)
df = df.dropna(axis = 0).reset_index(drop=True)

注意:上面的代码删除了所有的空值。如果需要空值，请在此之前处理它们。

2019-10-07 05:02:03

如何找到哪些列包含任何NaN值在熊猫数据框架

推荐文章

最新文章

标签