我想在一个数据帧列中计算NA值的数量。假设我的数据帧称为df,我正在考虑的列的名称是col。我提出的方法如下:

sapply(df$col, function(x) sum(length(which(is.na(x)))))  

这是一个好的/最有效的方法吗?


当前回答

如果您希望计算整个数据帧中的NAs数量,也可以使用

sum(is.na(df))

其他回答

试试这个:

length(df$col[is.na(df$col)])

你想太多了:

sum(is.na(df$col))

一种统计数据帧中每一列空值的方法:

library(tidyverse)
library(purrr)

df %>%
    map_df(function(x) sum(is.na(x))) %>%
    gather(feature, num_nulls) %>%
    print(n = 100)

尝试colsum函数

df <- data.frame(x = c(1,2,NA), y = rep(NA, 3))

colSums(is.na(df))

#x y 
#1 3 

如果您希望计算整个数据帧中的NAs数量,也可以使用

sum(is.na(df))