我想在一个数据帧列中计算NA值的数量。假设我的数据帧称为df,我正在考虑的列的名称是col。我提出的方法如下:
sapply(df$col, function(x) sum(length(which(is.na(x)))))
这是一个好的/最有效的方法吗?
我想在一个数据帧列中计算NA值的数量。假设我的数据帧称为df,我正在考虑的列的名称是col。我提出的方法如下:
sapply(df$col, function(x) sum(length(which(is.na(x)))))
这是一个好的/最有效的方法吗?
当前回答
如果你在每一列中寻找空值,然后一个接一个地打印,那么你可以使用这个。简单的解决方案。
lapply(df, function(x) { length(which(is.na(x)))})
其他回答
这个表格与凯文·奥戈洛斯的表格略有不同:
na_count <-function (x) sapply(x, function(y) sum(is.na(y)))
返回命名为int数组的NA计数
在summary()输出中,该函数还计算NAs的数量,因此如果需要几个变量中NAs的总和,可以使用该函数。
如果您希望计算整个数据帧中的NAs数量,也可以使用
sum(is.na(df))
尝试colsum函数
df <- data.frame(x = c(1,2,NA), y = rep(NA, 3))
colSums(is.na(df))
#x y
#1 3
如果你在每一列中寻找空值,然后一个接一个地打印,那么你可以使用这个。简单的解决方案。
lapply(df, function(x) { length(which(is.na(x)))})