我想在一个数据帧列中计算NA值的数量。假设我的数据帧称为df,我正在考虑的列的名称是col。我提出的方法如下:
sapply(df$col, function(x) sum(length(which(is.na(x)))))
这是一个好的/最有效的方法吗?
我想在一个数据帧列中计算NA值的数量。假设我的数据帧称为df,我正在考虑的列的名称是col。我提出的方法如下:
sapply(df$col, function(x) sum(length(which(is.na(x)))))
这是一个好的/最有效的方法吗?
当前回答
在summary()输出中,该函数还计算NAs的数量,因此如果需要几个变量中NAs的总和,可以使用该函数。
其他回答
如果您希望计算整个数据帧中的NAs数量,也可以使用
sum(is.na(df))
如果你在一个数据帧中寻找每一列的NA计数,那么:
na_count <-sapply(x, function(y) sum(length(which(is.na(y)))))
应该会给你一个包含每列计数的列表。
na_count <- data.frame(na_count)
应该像这样在数据框架中输出数据:
----------------------
| row.names | na_count
------------------------
| column_1 | count
你想太多了:
sum(is.na(df$col))
尝试colsum函数
df <- data.frame(x = c(1,2,NA), y = rep(NA, 3))
colSums(is.na(df))
#x y
#1 3
类似于hute37的答案,但使用了purrr包。我认为这种tidyverse方法比AbiK提出的答案更简单。
library(purrr)
map_dbl(df, ~sum(is.na(.)))
注意:波浪号(~)创建一个匿名函数。还有'。’指的是匿名函数的输入,在本例中为data.frame df。