我如何替换NA值与零在一个R数据框架?

我有一个数据帧和一些列有NA值。

我如何将这些NA值替换为零?

当前回答

专用函数nafill和setnafill，用于此目的，在data.table中。只要可用，它们就将列分发到多个线程上进行计算。

library(data.table)

ans_df <- nafill(df, fill=0)

# or even faster, in-place
setnafill(df, fill=0)

2019-02-03 15:46:02

其他回答

也可以使用tidyr::replace_na。

    library(tidyr)
    df <- df %>% mutate_all(funs(replace_na(.,0)))

编辑(dplyr > 1.0.0):

df %>% mutate(across(everything(), .fns = ~replace_na(.,0)))

2019-01-13 21:14:41

我知道这个问题已经有了答案，但这样做可能对一些人更有用:

定义这个函数:

na.zero <- function (x) {
    x[is.na(x)] <- 0
    return(x)
}

现在，无论何时你需要将向量中的NA转换为0，你可以这样做:

na.zero(some.vector)

2015-09-24 13:49:59

我想添加一个使用流行的Hmisc包的下一个解决方案。

library(Hmisc)
data(airquality)
# imputing with 0 - all columns
# although my favorite one for simple imputations is Hmisc::impute(x, "random")
> dd <- data.frame(Map(function(x) Hmisc::impute(x, 0), airquality))
> str(dd[[1]])
 'impute' Named num [1:153] 41 36 12 18 0 28 23 19 8 0 ...
 - attr(*, "names")= chr [1:153] "1" "2" "3" "4" ...
 - attr(*, "imputed")= int [1:37] 5 10 25 26 27 32 33 34 35 36 ...
> dd[[1]][1:10]
  1   2   3   4   5   6   7   8   9  10 
 41  36  12  18  0*  28  23  19   8  0*

可以看到，所有的imputation元数据都被分配为属性。因此它可以在以后使用。

2020-09-23 19:42:37

另一个与tidyrmethod replace_na兼容的dplyr管道选项，适用于多个列:

require(dplyr)
require(tidyr)

m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)
d <- as.data.frame(m)

myList <- setNames(lapply(vector("list", ncol(d)), function(x) x <- 0), names(d))

df <- d %>% replace_na(myList)

你可以很容易地限制到例如数字列:

d$str <- c("string", NA)

myList <- myList[sapply(d, is.numeric)]

df <- d %>% replace_na(myList)

2016-10-10 11:25:07

cleaner包有一个na_replace()泛型，默认情况下将数值替换为0，将逻辑替换为FALSE，将日期替换为今天，等等:

library(dplyr)
library(cleaner)

starwars %>% na_replace()
na_replace(starwars)

它甚至支持矢量化替换:

mtcars[1:6, c("mpg", "hp")] <- NA
na_replace(mtcars, mpg, hp, replacement = c(999, 123))

文档:https://msberends.github.io/cleaner/reference/na_replace.html

2020-07-09 07:04:08

我如何替换NA值与零在一个R数据框架?

推荐文章

最新文章

标签