我如何替换NA值与零在一个R数据框架?

我有一个数据帧和一些列有NA值。

我如何将这些NA值替换为零?

当前回答

在dplyr 0.5.0中，你可以使用coalesce函数，通过做coalesce(vec, 0)可以很容易地集成到%>%管道中。这将把vec中的所有NAs替换为0:

假设我们有一个带NAs的数据帧:

library(dplyr)
df <- data.frame(v = c(1, 2, 3, NA, 5, 6, 8))

df
#    v
# 1  1
# 2  2
# 3  3
# 4 NA
# 5  5
# 6  6
# 7  8

df %>% mutate(v = coalesce(v, 0))
#   v
# 1 1
# 2 2
# 3 3
# 4 0
# 5 5
# 6 6
# 7 8

2016-09-16 21:25:56

其他回答

更通用的方法是在矩阵或向量中使用replace()将NA替换为0

例如:

> x <- c(1,2,NA,NA,1,1)
> x1 <- replace(x,is.na(x),0)
> x1
[1] 1 2 0 0 1 1

这也是在dplyr中使用ifelse()的一种替代方法

df = data.frame(col = c(1,2,NA,NA,1,1))
df <- df %>%
   mutate(col = replace(col,is.na(col),0))

2016-02-25 04:30:47

如果我们试图在导出时替换NAs，例如写入csv时，那么我们可以使用:

  write.csv(data, "data.csv", na = "0")

2014-02-21 16:27:39

DPLYR >= 1.0.0

在dplyr的新版本中:

Across()取代了一系列“作用域变量”，如summarise_at()、summarise_if()和summarise_all()。

df <- data.frame(a = c(LETTERS[1:3], NA), b = c(NA, 1:3))

library(tidyverse)

df %>% 
  mutate(across(where(anyNA), ~ replace_na(., 0)))

  a b
1 A 0
2 B 1
3 C 2
4 0 3

这段代码将强制0为第一列中的字符。要根据列类型替换NA，您可以使用类似呜呜声的公式，其中:

df %>% 
  mutate(across(where(~ anyNA(.) & is.character(.)), ~ replace_na(., "0")))

2021-03-31 17:48:39

如果你想在因子变量中替换NAs，这可能是有用的:

n <- length(levels(data.vector))+1

data.vector <- as.numeric(data.vector)
data.vector[is.na(data.vector)] <- n
data.vector <- as.factor(data.vector)
levels(data.vector) <- c("level1","level2",...,"leveln", "NAlevel")

它将因子向量转换为数值向量，并添加另一个人工数值因子水平，然后将其转换回具有您选择的额外“na水平”的因子向量。

2016-03-17 08:55:45

在dplyr 0.5.0中，你可以使用coalesce函数，通过做coalesce(vec, 0)可以很容易地集成到%>%管道中。这将把vec中的所有NAs替换为0:

假设我们有一个带NAs的数据帧:

library(dplyr)
df <- data.frame(v = c(1, 2, 3, NA, 5, 6, 8))

df
#    v
# 1  1
# 2  2
# 3  3
# 4 NA
# 5  5
# 6  6
# 7  8

df %>% mutate(v = coalesce(v, 0))
#   v
# 1 1
# 2 2
# 3 3
# 4 0
# 5 5
# 6 6
# 7 8

2016-09-16 21:25:56

我如何替换NA值与零在一个R数据框架?

推荐文章

最新文章

标签