我如何替换NA值与零在一个R数据框架?

我有一个数据帧和一些列有NA值。

我如何将这些NA值替换为零?

当前回答

如果你想在因子变量中替换NAs，这可能是有用的:

n <- length(levels(data.vector))+1

data.vector <- as.numeric(data.vector)
data.vector[is.na(data.vector)] <- n
data.vector <- as.factor(data.vector)
levels(data.vector) <- c("level1","level2",...,"leveln", "NAlevel")

它将因子向量转换为数值向量，并添加另一个人工数值因子水平，然后将其转换回具有您选择的额外“na水平”的因子向量。

2016-03-17 08:55:45

其他回答

如果你想在因子变量中替换NAs，这可能是有用的:

n <- length(levels(data.vector))+1

data.vector <- as.numeric(data.vector)
data.vector[is.na(data.vector)] <- n
data.vector <- as.factor(data.vector)
levels(data.vector) <- c("level1","level2",...,"leveln", "NAlevel")

它将因子向量转换为数值向量，并添加另一个人工数值因子水平，然后将其转换回具有您选择的额外“na水平”的因子向量。

2016-03-17 08:55:45

DPLYR >= 1.0.0

在dplyr的新版本中:

Across()取代了一系列“作用域变量”，如summarise_at()、summarise_if()和summarise_all()。

df <- data.frame(a = c(LETTERS[1:3], NA), b = c(NA, 1:3))

library(tidyverse)

df %>% 
  mutate(across(where(anyNA), ~ replace_na(., 0)))

  a b
1 A 0
2 B 1
3 C 2
4 0 3

这段代码将强制0为第一列中的字符。要根据列类型替换NA，您可以使用类似呜呜声的公式，其中:

df %>% 
  mutate(across(where(~ anyNA(.) & is.character(.)), ~ replace_na(., "0")))

2021-03-31 17:48:39

我本想评论@ianmunoz的帖子，但我没有足够的声誉。你可以结合dplyr的mutate_each和replace来处理NA到0的替换。使用@aL3xa的答案的数据帧…

> m <- matrix(sample(c(NA, 1:10), 100, replace = TRUE), 10)
> d <- as.data.frame(m)
> d

    V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  8  1  9  6  9 NA  8  9   8
2   8  3  6  8  2  1 NA NA  6   3
3   6  6  3 NA  2 NA NA  5  7   7
4  10  6  1  1  7  9  1 10  3  10
5  10  6  7 10 10  3  2  5  4   6
6   2  4  1  5  7 NA NA  8  4   4
7   7  2  3  1  4 10 NA  8  7   7
8   9  5  8 10  5  3  5  8  3   2
9   9  1  8  7  6  5 NA NA  6   7
10  6 10  8  7  1  1  2  2  5   7

> d %>% mutate_each( funs_( interp( ~replace(., is.na(.),0) ) ) )

    V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1   4  8  1  9  6  9  0  8  9   8
2   8  3  6  8  2  1  0  0  6   3
3   6  6  3  0  2  0  0  5  7   7
4  10  6  1  1  7  9  1 10  3  10
5  10  6  7 10 10  3  2  5  4   6
6   2  4  1  5  7  0  0  8  4   4
7   7  2  3  1  4 10  0  8  7   7
8   9  5  8 10  5  3  5  8  3   2
9   9  1  8  7  6  5  0  0  6   7
10  6 10  8  7  1  1  2  2  5   7

我们在这里使用的是标准求值(SE)，这就是为什么我们需要在“funs_”上加下划线。我们还使用了lazyeval的interp/~和。引用“我们正在处理的所有东西”，即数据帧。现在有零了!

2016-05-19 21:40:39

如果您想在更改特定列(本例中为列V3)中的NAs后分配一个新名称，也可以这样做

my.data.frame$the.new.column.name <- ifelse(is.na(my.data.frame$V3),0,1)

2019-10-31 08:05:50

取代。数据帧中的na和NULL。

带列的数据帧

A name(美元是na (A name) < 0美元。

A $ name[是na (A $ name) < - " na "

所有数据帧

自由度[is.na（DF）]<-0

将数据帧中的na替换为空白

df[is.na（df）]<-“”

将NULL替换为NA

df[is.null(df)] <- NA

2021-11-02 19:13:41

我如何替换NA值与零在一个R数据框架?

推荐文章

最新文章

标签