2025-01-17 08:00:01

从向量中移除NA值

我有一个巨大的向量,它有两个NA值,我试图找到这个向量的最大值(向量都是数字),但我不能这样做,因为NA值。

我如何删除NA值,以便我可以计算最大?


当前回答

你可以叫max(vector, na)rm = TRUE)。更一般地,您可以使用na.省略()函数。

其他回答

尝试吗,max,你会看到它实际上有一个na。rm = argument,默认为FALSE。(这是许多其他R函数的默认值,包括sum(), mean()等)

设置na。rm=TRUE只做你想要的:

d <- c(1, 100, NA, 10)
max(d, na.rm=TRUE)

如果您确实想删除所有的NAs,请使用以下习语:

d <- d[!is.na(d)]

最后注意:其他函数(例如table()、lm()和sort())具有与na相关的参数,它们使用不同的名称(并提供不同的选项)。因此,如果NA在函数调用中导致了问题,那么值得在函数的参数中检查内置解决方案。我发现那里通常已经有一个了。

使用purrr中的discard(用于列表和向量)。

discard(v, is.na) 

好处是很容易使用管道;或者使用内置的子设置函数[:

v %>% discard(is.na)
v %>% `[`(!is.na(.))

注意na。省略对列表无效:

> x <- list(a=1, b=2, c=NA)
> na.omit(x)
$a
[1] 1

$b
[1] 2

$c
[1] NA

na。省略函数是很多回归例程内部使用的:

vec <- 1:1000
vec[runif(200, 1, 1000)] <- NA
max(vec)
#[1] NA
max( na.omit(vec) )
#[1] 1000

另一个选项使用complete。这样的案例:

d <- c(1, 100, NA, 10)
result <- complete.cases(d)
output <- d[result]
output
#> [1]   1 100  10
max(output)
#> [1] 100

于2022-08-26与reprex v2.0.2创建

你可以叫max(vector, na)rm = TRUE)。更一般地,您可以使用na.省略()函数。