%中的%的反义词:排除在vector中指定值的行

数据帧D1中的分类变量V1可以有从A到z的字母表示的值。我想创建一个子集D2，其中不包括一些值，比如B、N和t。基本上，我想要一个与%中的%相反的命令

D2 = subset(D1, V1 %in% c("B", "N", "T"))

当前回答

下面是在dplyr中使用过滤器的一个版本，它通过否定逻辑with !应用了与接受答案相同的技术:

D2 <- D1 %>% dplyr::filter(!V1 %in% c('B','N','T'))

其他回答

对于%in%的帮助，help("%in%")，在示例部分中包含了not in的定义，

"%w/o%" <-函数(x, y) x[!X %in% y] #——X不含y

让我们试试吧:

c(2,3,4) %w/o% c(2,8,9)
[1] 3 4

另外

"%w/o%" <- function(x, y) !x %in% y #--  x without y
c(2,3,4) %w/o% c(2,8,9)
# [1] FALSE  TRUE  TRUE

使用negate from purrr也可以快速而整洁地达到目的:

`%not_in%` <- purrr::negate(`%in%`)

例如，用法是，

c("cat", "dog") %not_in% c("dog", "mouse")

下面是在dplyr中使用过滤器的一个版本，它通过否定逻辑with !应用了与接受答案相同的技术:

D2 <- D1 %>% dplyr::filter(!V1 %in% c('B','N','T'))

Hmisc有%nin%函数，它应该做到这一点。

https://www.rdocumentation.org/packages/Hmisc/versions/4.4-0/topics/%25nin%25

在Frank Harrell的R效用函数包中，他有一个%nin% (not In)，它完全符合最初的问题。不需要重新发明轮子。

推荐文章