从R中的data.frame中移除整个列

有人知道如何从R中的data。frame中移除一整列吗?例如，如果我得到这个data.frame:

> head(data)
   chr       genome region
1 chr1 hg19_refGene    CDS
2 chr1 hg19_refGene   exon
3 chr1 hg19_refGene    CDS
4 chr1 hg19_refGene   exon
5 chr1 hg19_refGene    CDS
6 chr1 hg19_refGene   exon

我想去掉第二列。

当前回答

这样你就可以删除列并将变量存储到另一个变量中。

df = subset(data, select = -c(genome) )

2017-08-04 04:53:18

其他回答

要按名称删除一个或多个列，如果列名是已知的(而不是在运行时确定的)，我喜欢使用子集()语法。例如，对于数据帧

df <- data.frame(a=1:3, d=2:4, c=3:5, b=4:6)

你可以去掉a列

Data <- subset( Data, select = -a )

要去掉b和d列，你可以这么做

Data <- subset( Data, select = -c(d, b ) )

你可以删除d和b之间的所有列:

Data <- subset( Data, select = -c( d : b )

如上所述，此语法仅在列名已知的情况下有效。当以编程方式确定列名(即赋值给变量)时，它将不起作用。我将从?子集文档中复制这个警告:

警告: 这是一个方便交互使用的功能。对于编程，最好使用标准子集像'['这样的函数，特别是非标准求值的论点“子集”可能会产生意想不到的后果。

2011-06-09 02:31:32

(为了完整性)如果你想按名称删除列，你可以这样做:

cols.dont.want <- "genome"
cols.dont.want <- c("genome", "region") # if you want to remove multiple columns

data <- data[, ! names(data) %in% cols.dont.want, drop = F]

包含drop = F可以确保结果仍然是data.frame，即使只剩下一列。

2015-06-03 13:04:32

这样你就可以删除列并将变量存储到另一个变量中。

df = subset(data, select = -c(genome) )

2017-08-04 04:53:18

使用dplyR，以下工作:

数据<- select(Data， -genome)

根据这里找到的文件https://www.marsja.se/how-to-remove-a-column-in-r-using-dplyr-by-name-and-index/#:~:text=select(starwars%2C%20%2Dheight)

2022-08-31 03:00:04

您可以将其设置为NULL。

> Data$genome <- NULL
> head(Data)
   chr region
1 chr1    CDS
2 chr1   exon
3 chr1    CDS
4 chr1   exon
5 chr1    CDS
6 chr1   exon

正如评论中所指出的，这里有一些其他的可能性:

Data[2] <- NULL    # Wojciech Sobala
Data[[2]] <- NULL  # same as above
Data <- Data[,-2]  # Ian Fellows
Data <- Data[-2]   # same as above

你可以通过以下方法删除多个列:

Data[1:2] <- list(NULL)  # Marek
Data[1:2] <- NULL        # does not work!

但是要小心矩阵子集的设置，因为你最终会得到一个向量:

Data <- Data[,-(2:3)]             # vector
Data <- Data[,-(2:3),drop=FALSE]  # still a data.frame

2011-06-08 23:06:39

从R中的data.frame中移除整个列

推荐文章

最新文章

标签