我有一个R数据帧有6列,我想创建一个新的数据帧,只有三个列。

假设我的数据帧是df,我想提取列A, B和E,这是我唯一能想出的命令:

 data.frame(df$A,df$B,df$E)

有没有更紧凑的方式来做这件事?


当前回答

其中df1是原始数据帧:

df2 <- subset(df1, select = c(1, 2, 5))

其他回答

使用dplyr包,如果你的data.frame被称为df1:

library(dplyr)

df1 %>%
  select(A, B, E)

这也可以在没有%>%管道的情况下编写:

select(df1, A, B, E)

你也可以使用sqldf包来执行对R数据帧的选择:

df1 <- sqldf("select A, B, E from df")

这将提供一个数据帧df1作为输出,其中列:a, B,E。

其中df1是原始数据帧:

df2 <- subset(df1, select = c(1, 2, 5))
df<- dplyr::select ( df,A,B,C)

此外,还可以为新创建的数据分配不同的名称

data<- dplyr::select ( df,A,B,C)

出于某种原因

df[, (names(df) %in% c("A","B","E"))]

为我工作。以上所有语法都产生了“未定义的选定列”。