我有一个R数据帧有6列,我想创建一个新的数据帧,只有三个列。
假设我的数据帧是df,我想提取列A, B和E,这是我唯一能想出的命令:
data.frame(df$A,df$B,df$E)
有没有更紧凑的方式来做这件事?
我有一个R数据帧有6列,我想创建一个新的数据帧,只有三个列。
假设我的数据帧是df,我想提取列A, B和E,这是我唯一能想出的命令:
data.frame(df$A,df$B,df$E)
有没有更紧凑的方式来做这件事?
当前回答
df<- dplyr::select ( df,A,B,C)
此外,还可以为新创建的数据分配不同的名称
data<- dplyr::select ( df,A,B,C)
其他回答
你可以用with:
with(df, data.frame(A, B, E))
使用dplyr包,如果你的data.frame被称为df1:
library(dplyr)
df1 %>%
select(A, B, E)
这也可以在没有%>%管道的情况下编写:
select(df1, A, B, E)
你也可以使用sqldf包来执行对R数据帧的选择:
df1 <- sqldf("select A, B, E from df")
这将提供一个数据帧df1作为输出,其中列:a, B,E。
df<- dplyr::select ( df,A,B,C)
此外,还可以为新创建的数据分配不同的名称
data<- dplyr::select ( df,A,B,C)
[和子集不可替换:
如果只选择了一列,[将返回一个向量。
df = data.frame(a="a",b="b")
identical(
df[,c("a")],
subset(df,select="a")
)
identical(
df[,c("a","b")],
subset(df,select=c("a","b"))
)