我知道如果我有一个包含多于一列的数据帧,那么我可以使用

colnames(x) <- c("col1","col2")

重命名列。如果只有一列,该怎么做呢? 意思是只有一列的向量或数据帧。

例子:

trSamp <- data.frame(sample(trainer$index, 10000))
head(trSamp )
#   sample.trainer.index..10000.
# 1                      5907862
# 2                      2181266
# 3                      7368504
# 4                      1949790
# 5                      3475174
# 6                      6062879

ncol(trSamp)
# [1] 1
class(trSamp)
# [1] "data.frame"
class(trSamp[1])
# [1] "data.frame"
class(trSamp[,1])
# [1] "numeric"
colnames(trSamp)[2] <- "newname2"
# Error in names(x) <- value : 
#   'names' attribute [2] must be the same length as the vector [1]

当前回答

可以使用rename_with使用函数(例如stringr函数)重命名列。

考虑以下数据df_1:

df_1 <- data.frame(
  x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)), 
  y = sample(x = 1:2, size = 10, replace = TRUE)
)

names(df_1)

#[1] "x.1" "x.2" "x.3" "y" 

使用dplyr::everything()重命名所有变量:

library(tidyverse)

df_1 %>% 
  rename_with(.data = ., .cols = everything(.), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "var_4"

用一些dplyr动词(starts_with, ends_with, contains, matches,…)重命名粒子名。

以。(x变量):

df_1 %>% 
  rename_with(.data = ., .cols = contains('.'), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "y"

用类test的许多函数重命名类,比如is.integer, is.integer。数字,is.factor……

以is.integer (y)为例:

df_1 %>% 
  rename_with(.data = ., .cols = is.integer, 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "x.1"   "x.2"   "x.3"   "var_1"

警告:

警告信息: 1:在stri_replace_first_regex(string, pattern, fix_replacement(replacement)中,: 较长的对象长度不是较短的对象长度的倍数 2: In names[cols] <- .fn(names[cols],…) 要替换的项目数量不是替换长度的倍数

这是不相关的,因为这只是seq_along(.)与replace函数的不一致。

其他回答

可以使用rename_with使用函数(例如stringr函数)重命名列。

考虑以下数据df_1:

df_1 <- data.frame(
  x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)), 
  y = sample(x = 1:2, size = 10, replace = TRUE)
)

names(df_1)

#[1] "x.1" "x.2" "x.3" "y" 

使用dplyr::everything()重命名所有变量:

library(tidyverse)

df_1 %>% 
  rename_with(.data = ., .cols = everything(.), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "var_4"

用一些dplyr动词(starts_with, ends_with, contains, matches,…)重命名粒子名。

以。(x变量):

df_1 %>% 
  rename_with(.data = ., .cols = contains('.'), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "y"

用类test的许多函数重命名类,比如is.integer, is.integer。数字,is.factor……

以is.integer (y)为例:

df_1 %>% 
  rename_with(.data = ., .cols = is.integer, 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "x.1"   "x.2"   "x.3"   "var_1"

警告:

警告信息: 1:在stri_replace_first_regex(string, pattern, fix_replacement(replacement)中,: 较长的对象长度不是较短的对象长度的倍数 2: In names[cols] <- .fn(names[cols],…) 要替换的项目数量不是替换长度的倍数

这是不相关的,因为这只是seq_along(.)与replace函数的不一致。

我认为重命名列的最好方法是像这样使用dplyr包:

require(dplyr)
df = rename(df, new_col01 = old_col01, new_col02 = old_col02, ...)

对于重命名任何数据集中的一个或多个列,它的工作原理相同。

这是一个老问题,但值得注意的是,您现在可以从数据中使用setname。表方案。

library(data.table)

setnames(DF, "oldName", "newName")

# or since the data.frame in question is just one column: 
setnames(DF, "newName")

# And for reference's sake, in general (more than once column)
nms <- c("col1.name", "col2.name", etc...)
setnames(DF, nms)

Try:

colnames(x)[2] <- 'newname2'

我将简单地用下面的代码用我想要的新名称更改数据集的列名: name (dataset)[index_value] <- "new_col_name"