如何将数据帧列转换为数字类型?

当前回答

考虑到可能存在char列，这是基于@Abdou在获取列类型的excel表格自动回答:

makenumcols<-function(df){
  df<-as.data.frame(df)
  df[] <- lapply(df, as.character)
  cond <- apply(df, 2, function(x) {
    x <- x[!is.na(x)]
    all(suppressWarnings(!is.na(as.numeric(x))))
  })
  numeric_cols <- names(df)[cond]
  df[,numeric_cols] <- sapply(df[,numeric_cols], as.numeric)
  return(df)
}
df<-makenumcols(df)

2017-06-15 14:32:22

其他回答

在我的PC (R v.3.2.3)中，apply或sapply给出错误。Lapply效果很好。

dt[,2:4] <- lapply(dt[,2:4], function (x) as.factor(as.numeric(x)))

2016-03-11 04:13:37

如果数据帧有多种类型的列，一些字符，一些数字尝试以下转换列包含数值为数值:

for (i in 1:length(data[1,])){
  if(length(as.numeric(data[,i][!is.na(data[,i])])[!is.na(as.numeric(data[,i][!is.na(data[,i])]))])==0){}
  else {
    data[,i]<-as.numeric(data[,i])
  }
}

2018-01-11 22:08:26

由于(仍然)没有人得到对号，我假设您心中有一些实际问题，主要是因为您还没有指定要将哪种类型的向量转换为数字。我建议你应用变换函数来完成你的任务。

现在我要演示某些“转换异常”:

# create dummy data.frame
d <- data.frame(char = letters[1:5], 
                fake_char = as.character(1:5), 
                fac = factor(1:5), 
                char_fac = factor(letters[1:5]), 
                num = 1:5, stringsAsFactors = FALSE)

让我们看一下data.frame

> d
  char fake_char fac char_fac num
1    a         1   1        a   1
2    b         2   2        b   2
3    c         3   3        c   3
4    d         4   4        d   4
5    e         5   5        e   5

让我们奔跑:

> sapply(d, mode)
       char   fake_char         fac    char_fac         num 
"character" "character"   "numeric"   "numeric"   "numeric" 
> sapply(d, class)
       char   fake_char         fac    char_fac         num 
"character" "character"    "factor"    "factor"   "integer"

现在你可能会问自己“异常点在哪里?”好吧，我在R中遇到过非常奇怪的东西，这不是最令人困惑的事情，但它会让你困惑，尤其是如果你在睡觉前读了这篇文章。

开始:前两列是字符。我故意把第二个称为fake_char。注意这个字符变量与Dirk在他的回复中创建的一个字符变量的相似性。它实际上是一个转换成字符的数字向量。第三和第四列是因子，最后一列是“纯”数字。

如果使用transform函数，则可以将fake_char转换为数字类型，但不能将char变量本身转换为数字类型。

> transform(d, char = as.numeric(char))
  char fake_char fac char_fac num
1   NA         1   1        a   1
2   NA         2   2        b   2
3   NA         3   3        c   3
4   NA         4   4        d   4
5   NA         5   5        e   5
Warning message:
In eval(expr, envir, enclos) : NAs introduced by coercion

但如果你在fake_char和char_fac上做同样的事情，你会很幸运，并且没有NA:

> transform(d, fake_char = as.numeric(fake_char), 
               char_fac = as.numeric(char_fac))

  char fake_char fac char_fac num
1    a         1   1        1   1
2    b         2   2        2   2
3    c         3   3        3   3
4    d         4   4        4   4
5    e         5   5        5   5

如果你保存转换后的data.frame并检查模式和类，你会得到:

> D <- transform(d, fake_char = as.numeric(fake_char), 
                    char_fac = as.numeric(char_fac))

> sapply(D, mode)
       char   fake_char         fac    char_fac         num 
"character"   "numeric"   "numeric"   "numeric"   "numeric" 
> sapply(D, class)
       char   fake_char         fac    char_fac         num 
"character"   "numeric"    "factor"   "numeric"   "integer"

因此，结论是:是的，您可以将字符向量转换为数字向量，但前提是它的元素可以“转换”为数字。如果vector中只有一个字符元素，则在尝试将该vector转换为数值1时将会得到错误。

为了证明我的观点:

> err <- c(1, "b", 3, 4, "e")
> mode(err)
[1] "character"
> class(err)
[1] "character"
> char <- as.numeric(err)
Warning message:
NAs introduced by coercion 
> char
[1]  1 NA  3  4 NA

现在，只是为了好玩(或练习)，试着猜测这些命令的输出:

> fac <- as.factor(err)
> fac
???
> num <- as.numeric(fac)
> num
???

向帕特里克·伯恩斯致以亲切的问候!=)

2010-02-19 00:31:30

与hablar::转换

要轻松地将多个列转换为不同的数据类型，可以使用hablar::convert。简单的语法:df %>% convert(num(a))将列a从df转换为数值。

详细的例子

让我们将mtcars的所有列转换为字符。

df <- mtcars %>% mutate_all(as.character) %>% as_tibble()

> df
# A tibble: 32 x 11
   mpg   cyl   disp  hp    drat  wt    qsec  vs    am    gear  carb 
   <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
 1 21    6     160   110   3.9   2.62  16.46 0     1     4     4    
 2 21    6     160   110   3.9   2.875 17.02 0     1     4     4    
 3 22.8  4     108   93    3.85  2.32  18.61 1     1     4     1

与hablar::转换:

library(hablar)

# Convert columns to integer, numeric and factor
df %>% 
  convert(int(cyl, vs),
          num(disp:wt),
          fct(gear))

结果:

# A tibble: 32 x 11
   mpg     cyl  disp    hp  drat    wt qsec     vs am    gear  carb 
   <chr> <int> <dbl> <dbl> <dbl> <dbl> <chr> <int> <chr> <fct> <chr>
 1 21        6  160    110  3.9   2.62 16.46     0 1     4     4    
 2 21        6  160    110  3.9   2.88 17.02     0 1     4     4    
 3 22.8      4  108     93  3.85  2.32 18.61     1 1     4     1    
 4 21.4      6  258    110  3.08  3.22 19.44     1 0     3     1

2018-11-04 11:02:14

如果您不关心保留因子，并希望将其应用到任何可以转换为数字的列，我使用下面的脚本。如果df是您的原始数据框架，您可以使用下面的脚本。

df[] <- lapply(df, as.character)
df <- data.frame(lapply(df, function(x) ifelse(!is.na(as.numeric(x)), as.numeric(x),  x)))

顺便说一句，我参考了谢恩和乔兰的解决方案

2020-05-18 07:16:51

如何将数据帧列转换为数字类型?

推荐文章

最新文章

标签