我想从向量中的字符串中删除特定字符,类似于Excel中的查找和替换功能。
以下是我开始时的数据:
group <- data.frame(c("12357e", "12575e", "197e18", "e18947")
我从第一列开始;我想通过去掉e来得到第二列:
group group.no.e
12357e 12357
12575e 12575
197e18 19718
e18947 18947
我想从向量中的字符串中删除特定字符,类似于Excel中的查找和替换功能。
以下是我开始时的数据:
group <- data.frame(c("12357e", "12575e", "197e18", "e18947")
我从第一列开始;我想通过去掉e来得到第二列:
group group.no.e
12357e 12357
12575e 12575
197e18 19718
e18947 18947
使用正则表达式和函数gsub():
group <- c("12357e", "12575e", "197e18", "e18947")
group
[1] "12357e" "12575e" "197e18" "e18947"
gsub("e", "", group)
[1] "12357" "12575" "19718" "18947"
gsub在这里所做的是将每次出现的“e”替换为空字符串“”。
参见regexp或gsub以获得更多帮助。
正则表达式是你的朋友:
R> ## also adds missing ')' and sets column name
R> group<-data.frame(group=c("12357e", "12575e", "197e18", "e18947")) )
R> group
group
1 12357e
2 12575e
3 197e18
4 e18947
现在使用gsub()和最简单的替换模式:空字符串:
R> group$groupNoE <- gsub("e", "", group$group)
R> group
group groupNoE
1 12357e 12357
2 12575e 12575
3 197e18 19718
4 e18947 18947
R>
总结替换字符串的2种方法:
group<-data.frame(group=c("12357e", "12575e", "197e18", "e18947"))
1)使用gsub
group$group.no.e <- gsub("e", "", group$group)
2)使用stringr包
group$group.no.e <- str_replace_all(group$group, "e", "")
两者都会产生渴望的输出:
group group.no.e
1 12357e 12357
2 12575e 12575
3 197e18 19718
4 e18947 18947
使用stringi包:
require(stringi)
group<-data.frame(c("12357e", "12575e", "197e18", "e18947"))
stri_replace_all(group[,1], "", fixed="e")
[1] "12357" "12575" "19718" "18947"
你不需要从字符串向量创建数据帧,如果你想替换其中的一些字符。正则表达式是一个很好的选择,因为它已经被@Andrie和@Dirk Eddelbuettel提到过。
注意,如果你想替换特殊字符,比如点,你应该使用完整的正则表达式语法,如下例所示:
ctr_names <- c("Czech.Republic","New.Zealand","Great.Britain")
gsub("[.]", " ", ctr_names)
这将产生
[1] "Czech Republic" "New Zealand" "Great Britain"
> library(stringi)
> group <- c('12357e', '12575e', '12575e', ' 197e18', 'e18947')
> pattern <- "e"
> replacement <- ""
> group <- str_replace(group, pattern, replacement)
> group
[1] "12357" "12575" "12575" " 19718" "18947"