我怎么能写一个正则表达式,只匹配字母?
使用字符集:[a- za -z]匹配a-z中的一个小写字母和大写字母。[a- za -z]+匹配一个或多个字母,^[a- za -z]+$只匹配由一个或多个字母组成的字符串(^和$分别标记字符串的开始和结束)。
如果你想匹配除A-Z之外的其他字母,你可以将它们添加到字符集:[a-zA-ZäöüßÄÖÜ]。或者使用预定义的字符类,如Unicode字符属性类\p{L},它描述了作为字母的Unicode字符。
/[a-zA-Z]+/
非常简单的例子。正则表达式在网上非常容易找到。
http://www.regular-expressions.info/reference.html
如果你指的是任意字符编码中的任意字母,那么一个很好的方法可能是删除非字母,如空格\s,数字\d,以及其他特殊字符,如:
[!@#\$%\^&\*\(\)\[\]:;'",\. ...more special chars... ]
或者用上述否定的否定来直接描述任何字母:
\S \D and [^ ..special chars..]
优点:
适用于所有正则表达式口味。 容易写,有时节省很多时间。
缺点:
很长,有时并不完美,但字符编码也可能被破坏。
pattern = /[a-zA-Z]/
输入“[a-zA-Z]: #{模式。match("mine blossom")}"好的
[a-zA-Z]: #{pattern.match("456")}"
[a-zA-Z]: #{pattern.match("")}"
输入"[a-zA-Z]: #{pattern.match("#$%^&*")}"
把“[a-zA-Z]: # {pattern.match (" # $ % ^ & * ")}" 好吧
Pattern pattern = Pattern.compile("^[a-zA-Z]+$");
if (pattern.matcher("a").find()) {
...do something ......
}
正则表达式,很少有人写为“/^[a-zA-Z]$/i”是不正确的,因为最后他们提到了/i,这是不区分大小写的,在第一次匹配后,它将返回。用/g代替/i,它是全局的,你也不需要用^ $作为开始和结束。
/[a-zA-Z]+/g
[a-z_]+匹配下面列表中的单个字符 量词:+在一到无限次之间,尽可能多的次数,在需要的时候回馈 a-z在a和z之间的单个字符(区分大小写) a -Z在a和Z之间的单个字符(区分大小写) G修饰符:全局。所有比赛(第一场比赛不返回)
Java:
String s= "abcdef";
if(s.matches("[a-zA-Z]+")){
System.out.println("string only contains letters");
}
JavaScript
如果你想返回匹配的字母:
(123例).match (/ [a - z] / gi) / /结果:[“E”,“x”,“一个”,“m”,“p”,“l”、“E”)
如果你想用星号('*')替换匹配的字母,例如:
(‘Example 123个’)。替换(/[a-z]/gi,'*')//结果:"*******123"*
/^[A-z]+$/.test('asd')
// true
/^[A-z]+$/.test('asd0')
// false
/^[A-z]+$/.test('0asd')
// false
在python中,我发现了以下工作:
[^\W\d_]
这是因为我们正在创建一个新的字符类([]),它从类\W中排除(^)任何字符(所有不在[a- za - z0 -9_]中的字符),也排除任何数字(\d),也排除下划线(_)。
也就是说,我们已经取了字符类[a-zA-Z0-9_],并删除了0-9和_位。你可能会问,这样写[a-zA-Z]不是比[^\W\d_]更简单吗?如果只处理ASCII文本,您将是正确的,但当处理unicode文本时:
\ W 匹配任何非单词字符的字符。这是\w的反义词。>如果使用了ASCII标志,它就相当于[^a-zA-Z0-9_]。
^来自python re模块文档
也就是说,我们取unicode中所有被认为是单词字符的字符,删除unicode中所有被认为是数字字符的字符,并删除下划线。
例如,下面的代码片段
import re
regex = "[^\W\d_]"
test_string = "A;,./>>?()*)&^*&^%&^#Bsfa1 203974"
re.findall(regex, test_string)
返回
['A', 'B', 's', 'f', 'a']
所以,我读了很多答案,大部分答案都没有考虑到例外情况,比如有重音的字母或变音(á, à, ä等)。
我在typescript中编写了一个函数,该函数应该几乎可以外推到任何可以使用RegExp的语言。这是我个人用TypeScript实现的用例。我所做的基本上是为我想添加的每种符号添加字母范围。在应用RegExp之前,我还将字符转换为大写,这为我节省了一些工作。
function isLetter(char: string): boolean {
return char.toUpperCase().match('[A-ZÀ-ÚÄ-Ü]+') !== null;
}
如果您想添加具有另一种重音的另一个字母范围,只需将其添加到正则表达式。特殊符号也是如此。
我用TDD实现了这个功能,我可以确认这至少适用于以下情况:
character | isLetter
${'A'} | ${true}
${'e'} | ${true}
${'Á'} | ${true}
${'ü'} | ${true}
${'ù'} | ${true}
${'û'} | ${true}
${'('} | ${false}
${'^'} | ${false}
${"'"} | ${false}
${'`'} | ${false}
${' '} | ${false}
推荐文章
- Ruby正则表达式中\A \z和^ $的区别
- 用于匹配英国邮政编码的正则表达式
- 将所有非字母数字字符替换为空字符串
- 我如何能匹配一个字符串与正则表达式在Bash?
- 使用RegExp.exec从字符串中提取所有匹配项
- 仅用Regex替换某些组
- 使用正则表达式解析HTML:为什么不呢?
- 正则表达式来匹配不是空格的单个字符
- 在JavaScript中检查字符串包含另一个子字符串的最快方法?
- Python非贪婪正则表达式
- 正则表达式可以用来匹配嵌套模式吗?
- 在bash中使用正则表达式进行搜索和替换
- 将camelCaseText转换为标题大小写文本
- 正则表达式在Javascript中获取两个字符串之间的字符串
- Regex测试字符串是否以http://或https://开头