我怎么能写一个正则表达式,只匹配字母?
当前回答
所以,我读了很多答案,大部分答案都没有考虑到例外情况,比如有重音的字母或变音(á, à, ä等)。
我在typescript中编写了一个函数,该函数应该几乎可以外推到任何可以使用RegExp的语言。这是我个人用TypeScript实现的用例。我所做的基本上是为我想添加的每种符号添加字母范围。在应用RegExp之前,我还将字符转换为大写,这为我节省了一些工作。
function isLetter(char: string): boolean {
return char.toUpperCase().match('[A-ZÀ-ÚÄ-Ü]+') !== null;
}
如果您想添加具有另一种重音的另一个字母范围,只需将其添加到正则表达式。特殊符号也是如此。
我用TDD实现了这个功能,我可以确认这至少适用于以下情况:
character | isLetter
${'A'} | ${true}
${'e'} | ${true}
${'Á'} | ${true}
${'ü'} | ${true}
${'ù'} | ${true}
${'û'} | ${true}
${'('} | ${false}
${'^'} | ${false}
${"'"} | ${false}
${'`'} | ${false}
${' '} | ${false}
其他回答
最接近的选择是
[\u\l]+
匹配大写字母和小写字母的序列。但是,并非所有编辑器/语言都支持它,因此使用它可能更安全
[a-zA-Z]+
正如其他用户所说
对于PHP,下面的代码就可以了
'/^[a-zA-Z]+$/'
Pattern pattern = Pattern.compile("^[a-zA-Z]+$");
if (pattern.matcher("a").find()) {
...do something ......
}
/^[A-z]+$/.test('asd')
// true
/^[A-z]+$/.test('asd0')
// false
/^[A-z]+$/.test('0asd')
// false
在python中,我发现了以下工作:
[^\W\d_]
这是因为我们正在创建一个新的字符类([]),它从类\W中排除(^)任何字符(所有不在[a- za - z0 -9_]中的字符),也排除任何数字(\d),也排除下划线(_)。
也就是说,我们已经取了字符类[a-zA-Z0-9_],并删除了0-9和_位。你可能会问,这样写[a-zA-Z]不是比[^\W\d_]更简单吗?如果只处理ASCII文本,您将是正确的,但当处理unicode文本时:
\ W 匹配任何非单词字符的字符。这是\w的反义词。>如果使用了ASCII标志,它就相当于[^a-zA-Z0-9_]。
^来自python re模块文档
也就是说,我们取unicode中所有被认为是单词字符的字符,删除unicode中所有被认为是数字字符的字符,并删除下划线。
例如,下面的代码片段
import re
regex = "[^\W\d_]"
test_string = "A;,./>>?()*)&^*&^%&^#Bsfa1 203974"
re.findall(regex, test_string)
返回
['A', 'B', 's', 'f', 'a']
推荐文章
- 如何从JavaScript中使用正则表达式的字符串中剥离所有标点符号?
- 正则表达式中的单词边界是什么?
- 如何将一个标题转换为jQuery的URL段塞?
- Javascript和regex:分割字符串并保留分隔符
- (grep)正则表达式匹配非ascii字符?
- 如何在保持原始字符串的同时对字符串执行Perl替换?
- 创建正则表达式匹配数组
- *的区别是什么?和。*正则表达式?
- 如何将“camelCase”转换为“Camel Case”?
- 在Java中使用正则表达式提取值
- Java中的正则表达式命名组
- 使用正则表达式搜索和替换Visual Studio代码
- 使用split("|")按管道符号拆分Java字符串
- 替换字符串中第一次出现的模式
- “\d”在正则表达式中是数字吗?