我怎么能写一个正则表达式,只匹配字母?


当前回答

Java:

String s= "abcdef";

if(s.matches("[a-zA-Z]+")){
     System.out.println("string only contains letters");
}

其他回答

/[a-zA-Z]+/

非常简单的例子。正则表达式在网上非常容易找到。

http://www.regular-expressions.info/reference.html

\p{L}匹配任何Unicode字母,如果您对拉丁字母以外的字母感兴趣

如果你指的是任意字符编码中的任意字母,那么一个很好的方法可能是删除非字母,如空格\s,数字\d,以及其他特殊字符,如:

[!@#\$%\^&\*\(\)\[\]:;'",\. ...more special chars... ]

或者用上述否定的否定来直接描述任何字母:

\S \D and [^  ..special chars..]

优点:

适用于所有正则表达式口味。 容易写,有时节省很多时间。

缺点:

很长,有时并不完美,但字符编码也可能被破坏。

pattern = /[a-zA-Z]/

输入“[a-zA-Z]: #{模式。match("mine blossom")}"好的

[a-zA-Z]: #{pattern.match("456")}"

[a-zA-Z]: #{pattern.match("")}"

输入"[a-zA-Z]: #{pattern.match("#$%^&*")}"

把“[a-zA-Z]: # {pattern.match (" # $ % ^ & * ")}" 好吧

在python中,我发现了以下工作:

[^\W\d_]

这是因为我们正在创建一个新的字符类([]),它从类\W中排除(^)任何字符(所有不在[a- za - z0 -9_]中的字符),也排除任何数字(\d),也排除下划线(_)。

也就是说,我们已经取了字符类[a-zA-Z0-9_],并删除了0-9和_位。你可能会问,这样写[a-zA-Z]不是比[^\W\d_]更简单吗?如果只处理ASCII文本,您将是正确的,但当处理unicode文本时:

\ W 匹配任何非单词字符的字符。这是\w的反义词。>如果使用了ASCII标志,它就相当于[^a-zA-Z0-9_]。

^来自python re模块文档

也就是说,我们取unicode中所有被认为是单词字符的字符,删除unicode中所有被认为是数字字符的字符,并删除下划线。

例如,下面的代码片段

import re
regex = "[^\W\d_]"
test_string = "A;,./>>?()*)&^*&^%&^#Bsfa1 203974"
re.findall(regex, test_string)

返回

['A', 'B', 's', 'f', 'a']