是否有正则表达式检查字符串是否只包含大写字母、小写字母、数字和下划线?
当前回答
对于那些寻找unicode字母数字匹配的人,你可能想做一些类似的事情:
^[\p{L} \p{Nd}_]+$
进一步的阅读请参阅Unicode正则表达式(Unicode Consortium)和Unicode正则表达式(Regular-Expressions.info)。
其他回答
虽然它比\w更啰嗦,但我个人很欣赏完整POSIX字符类名称的可读性(http://www.zytrax.com/tech/web/regex.htm#special),所以我会说:
^[[:alnum:]_]+$
然而,虽然上面链接的文档声明\w将“匹配0 - 9,A - Z和A - Z范围内的任何字符(相当于POSIX [:alnum:])”,我还没有发现这是真的。至少不是用grep -P。如果使用[:alnum:],则需要显式地包含下划线,但如果使用\w则不需要。下面的简短而甜蜜的句子是最好不过的:
^\w+$
除了可读性之外,使用POSIX字符类(http://www.regular-expressions.info/posixbrackets.html)意味着正则表达式可以处理非ASCII字符串,而基于范围的正则表达式不会这样做,因为它们依赖于ASCII字符的底层顺序,这可能与其他字符集不同,因此会排除一些您可能想要捕获的非ASCII字符(如字母)。
你想要检查每个字符是否符合你的要求,这就是为什么我们使用:
[A-Za-z0-9_]
你甚至可以用简写的形式:
\w
这是等价的(在某些正则表达式中,所以在使用它之前一定要检查一下)。然后,为了表明整个字符串必须匹配,您使用:
^
若要指示字符串必须以该字符开头,则使用
$
若要指示字符串必须以该字符结束。然后使用
\w+ or \w*
表示“1或多个”,或“0或多个”。综上所述,我们有:
^\w*$
Use
^([A-Za-z]|[0-9]|_)+$
...如果你想要明确,或者:
^\w+$
...如果您更喜欢简洁(Perl语法)。
我相信您在匹配中没有使用拉丁字符和Unicode字符。
例如,如果需要使用“ã”或“ü”字符,则使用“\w”将不起作用。
你也可以使用这种方法:
^[A-ZÀ-Ýa-zà-ý0-9_]+$
要匹配只包含这些字符(或空字符串)的字符串,请尝试
"^[a-zA-Z0-9_]*$"
这适用于。net正则表达式,可能也适用于许多其他语言。
分解一下:
^ : start of string
[ : beginning of character group
a-z : any lowercase letter
A-Z : any uppercase letter
0-9 : any digit
_ : underscore
] : end of character group
* : zero or more of the given characters
$ : end of string
如果不允许使用空字符串,请使用+而不是*。
正如其他人指出的那样,一些正则表达式语言有[a- za - z0 -9_]的速记形式。在. net正则表达式语言中,您可以打开ECMAScript行为并使用\w作为简写(生成^\w*$或^\w+$)。请注意,在其他语言中,以及在. net中默认情况下,\w范围更广,也会匹配其他类型的Unicode字符(感谢Jan指出这一点)。因此,如果您真的打算只匹配这些字符,那么使用显式(较长的)形式可能是最好的。
推荐文章
- 如何从JavaScript中使用正则表达式的字符串中剥离所有标点符号?
- 正则表达式中的单词边界是什么?
- 如何将一个标题转换为jQuery的URL段塞?
- Javascript和regex:分割字符串并保留分隔符
- (grep)正则表达式匹配非ascii字符?
- 如何在保持原始字符串的同时对字符串执行Perl替换?
- 创建正则表达式匹配数组
- *的区别是什么?和。*正则表达式?
- 如何将“camelCase”转换为“Camel Case”?
- 在Java中使用正则表达式提取值
- Java中的正则表达式命名组
- 使用正则表达式搜索和替换Visual Studio代码
- 使用split("|")按管道符号拆分Java字符串
- 替换字符串中第一次出现的模式
- “\d”在正则表达式中是数字吗?