是否有正则表达式检查字符串是否只包含大写字母、小写字母、数字和下划线?


当前回答

我相信您在匹配中没有使用拉丁字符和Unicode字符。

例如,如果需要使用“ã”或“ü”字符,则使用“\w”将不起作用。

你也可以使用这种方法:

^[A-ZÀ-Ýa-zà-ý0-9_]+$

其他回答

Use

^([A-Za-z]|[0-9]|_)+$

...如果你想要明确,或者:

^\w+$

...如果您更喜欢简洁(Perl语法)。

在计算机科学中,字母数字值通常意味着第一个字符不是数字,而是字母或下划线。后面的字符可以是0-9、A-Z、A-Z或下划线。

你可以这样做:

在PHP下测试:

$regex = '/^[A-Za-z_][A-Za-z\d_]*$/'

或者采取

^[A-Za-z_][A-Za-z\d_]*$

并将其放在您的开发语言中。

要检查整个字符串并且不允许空字符串,请尝试

^[A-Za-z0-9_]+$

要匹配只包含这些字符(或空字符串)的字符串,请尝试

"^[a-zA-Z0-9_]*$"

这适用于。net正则表达式,可能也适用于许多其他语言。

分解一下:

^ : start of string
[ : beginning of character group
a-z : any lowercase letter
A-Z : any uppercase letter
0-9 : any digit
_ : underscore
] : end of character group
* : zero or more of the given characters
$ : end of string

如果不允许使用空字符串,请使用+而不是*。


正如其他人指出的那样,一些正则表达式语言有[a- za - z0 -9_]的速记形式。在. net正则表达式语言中,您可以打开ECMAScript行为并使用\w作为简写(生成^\w*$或^\w+$)。请注意,在其他语言中,以及在. net中默认情况下,\w范围更广,也会匹配其他类型的Unicode字符(感谢Jan指出这一点)。因此,如果您真的打算只匹配这些字符,那么使用显式(较长的)形式可能是最好的。

你想要检查每个字符是否符合你的要求,这就是为什么我们使用:

[A-Za-z0-9_]

你甚至可以用简写的形式:

\w

这是等价的(在某些正则表达式中,所以在使用它之前一定要检查一下)。然后,为了表明整个字符串必须匹配,您使用:

^

若要指示字符串必须以该字符开头,则使用

$

若要指示字符串必须以该字符结束。然后使用

\w+ or \w*

表示“1或多个”,或“0或多个”。综上所述,我们有:

^\w*$