是否有正则表达式检查字符串是否只包含大写字母、小写字母、数字和下划线?


当前回答

虽然它比\w更啰嗦,但我个人很欣赏完整POSIX字符类名称的可读性(http://www.zytrax.com/tech/web/regex.htm#special),所以我会说:

^[[:alnum:]_]+$

然而,虽然上面链接的文档声明\w将“匹配0 - 9,A - Z和A - Z范围内的任何字符(相当于POSIX [:alnum:])”,我还没有发现这是真的。至少不是用grep -P。如果使用[:alnum:],则需要显式地包含下划线,但如果使用\w则不需要。下面的简短而甜蜜的句子是最好不过的:

^\w+$

除了可读性之外,使用POSIX字符类(http://www.regular-expressions.info/posixbrackets.html)意味着正则表达式可以处理非ASCII字符串,而基于范围的正则表达式不会这样做,因为它们依赖于ASCII字符的底层顺序,这可能与其他字符集不同,因此会排除一些您可能想要捕获的非ASCII字符(如字母)。

其他回答

下面的正则表达式匹配字母数字字符和下划线:

^[a-zA-Z0-9_]+$

例如,在Perl中:

#!/usr/bin/perl -w

my $arg1 = $ARGV[0];

# Check that the string contains *only* one or more alphanumeric chars or underscores
if ($arg1 !~ /^[a-zA-Z0-9_]+$/) {
  print "Failed.\n";
} else {
    print "Success.\n";
}

要匹配只包含这些字符(或空字符串)的字符串,请尝试

"^[a-zA-Z0-9_]*$"

这适用于。net正则表达式,可能也适用于许多其他语言。

分解一下:

^ : start of string
[ : beginning of character group
a-z : any lowercase letter
A-Z : any uppercase letter
0-9 : any digit
_ : underscore
] : end of character group
* : zero or more of the given characters
$ : end of string

如果不允许使用空字符串,请使用+而不是*。


正如其他人指出的那样,一些正则表达式语言有[a- za - z0 -9_]的速记形式。在. net正则表达式语言中,您可以打开ECMAScript行为并使用\w作为简写(生成^\w*$或^\w+$)。请注意,在其他语言中,以及在. net中默认情况下,\w范围更广,也会匹配其他类型的Unicode字符(感谢Jan指出这一点)。因此,如果您真的打算只匹配这些字符,那么使用显式(较长的)形式可能是最好的。

嗯…问题:它是否至少需要一个字符?它可以是空字符串吗?

^[A-Za-z0-9_]+$

将至少做一个大写或小写字母数字或下划线。如果它的长度可以为零,那么只需用+替换*:

^[A-Za-z0-9_]*$

如果需要包含变音符字符(例如cedilla - ç),那么您将需要使用单词character,其功能与上述相同,但包括变音符字符:

^\w+$

Or

^\w*$

对于Java,只允许不区分大小写的字母数字和下划线。

^匹配以任何字符开头的字符串 [a-zA-Z0-9_]+匹配字母数字字符和下划线。 $匹配以0或多个字符结尾的字符串。 公共类RegExTest { public static void main(String[] args) { System.out.println(“_C #”.matches (" ^ [a-zA-Z0-9_] + $ ")); } }

这对我很有用。你可以试试:

[\\p{Alnum}_]