我想要一个正则表达式,防止符号,只允许字母和数字。下面的正则表达式工作得很好,但它不允许单词之间有空格。
^[a-zA-Z0-9_]*$
例如,当使用这个正则表达式时,“HelloWorld”是可以的,但“HelloWorld”不匹配。
我如何调整它允许空格?
我想要一个正则表达式,防止符号,只允许字母和数字。下面的正则表达式工作得很好,但它不允许单词之间有空格。
^[a-zA-Z0-9_]*$
例如,当使用这个正则表达式时,“HelloWorld”是可以的,但“HelloWorld”不匹配。
我如何调整它允许空格?
当前回答
如果你正在使用JavaScript,那么你可以使用这个正则表达式:
/^[a-z0-9_.-\s]+$/i
例如:
/^[a-z0-9_.-\s]+$/i.test("") //false
/^[a-z0-9_.-\s]+$/i.test("helloworld") //true
/^[a-z0-9_.-\s]+$/i.test("hello world") //true
/^[a-z0-9_.-\s]+$/i.test("none alpha: ɹqɯ") //false
这个正则表达式的唯一缺点是字符串完全由空格组成。" "也会显示为true。
其他回答
这个正则表达式
^\w+(\s\w+)*$
将只允许单词之间有一个空格,不允许开头或结尾空格。
正则表达式解释如下:
^ Assert position at start of the string \w+ Match any word character [a-zA-Z0-9_] Quantifier: + Between one and unlimited times, as many times as possible, giving back as needed [greedy] 1st Capturing group (\s\w+)* Quantifier: * Between zero and unlimited times, as many times as possible, giving back as needed [greedy] \s Match any white space character [\r\n\t\f ] \w+ Match any word character [a-zA-Z0-9_] Quantifier: + Between one and unlimited times, as many times as possible, giving back as needed [greedy] $ Assert position at end of the string
只需在正则表达式模式的末尾添加一个空格,如下所示:
[a-zA-Z0-9_ ]
博士tl;
只需要在你的角色类别中添加一个空格。
^[a-zA-Z0-9_ ]*$
现在,如果你想严格一点…
以上说法并不完全正确。由于*意味着0或更多,它将匹配以下所有通常不打算匹配的情况:
空字符串""。 完全由空格“”组成的字符串。 以空格开头和/或结尾的字符串," Hello World "。 单词之间包含多个空格的字符串,“Hello World”。
起初我认为这些细节不值得讨论,因为OP问的是一个如此基本的问题,以至于严格似乎不是一个问题。现在这个问题已经很流行了,我想说……
...请使用@stema的答案。
在我看来(不用\w),它的意思是:
^[a-zA-Z0-9_]+( [a-zA-Z0-9_]+)*$
(无论如何,请给@stema投票。)
关于这个(和@stema的)答案,有几点需要注意:
如果你想允许单词之间有多个空格(比如,如果你想允许意外的双空格,或者如果你从PDF中复制粘贴文本),那么在空格后添加一个+: ^ \ w + (+ \ w +) *美元 如果你想允许制表符和换行符(空白字符),那么用\s+替换空格: ^ \ w + (\ s + \ w +) *美元 这里我建议在默认情况下使用+,因为,例如,Windows换行符由两个空格字符组成,分别是\r\n,所以您需要使用+来捕获这两个字符。
还是不行?
检查您使用的正则表达式的方言。*在Java等语言中,你必须转义反斜杠,即\\w和\\s。在更老的或更基本的语言和实用程序中,如sed, \w和\s是没有定义的,所以用字符类分别写出来,例如[a-zA-Z0-9_]和[\f\n\p\r\t]。
*我知道这个问题的标签是vb.net,但根据25000 +的阅读量,我猜不仅仅是那些人遇到了这个问题。目前,它是谷歌上搜索短语正则表达式空间词的第一个热点。
一种可能是将空格添加到您的字符类中,就像acheong87建议的那样,这取决于您对模式的严格程度,因为这也将允许字符串以5个空格开头,或者仅由空格组成。
另一种可能是定义一个模式:
我将使用\w,这是在大多数正则表达式口味与[a-zA-Z0-9_]相同(在一些是基于Unicode的)
^\w+( \w+)*$
这将允许至少一个单词的序列,并且单词用空格分隔。
^匹配字符串的开头
\w+匹配至少一个单词字符的序列
(\w+)*是一个重复0次或更多次的组。在组中,它期望一个空格后面跟着至少一个单词字符的系列
$匹配字符串的结尾
只适用于字母:
^([a-zA-Z])+(\s)+[a-zA-Z]+$
对于字母数字值和_:
^(\w)+(\s)+\w+$