采用以下正则表达式:/^[^abc]/。这将匹配字符串开头的任何单个字符,a、b或c除外。
如果在其后面添加*–/^[^abc]*/–正则表达式将继续向结果中添加每个后续字符,直到它满足a、b或c。
例如,对于源字符串“qwerty qwerty whatever abc hello”,表达式将匹配到“qwerty-qwerty wh”。
但如果我希望匹配的字符串是“qwerty qwerty whatever”呢?
换句话说,我如何将所有内容都匹配到(但不包括)精确的序列“abc”?
采用以下正则表达式:/^[^abc]/。这将匹配字符串开头的任何单个字符,a、b或c除外。
如果在其后面添加*–/^[^abc]*/–正则表达式将继续向结果中添加每个后续字符,直到它满足a、b或c。
例如,对于源字符串“qwerty qwerty whatever abc hello”,表达式将匹配到“qwerty-qwerty wh”。
但如果我希望匹配的字符串是“qwerty qwerty whatever”呢?
换句话说,我如何将所有内容都匹配到(但不包括)精确的序列“abc”?
当前回答
我相信你需要子表达式。子表达式可以使用普通()括号。
本部分来自grep手册:
反向引用和子表达式后引用\n(其中n是一个数字)与子字符串匹配之前由正则表达式。
做类似于^[^(abc)]的事情应该会奏效。
其他回答
如果您希望捕获“abc”以下的所有内容:
/^(.*?)abc/
说明:
()捕获括号内的表达式,以便使用$1、$2等进行访问。
^匹配行首
.*匹配任何内容?非贪婪(匹配所需的最小字符数)-[1]
[1] 需要这样做的原因是,否则,在以下字符串中:
whatever whatever something abc something abc
默认情况下,正则表达式是贪婪的,这意味着它将尽可能匹配。因此/^.*abc/将匹配“whateverwhatever某物abc某物”。添加非贪婪量词?使正则表达式只匹配“无论什么”。
$标记字符串的结尾,因此类似这样的操作应该有效:[[^abc]*]$,其中您要查找的任何内容都不以abc的任何迭代结尾,但它必须位于结尾
此外,如果您使用的是带有正则表达式的脚本语言(如PHP或JavaScript),它们有一个搜索函数,当它第一次遇到模式时停止(您可以指定从左开始或从右开始,或者使用PHP,您可以执行内爆以镜像字符串)。
你需要看看断言,比如.+?(?=abc)。
请参阅:零长度断言的前瞻性和滞后性
请注意[abc]与abc不同。在括号内,它不是一个字符串-每个字符只是一种可能性。在括号外,它成为字符串。
所以我不得不即兴发挥。。。过了一段时间,我终于找到了所需的正则表达式:
如您所见,我需要在“grp bps”文件夹之前最多一个文件夹,但不包括最后一个破折号。并且要求在“grp bps”文件夹之后至少有一个文件夹。
复制粘贴的文本版本(更改文本的“grp bps”):
.*\/grp-bps\/[^\/]+
在寻求帮助解决问题后,我以堆栈溢出问题结束,但我没有找到任何解决方法:(
解决方案
/[\s\s]*?(?=abc)/
这将匹配
直到(但不包括)精确的序列“abc”
正如OP所问的,即使源字符串包含换行符,即使序列以abc开头。但是,如果源字符串可能包含换行符,请确保包含多行标志m。
它的工作原理
\s表示任何空白字符(例如空格、制表符、换行符)
\S表示任何非空白字符;即与%s相反
一起[\s\s]表示任何字符。这几乎与相同。除此之外。与换行符不匹配。
*表示前面的标记出现了0+次。在源字符串以abc开头的情况下,我使用了this而不是+。
(?=)被称为正向前瞻。它需要与括号中的字符串匹配,但恰好在它之前停止,因此(?=abc)表示“直到但不包括abc,但abc必须存在于源字符串中”。
? 介于[\s\s]*和(?=abc)之间表示懒惰(又称非贪婪)。即在第一abc处停止。如果abc出现不止一次,那么如果没有这一点,它将捕获直到abc最后出现的每个字符。