采用以下正则表达式:/^[^abc]/。这将匹配字符串开头的任何单个字符,a、b或c除外。

如果在其后面添加*–/^[^abc]*/–正则表达式将继续向结果中添加每个后续字符,直到它满足a、b或c。

例如,对于源字符串“qwerty qwerty whatever abc hello”,表达式将匹配到“qwerty-qwerty wh”。

但如果我希望匹配的字符串是“qwerty qwerty whatever”呢?

换句话说,我如何将所有内容都匹配到(但不包括)精确的序列“abc”?


当前回答

你需要看看断言,比如.+?(?=abc)。

请参阅:零长度断言的前瞻性和滞后性

请注意[abc]与abc不同。在括号内,它不是一个字符串-每个字符只是一种可能性。在括号外,它成为字符串。

其他回答

我相信你需要子表达式。子表达式可以使用普通()括号。

本部分来自grep手册:

反向引用和子表达式后引用\n(其中n是一个数字)与子字符串匹配之前由正则表达式。

做类似于^[^(abc)]的事情应该会奏效。

$标记字符串的结尾,因此类似这样的操作应该有效:[[^abc]*]$,其中您要查找的任何内容都不以abc的任何迭代结尾,但它必须位于结尾

此外,如果您使用的是带有正则表达式的脚本语言(如PHP或JavaScript),它们有一个搜索函数,当它第一次遇到模式时停止(您可以指定从左开始或从右开始,或者使用PHP,您可以执行内爆以镜像字符串)。

这将对正则表达式有意义。

确切的单词可以从以下regex命令中获得:

("(.*?)")/g

在这里,我们可以得到属于双引号内的全局准确单词。

例如,如果我们的搜索文本是

这是“双引号”单词的示例

然后我们会从那句话中得到“双引号”。

您没有指定使用的是哪种类型的正则表达式,但这将在任何一个最受欢迎的可以被认为是“完整”的工作。

/.+?(?=abc)/

它的工作原理

.+?部分是.+的非贪婪版本(一个或多个任何事情)。当我们使用.+,发动机基本上会匹配一切。然后,如果正则表达式中有其他内容,它将按步骤返回试图匹配以下部分。这是贪婪的行为,意味着尽可能满足。

使用.+?时?,而不是一次匹配,然后返回其他条件(如果有),引擎将通过以下方式匹配下一个字符步骤,直到匹配正则表达式的后续部分(如果有,则再次)。这是不贪婪的,意味着尽可能少地匹配满足

/.+X/  ~ "abcXabcXabcX"        /.+/  ~ "abcXabcXabcX"
          ^^^^^^^^^^^^                  ^^^^^^^^^^^^

/.+?X/ ~ "abcXabcXabcX"        /.+?/ ~ "abcXabcXabcX"
          ^^^^                          ^

接下来我们有(?={contents}),一个零宽度断言,环顾四周。此分组结构与其内容,但不算作匹配字符(零宽度)。它仅在是否匹配时返回(断言)。

因此,换句话说,正则表达式/.+?(?=abc)/表示:

尽可能少地匹配任何字符,直到找到“abc”,不计算“abc”。

正如Jared Ng和@Issun所指出的,解决这种正则表达式的关键是“匹配某个单词或子字符串之前的所有内容”或“匹配某一单词或子串之后的所有内容。”。在这里阅读更多关于他们的信息。

在您的特定情况下,可以通过积极的展望来解决:.+?(?=abc)

一幅画胜过千言万语。请参见屏幕截图中的详细说明。