如何在正则表达式中匹配“在此字符序列之前的任何内容”？

采用以下正则表达式：/^[^abc]/。这将匹配字符串开头的任何单个字符，a、b或c除外。

如果在其后面添加*–/^[^abc]*/–正则表达式将继续向结果中添加每个后续字符，直到它满足a、b或c。

例如，对于源字符串“qwerty qwerty whatever abc hello”，表达式将匹配到“qwerty-qwerty wh”。

但如果我希望匹配的字符串是“qwerty qwerty whatever”呢？

换句话说，我如何将所有内容都匹配到（但不包括）精确的序列“abc”？

当前回答

试试看：

.+?efg

查询：

select REGEXP_REPLACE ('abcdefghijklmn','.+?efg', '') FROM dual;

输出：

hijklmn

其他回答

如果您希望捕获“abc”以下的所有内容：

/^(.*?)abc/

说明：

（）捕获括号内的表达式，以便使用$1、$2等进行访问。

^匹配行首

.*匹配任何内容？非贪婪（匹配所需的最小字符数）-[1]

[1] 需要这样做的原因是，否则，在以下字符串中：

whatever whatever something abc something abc

默认情况下，正则表达式是贪婪的，这意味着它将尽可能匹配。因此/^.*abc/将匹配“whateverwhatever某物abc某物”。添加非贪婪量词？使正则表达式只匹配“无论什么”。

我想将sidyll的答案扩展到正则表达式的不区分大小写版本。

如果你想匹配abc/abc/abc。。。不区分大小写（我需要这样做），使用以下正则表达式。

.+?(?=(?i)abc)

说明：

(?i) - This will make the following abc match case insensitively.

正则表达式的另一种解释与sidyll指出的相同。

$标记字符串的结尾，因此类似这样的操作应该有效：[[^abc]*]$，其中您要查找的任何内容都不以abc的任何迭代结尾，但它必须位于结尾

此外，如果您使用的是带有正则表达式的脚本语言（如PHP或JavaScript），它们有一个搜索函数，当它第一次遇到模式时停止（您可以指定从左开始或从右开始，或者使用PHP，您可以执行内爆以镜像字符串）。

解决方案

/[\s\s]*？（？=abc）/

这将匹配

直到（但不包括）精确的序列“abc”

正如OP所问的，即使源字符串包含换行符，即使序列以abc开头。但是，如果源字符串可能包含换行符，请确保包含多行标志m。

它的工作原理

\s表示任何空白字符（例如空格、制表符、换行符）

\S表示任何非空白字符；即与%s相反

一起[\s\s]表示任何字符。这几乎与相同。除此之外。与换行符不匹配。

*表示前面的标记出现了0+次。在源字符串以abc开头的情况下，我使用了this而不是+。

（？=）被称为正向前瞻。它需要与括号中的字符串匹配，但恰好在它之前停止，因此（？=abc）表示“直到但不包括abc，但abc必须存在于源字符串中”。

? 介于[\s\s]*和（？=abc）之间表示懒惰（又称非贪婪）。即在第一abc处停止。如果abc出现不止一次，那么如果没有这一点，它将捕获直到abc最后出现的每个字符。

在Python中：

.+?（？=abc）适用于单线情况。

[^]+?（？=abc）不起作用，因为python无法将[^]识别为有效的正则表达式。要使多行匹配工作，需要使用re.DOTALL选项，例如：

re.findall('.+?(?=abc)', data, re.DOTALL)

推荐文章