如何在正则表达式中匹配“在此字符序列之前的任何内容”？

采用以下正则表达式：/^[^abc]/。这将匹配字符串开头的任何单个字符，a、b或c除外。

如果在其后面添加*–/^[^abc]*/–正则表达式将继续向结果中添加每个后续字符，直到它满足a、b或c。

例如，对于源字符串“qwerty qwerty whatever abc hello”，表达式将匹配到“qwerty-qwerty wh”。

但如果我希望匹配的字符串是“qwerty qwerty whatever”呢？

换句话说，我如何将所有内容都匹配到（但不包括）精确的序列“abc”？

如果您希望捕获“abc”以下的所有内容：

/^(.*?)abc/

说明：

（）捕获括号内的表达式，以便使用$1、$2等进行访问。

^匹配行首

.*匹配任何内容？非贪婪（匹配所需的最小字符数）-[1]

[1] 需要这样做的原因是，否则，在以下字符串中：

whatever whatever something abc something abc

默认情况下，正则表达式是贪婪的，这意味着它将尽可能匹配。因此/^.*abc/将匹配“whateverwhatever某物abc某物”。添加非贪婪量词？使正则表达式只匹配“无论什么”。

2011-08-19 16:48:12

$标记字符串的结尾，因此类似这样的操作应该有效：[[^abc]*]$，其中您要查找的任何内容都不以abc的任何迭代结尾，但它必须位于结尾

此外，如果您使用的是带有正则表达式的脚本语言（如PHP或JavaScript），它们有一个搜索函数，当它第一次遇到模式时停止（您可以指定从左开始或从右开始，或者使用PHP，您可以执行内爆以镜像字符串）。

2011-08-19 16:52:03

我相信你需要子表达式。子表达式可以使用普通（）括号。

本部分来自grep手册：

反向引用和子表达式后引用\n（其中n是一个数字）与子字符串匹配之前由正则表达式。

做类似于^[^（abc）]的事情应该会奏效。

2011-08-19 16:52:06

您没有指定使用的是哪种类型的正则表达式，但这将在任何一个最受欢迎的可以被认为是“完整”的工作。

/.+?(?=abc)/

它的工作原理

.+？部分是.+的非贪婪版本（一个或多个任何事情）。当我们使用.+，发动机基本上会匹配一切。然后，如果正则表达式中有其他内容，它将按步骤返回试图匹配以下部分。这是贪婪的行为，意味着尽可能满足。

使用.+？时？，而不是一次匹配，然后返回其他条件（如果有），引擎将通过以下方式匹配下一个字符步骤，直到匹配正则表达式的后续部分（如果有，则再次）。这是不贪婪的，意味着尽可能少地匹配满足

/.+X/  ~ "abcXabcXabcX"        /.+/  ~ "abcXabcXabcX"
          ^^^^^^^^^^^^                  ^^^^^^^^^^^^

/.+?X/ ~ "abcXabcXabcX"        /.+?/ ~ "abcXabcXabcX"
          ^^^^                          ^

接下来我们有（？={contents}），一个零宽度断言，环顾四周。此分组结构与其内容，但不算作匹配字符（零宽度）。它仅在是否匹配时返回（断言）。

因此，换句话说，正则表达式/.+？（？=abc）/表示：

尽可能少地匹配任何字符，直到找到“abc”，不计算“abc”。

2011-08-19 17:03:11

你需要看看断言，比如.+？（？=abc）。

请参阅：零长度断言的前瞻性和滞后性

请注意[abc]与abc不同。在括号内，它不是一个字符串-每个字符只是一种可能性。在括号外，它成为字符串。

2011-08-19 17:22:42

正如Jared Ng和@Issun所指出的，解决这种正则表达式的关键是“匹配某个单词或子字符串之前的所有内容”或“匹配某一单词或子串之后的所有内容。”。在这里阅读更多关于他们的信息。

在您的特定情况下，可以通过积极的展望来解决：.+？（？=abc）

一幅画胜过千言万语。请参见屏幕截图中的详细说明。

2015-09-21 19:21:40

试试看：

.+?efg

查询：

select REGEXP_REPLACE ('abcdefghijklmn','.+?efg', '') FROM dual;

输出：

hijklmn

2016-10-28 12:51:06

对于Java中的正则表达式，我也相信在大多数正则表达式引擎中，如果您想包括最后一部分，这将起作用：

.+?(abc)

例如，在这行中：

I have this very nice senabctence

选择“abc”之前的所有字符，并包括abc。

使用正则表达式，结果将是：我有一个非常好的senabc

测试一下：https://regex101.com/r/mX51ru/1

2016-11-30 08:17:59

这将对正则表达式有意义。

确切的单词可以从以下regex命令中获得：

("(.*?)")/g

在这里，我们可以得到属于双引号内的全局准确单词。

例如，如果我们的搜索文本是

这是“双引号”单词的示例

然后我们会从那句话中得到“双引号”。

2017-05-25 06:57:10

所以我不得不即兴发挥。。。过了一段时间，我终于找到了所需的正则表达式：

如您所见，我需要在“grp bps”文件夹之前最多一个文件夹，但不包括最后一个破折号。并且要求在“grp bps”文件夹之后至少有一个文件夹。

复制粘贴的文本版本（更改文本的“grp bps”）：

.*\/grp-bps\/[^\/]+

在寻求帮助解决问题后，我以堆栈溢出问题结束，但我没有找到任何解决方法：(

2018-11-20 18:48:45

在Python中：

.+?（？=abc）适用于单线情况。

[^]+?（？=abc）不起作用，因为python无法将[^]识别为有效的正则表达式。要使多行匹配工作，需要使用re.DOTALL选项，例如：

re.findall('.+?(?=abc)', data, re.DOTALL)

2020-03-04 19:41:49

解决方案

/[\s\s]*？（？=abc）/

这将匹配

直到（但不包括）精确的序列“abc”

正如OP所问的，即使源字符串包含换行符，即使序列以abc开头。但是，如果源字符串可能包含换行符，请确保包含多行标志m。

它的工作原理

\s表示任何空白字符（例如空格、制表符、换行符）

\S表示任何非空白字符；即与%s相反

一起[\s\s]表示任何字符。这几乎与相同。除此之外。与换行符不匹配。

*表示前面的标记出现了0+次。在源字符串以abc开头的情况下，我使用了this而不是+。

（？=）被称为正向前瞻。它需要与括号中的字符串匹配，但恰好在它之前停止，因此（？=abc）表示“直到但不包括abc，但abc必须存在于源字符串中”。

? 介于[\s\s]*和（？=abc）之间表示懒惰（又称非贪婪）。即在第一abc处停止。如果abc出现不止一次，那么如果没有这一点，它将捕获直到abc最后出现的每个字符。

2021-05-07 11:21:20

我想将sidyll的答案扩展到正则表达式的不区分大小写版本。

如果你想匹配abc/abc/abc。。。不区分大小写（我需要这样做），使用以下正则表达式。

.+?(?=(?i)abc)

说明：

(?i) - This will make the following abc match case insensitively.

正则表达式的另一种解释与sidyll指出的相同。

2021-05-27 10:11:18

匹配从开始到“在ABC之前”或“行结束”（如果没有ABC）

（1）如果字符串在任何地方都不包含ABC，则匹配整个字符串

（2）与空字符串不匹配

（不检查带换行符的字符串）

^.+?(?=ABC|$)

2022-05-22 10:04:49

您的问题没有指定后续的字符序列是否是可选的，但所有其他答案都假定序列总是给定的。所以这里有一个，如果序列是可选的。

例如，如果将代码匹配到像foo#这样的行注释。。。或foo//。。。，行注释本身可能是可选的，但可能仍然希望与前面的代码匹配。

在这种情况下，我会使用^（？：（？！abc）。）*（或行注释：^（？：（？！#）。）*或^（？：（？！\/\/）.）*）。

说明：^标记行的开头。（？：）是一个非捕获组，因为常规组将额外捕获组中最后一个匹配的字母，这是我们不需要的。在组内，我们使用负前瞻（？！）和。，所以除了特定的序列之外，所有的东西都是匹配的。使用*重复0到无限次。如果只想匹配非空字符串，请改用+。

2022-12-05 17:25:55

如何在正则表达式中匹配“在此字符序列之前的任何内容”？

推荐文章

最新文章

标签