正则表达式前视、后视和原子组

我发现这些东西在我的正则体，但我没有一个线索，我可以使用它们。谁能举个例子，让我试着理解它们是如何工作的?

(?!) - negative lookahead
(?=) - positive lookahead
(?<=) - positive lookbehind
(?<!) - negative lookbehind

(?>) - atomic group

例子

给定字符串foobarbarfoo:

bar(?=bar)     finds the 1st bar ("bar" which has "bar" after it)
bar(?!bar)     finds the 2nd bar ("bar" which does not have "bar" after it)
(?<=foo)bar    finds the 1st bar ("bar" which has "foo" before it)
(?<!foo)bar    finds the 2nd bar ("bar" which does not have "foo" before it)

你也可以将它们组合起来:

(?<=foo)bar(?=bar)    finds the 1st bar ("bar" with "foo" before it and "bar" after it)

定义

积极地向前看(?=)

在表达式B后面找到表达式A:

A(?=B)

前瞻消极(?!)

找到表达式A，其中表达式B不跟在后面:

A(?!B)

正面看后面(?<=)

在表达式B之前找到表达式A:

(?<=B)A

看负(?<!)

找到表达式A，其中表达式B不在前面:

(?<!B)A

原子团(?>)

原子组退出一个组，并在组内第一个匹配的模式之后丢弃替代模式(回溯被禁用)。

(?>foo|foot)应用于foots的s将匹配它的第一个替代foo，然后失败，因为s没有立即跟随，并在回溯被禁用时停止

非原子组将允许回溯;如果后续的匹配失败，它将返回并使用替代模式，直到找到整个表达式的匹配或用尽所有可能性。

(foo|foot)应用于foots将: 匹配它的第一个替代foo，然后失败，因为s没有立即跟随在foots中，并返回到它的第二个替代; 匹配它的第二个备选脚，然后成功，因为s紧随其后，并停止。

一些资源

http://www.regular-expressions.info/lookaround.html http://www.rexegg.com/regex-lookarounds.html

在线测试人员

https://regex101.com

2010-06-04 11:06:12

查找是零宽度断言。它们检查正则表达式(朝着当前位置的右边或左边——基于前面或后面)，当找到匹配时成功或失败(基于它是正的还是负的)，并丢弃匹配的部分。它们不消耗任何字符-对它们后面的正则表达式的匹配(如果有的话)将从相同的光标位置开始。

更多细节请阅读regular-expression.info。

积极的超前:

语法:

(?=REGEX_1)REGEX_2

仅当REGEX_1匹配时才匹配;匹配REGEX_1后，丢弃匹配，从同一位置开始查找REGEX_2。

例子:

(?=[a-z0-9]{4}$)[a-z]{1,2}[0-9]{2,3}

REGEX_1是[a-z0-9]{4}$，它匹配四个后跟行尾的字母数字字符。 REGEX_2是[a-z]{1,2}[0-9]{2,3}，它匹配一个或两个字母后面跟着两个或三个数字。

REGEX_1确保字符串的长度确实为4，但不消耗任何字符，以便从同一位置开始搜索REGEX_2。现在REGEX_2确保字符串匹配其他一些规则。如果没有前瞻，它将匹配长度为3或5的字符串。

消极的超前

语法:

(?!REGEX_1)REGEX_2

仅当REGEX_1不匹配时匹配;在检查了REGEX_1之后，从同一位置开始搜索REGEX_2。

例子:

(?!.*\bFWORD\b)\w{10,30}$

前瞻部分检查字符串中的FWORD，如果找到则失败。如果它没有找到FWORD，则向前查找成功，下面的部分验证字符串的长度在10到30之间，并且只包含单词字符a-zA-Z0-9_

向后查找与向前查找类似:它只查看当前光标位置的后面。一些正则表达式风格(如javascript)不支持向后查找断言。而且大多数支持它的版本(PHP, Python等)都要求后面的查看部分有固定的长度。

一旦一个令牌匹配，原子组基本上会丢弃/忘记组中的后续令牌。查看本页以获得原子组的示例

2010-06-04 11:23:21

格洛金迅速地环顾四周。如何区分前瞻和后瞻? 和我一起游览2分钟:

(?=) - positive lookahead
(?<=) - positive lookbehind

假设

    A  B  C #in a line

现在，我们问B，你在哪里? B有两个方案来声明它的位置:

一，B有A在前面，C在后面二，B在C的前面(前面)，在A的后面(后面)。

我们可以看到，前面和后面在两个解中是相反的。正则表达式是解决方案二。

2018-04-04 15:08:13

为什么?假设你在玩wordle游戏，你输入了“ant”。(是的，三个字母的单词，这只是一个例子-冷静)

答案返回为空白，黄色，绿色，并且您有一个三字母单词的列表，您希望使用正则表达式来搜索?你会怎么做?

首先，你可以从第三个位置的t开始:

[a-z]{2}t

我们可以通过注意没有a来改进

[b-z]{2}t

我们可以进一步改进，说搜索中必须有n。

(?=.*n)[b-z]{2}t

或者把它分解;

(?=.*n) -向前看，并检查匹配中有n，它可能有0个或多个字符在n之前

[b-z]{2} -前两个位置除“a”外的两个字母;

T，字面上的T在第三个位置

2022-05-03 12:45:16

我曾经回头寻找模式，并向前看，以寻找表丢失与(nolock)

expression="(?<=DB\.dbo\.)\w+\s+\w+\s+(?!with\(nolock\))"

matches=re.findall(expression,sql)
for match in matches:
    print(match)

2022-06-09 14:51:57

正则表达式前视、后视和原子组

推荐文章

最新文章

标签