如何在正则表达式中使用非捕获组,即(?:),它们有什么好处?
当前回答
(?:…)充当一个组(…),但不捕获匹配的数据。它确实比标准的捕获组效率高得多。当你想对某个东西进行分组,但以后不需要重用它时,就可以使用它了@托托
其他回答
我想我会给你答案。在未检查匹配是否成功的情况下,不要使用捕获变量。
除非匹配成功,否则捕获变量$1等无效,并且它们也不会被清除。
#!/usr/bin/perl
use warnings;
use strict;
$_ = "bronto saurus burger";
if (/(?:bronto)? saurus (steak|burger)/)
{
print "Fred wants a $1";
}
else
{
print "Fred dont wants a $1 $2";
}
在上面的示例中,为了避免在$1中捕获bronto,使用了(?:)。
如果模式匹配,则$1被捕获为下一个分组模式。
因此,输出如下:
Fred wants a burger
如果不希望保存匹配项,则此选项很有用。
打开您的Google Chrome devTools,然后单击Console选项卡:并键入以下内容:
"Peace".match(/(\w)(\w)(\w)/)
运行它,您将看到:
["Pea", "P", "e", "a", index: 0, input: "Peace", groups: undefined]
JavaScript RegExp引擎捕获三个组,索引为1、2、3的项。现在使用非捕获标记来查看结果。
"Peace".match(/(?:\w)(\w)(\w)/)
结果是:
["Pea", "e", "a", index: 0, input: "Peace", groups: undefined]
这是显而易见的非捕获组。
我是一名JavaScript开发人员,将尝试解释其与JavaScript相关的意义。
考虑一个场景,你想将猫与动物相匹配当你想要匹配猫和动物时,两者之间应该有一个平衡点。
// this will ignore "is" as that's is what we want
"cat is animal".match(/(cat)(?: is )(animal)/) ;
result ["cat is animal", "cat", "animal"]
// using lookahead pattern it will match only "cat" we can
// use lookahead but the problem is we can not give anything
// at the back of lookahead pattern
"cat is animal".match(/cat(?= is animal)/) ;
result ["cat"]
//so I gave another grouping parenthesis for animal
// in lookahead pattern to match animal as well
"cat is animal".match(/(cat)(?= is (animal))/) ;
result ["cat", "cat", "animal"]
// we got extra cat in above example so removing another grouping
"cat is animal".match(/cat(?= is (animal))/) ;
result ["cat", "animal"]
捕获的组可以稍后在正则表达式中使用以匹配,也可以在正则表达式的替换部分中使用它们。创建一个非捕获组只会使该组免于出于以下原因之一而被使用。
如果你试图捕捉很多不同的东西,而有些群体你不想捕捉,那么非捕捉群体是很好的。
这就是它们存在的原因。当你学习团体时,学习原子团体,他们做了很多!也有环视组,但它们有点复杂,而且使用得不多。
稍后在正则表达式中使用的示例(backreference):
<([A-Z][A-Z0-9]*)\b[^>]*>.*</\1> [查找xml标记(不支持ns)]
([A-Z][A-Z0-9]*)是一个捕获组(在本例中是标记名)
稍后在正则表达式中是\ 1,这意味着它将仅与第一组([A-Z][A-Z0-9]*)中的相同文本匹配(在本例中,它与结束标记匹配)。
让我举一个地理坐标的例子,下面是两组
Latitude,Longitude
([+-]?\d+(?:\.\d+)?),([+-]?\d+(?:\.\d+)?)
让我们拿一个([+-]?\d+(?:\.\d+)?)
坐标可以是58这样的整数,也可以是58.666因此,可选的(.666)第二部分(\.\d+)?被提及。
(...)? - for optional
但这是加括号的,这将是另一组匹配。我们不需要两场比赛,一场58分,另一场666分,我们需要一个纬度作为比赛。这里是非捕获组(?:)
与非捕获组[+-]?\d+(?:\.\d+)?,58.666和58都是单场比赛