什么是正则表达式中的非捕获组？

如何在正则表达式中使用非捕获组，即（？：），它们有什么好处？

当前回答

捕获的组可以稍后在正则表达式中使用以匹配，也可以在正则表达式的替换部分中使用它们。创建一个非捕获组只会使该组免于出于以下原因之一而被使用。

如果你试图捕捉很多不同的东西，而有些群体你不想捕捉，那么非捕捉群体是很好的。

这就是它们存在的原因。当你学习团体时，学习原子团体，他们做了很多！也有环视组，但它们有点复杂，而且使用得不多。

稍后在正则表达式中使用的示例（backreference）：

<（[A-Z][A-Z0-9]*）\b[^>]*>.*</\1> [查找xml标记（不支持ns）]

（[A-Z][A-Z0-9]*）是一个捕获组（在本例中是标记名）

稍后在正则表达式中是\ 1，这意味着它将仅与第一组（[A-Z][A-Z0-9]*）中的相同文本匹配（在本例中，它与结束标记匹配）。

其他回答

简单的答案

使用它们来确保在这里出现几种可能性中的一种（？：一个|两个）或可选短语camp（？：站点）？或者一般来说，任何你想建立一个组/短语/部分而不需要特别提及的地方。

他们将您捕获的组数保持在最小值。

tl；dr非捕获组，顾名思义，是正则表达式中不希望包含在匹配中的部分，以及？：是一种将组定义为非捕获的方法。

假设你有一个电子邮件地址example@example.com.以下正则表达式将创建两个组，id部分和@example.com部分。（\p｛Alpha｝*[a-z]）（@example.com）。为了简单起见，我们提取了包括@字符在内的整个域名。

现在让我们假设，您只需要地址的id部分。您要做的是获取匹配结果的第一个组，在正则表达式中用（）包围，这样做的方法是使用非捕获组语法，即？：。因此，正则表达式（\p｛Alpha｝*[a-z]）（？：@example.com）将只返回电子邮件的id部分。

让我举个例子：

Regex代码：（？：animal）（？：=）（\w+）（，）\1\2

搜索字符串：

第1行-动物=猫、狗、猫、老虎、狗

第2行-动物=猫、猫、狗、狗、老虎

第3行-动物=狗、狗、猫、猫、老虎

（？：动物）-->未捕获组1

（？：=）-->未捕获组2

（\w+）-->捕获的组1

（，）-->捕获的组2

\1-->捕获组1的结果，即第1行是猫，第2行是猫、第3行是狗。

\2-->捕获组2的结果，即逗号（，）

因此，在这段代码中，通过给出“1”和“2”，我们在代码后面分别回忆或重复捕获的组1和组2的结果。

根据代码的顺序，（？：动物）应为第1组，（？=）应为2组，并继续。。

但通过给出？：我们使匹配组不被捕获（在匹配组中不计数，因此分组编号从第一个捕获的组开始，而不是未捕获的组），这样以后就不能在代码中调用匹配组（？：动物）结果的重复。

希望这能解释非捕获组的使用。

?: 当您想对表达式进行分组，但不想将其保存为字符串的匹配/捕获部分时，使用。

一个例子是匹配IP地址：

/(?:\d{1,3}\.){3}\d{1,3}/

请注意，我不在乎保存前3个八位字节，但（？：…）分组允许我缩短正则表达式，而不会导致捕获和存储匹配项的开销。

（？：…）充当一个组（…），但不捕获匹配的数据。它确实比标准的捕获组效率高得多。当你想对某个东西进行分组，但以后不需要重用它时，就可以使用它了@托托

推荐文章