在正则表达式的上下文中，'lazy'和'greedy'是什么意思?

这两个术语是什么?

当前回答

摘自www.regular-expressions.info

贪心:贪心量词首先尝试重复标记尽可能多的次数尽可能，并逐渐放弃匹配，因为引擎返回寻找一场全面的比赛。

惰性:惰性量词首先根据需要重复标记的次数，然后随着引擎通过正则表达式返回到，逐渐扩展匹配找到一个整体匹配。

2014-10-19 08:34:34

其他回答

贪婪匹配。正则表达式的默认行为是贪婪的。这意味着它会尝试提取尽可能多的数据，直到它符合某个模式，即使在语法上只需要较小的部分就足够了。

例子:

import re
text = "<body>Regex Greedy Matching Example </body>"
re.findall('<.*>', text)
#> ['<body>Regex Greedy Matching Example </body>']

它提取了整个字符串，而不是直到' > '第一次出现才匹配。这是regex默认的贪婪或“全部拿走”行为。

另一方面，懒惰匹配“需要的越少越好”。这可以通过添加一个?在图案的最后。

例子:

re.findall('<.*?>', text)
#> ['<body>', '</body>']

如果只希望检索第一个匹配项，则使用search方法。

re.search('<.*?>', text).group()
#> '<body>'

来源:Python Regex Examples

2018-01-21 05:35:59

贪婪量词就像美国国税局

他们会尽量多拿。例如，匹配这个正则表达式:.*

The $50000

再见了，银行余额。

这里有一个例子:贪婪的例子

非贪婪量词——他们拿走的越少越好

要求退税:国税局突然变得不贪心了，退税越少越好:也就是说，他们用了这个量词:

(.{2,5}?)([0-9]*)与此输入:$50,000

第一组是不需要的，只匹配5美元-所以我从5万美元的输入中得到5美元的退款。

看这里:非贪婪的例子。

为什么我们需要贪婪和非贪婪?

如果你试图匹配一个表达式的某些部分，这就变得很重要。有时候你不想把所有的东西都搭配起来——越少越好。有时候你想要尽可能的匹配。仅此而已。

你可以使用上面链接中的例子。

(用来帮助你记忆的比喻)。

2020-01-28 05:23:16

贪婪的人会尽可能多地消费。在http://www.regular-expressions.info/repeat.html中，我们看到了试图将HTML标记与<.+>匹配的示例。假设你有以下情况:

<em>Hello World</em>

你可能认为…+ >(。表示任何非换行符，+表示一个或多个)将只匹配<em>和</em>，而实际上它将非常贪婪，并从第一个<到最后一个>。这意味着它将匹配<em>Hello World</em>，而不是你想要的。

将其设置为惰性(<.+?>)将防止这种情况。通过添加?在+之后，我们告诉它重复尽可能少的次数，所以它遇到的第一个>就是我们想要停止匹配的地方。

我鼓励你下载RegExr，这是一个很好的工具，可以帮助你探索正则表达式——我一直在用它。

2010-02-20 06:22:32

贪婪意味着它将消耗你的模式，直到没有剩下的，它不能再看了。

Lazy会在遇到您请求的第一个模式时立即停止。

我经常遇到的一个常见的例子是\s*-\s*?([0-9]{2}\s*-\s*?[0-9]{7})

第一个\s*被归类为贪婪的，因为有*，它会在遇到数字后寻找尽可能多的空白，然后寻找破折号“-”。第二个s*在哪里?懒惰是因为*的存在吗?这意味着它将查看第一个空白字符并在那里停止。

2018-02-06 15:41:32

试着理解以下行为:

    var input = "0014.2";

Regex r1 = new Regex("\\d+.{0,1}\\d+");
Regex r2 = new Regex("\\d*.{0,1}\\d*");

Console.WriteLine(r1.Match(input).Value); // "0014.2"
Console.WriteLine(r2.Match(input).Value); // "0014.2"

input = " 0014.2";

Console.WriteLine(r1.Match(input).Value); // "0014.2"
Console.WriteLine(r2.Match(input).Value); // " 0014"

input = "  0014.2";

Console.WriteLine(r1.Match(input).Value); // "0014.2"
Console.WriteLine(r2.Match(input).Value); // ""

2016-10-30 06:31:14

在正则表达式的上下文中，'lazy'和'greedy'是什么意思?

推荐文章

最新文章

标签