RegEx:在引号之间抓取值

我的值是这样的:

"Foo Bar" "Another Value" something else

什么正则表达式将返回括在引号中的值(例如Foo Bar和Another Value)?

当前回答

我喜欢Eugen Mihailescu的解决方案，在允许转义引号的同时匹配引号之间的内容。然而，我发现了一些转义的问题，并提出了以下正则表达式来解决它们:

(['"])(?:(?!\1|\\).|\\.)*\1

它做到了这一点，而且仍然非常简单，易于维护。

演示(包含更多的测试用例;请随意使用并扩展它)。

PS:如果你只是想在引号之间的内容完全匹配($0)，并不怕性能惩罚使用:

(?<=(['"])\b)(?:(?!\1|\\).|\\.)*(?=\1)

不幸的是，没有引号作为锚，我不得不添加一个边界\b，它不能很好地处理开始引号后的空格和非单词边界字符。

或者，修改初始版本，只需添加一个组，并从$2中提取字符串:

(['"])((?:(?!\1|\\).|\\.)*)\1

PPS:如果你只关注效率，那就选择Casimir和Hippolyte的解决方案;这是一个很好的例子。

2018-05-13 21:36:39

其他回答

特别的是，这些答案都不会产生一个正则表达式，其中返回的匹配是所要求的引号内的文本。MA-Madden尝试了，但只获得了内部匹配，而不是整个匹配。一种实际的方法是:

(?<=(["']\b))(?:(?=(\\?))\2.)*?(?=\1)

这方面的例子可以在这个演示https://regex101.com/r/Hbj8aP/1中看到

The key here is the the positive lookbehind at the start (the ?<= ) and the positive lookahead at the end (the ?=). The lookbehind is looking behind the current character to check for a quote, if found then start from there and then the lookahead is checking the character ahead for a quote and if found stop on that character. The lookbehind group (the ["']) is wrapped in brackets to create a group for whichever quote was found at the start, this is then used at the end lookahead (?=\1) to make sure it only stops when it finds the corresponding quote.

唯一的另一个复杂之处在于，由于前向查询实际上并不使用结束引号，它将被开始后向查询再次找到，这将导致匹配同一行上结束引号和开始引号之间的文本。在开头引用(["']\b)上加上一个单词边界有助于解决这个问题，尽管理想情况下我想跳过前瞻，但我认为这是不可能的。中间允许转义字符的部分直接取自亚当的回答。

2017-11-10 01:22:45

更多的答案!这是我使用的解决方案

\"([^\"]*? 图标 [^\"]*?)\"

TLDR; 替换词图标与你所寻找的说语录，瞧!

它的工作方式是寻找关键字，而不关心引号之间的其他内容。例如: id = " fb-icon " id = " icon-close " id = " large-icon-close " 正则表达式查找引号" 然后它寻找任何可能的字母组，而不是“ 直到找到图标任何可能的字母组都不是" 然后它会寻找一个结束。”

2016-11-10 03:06:42

一般来说，下面的正则表达式片段就是你要找的:

"(.*?)"

这使用了非贪婪的*?运算符来捕获下一个双引号之前的所有内容。然后，使用特定于语言的机制提取匹配的文本。

在Python中，你可以这样做:

>>> import re
>>> string = '"Foo Bar" "Another Value"'
>>> print re.findall(r'"(.*?)"', string)
['Foo Bar', 'Another Value']

2008-10-05 04:24:49

这个版本

转义引号的说明控制回溯 /(["'])((?:(?!\ 1 )[^\\]|(?:\\\\)*\\[^\\])*)\ 1 /

2008-10-06 01:42:52

我能够创建这个正则表达式来满足我的需求。

我需要匹配一个包含引号的特定值。它必须是完全匹配的，没有部分匹配可以触发命中

如。“test”不能与“test2”匹配。

reg = r"""(['"])(%s)\1"""
if re.search(reg%(needle), haystack, re.IGNORECASE):
    print "winning..."

猎人

2011-11-29 15:59:09

RegEx:在引号之间抓取值

推荐文章

最新文章

标签