RegEx:在引号之间抓取值

我的值是这样的:

"Foo Bar" "Another Value" something else

什么正则表达式将返回括在引号中的值(例如Foo Bar和Another Value)?

当前回答

我的解决方案如下

(\[‘])。* 1 (? ! [s ^ \])

演示链接:https://regex101.com/r/jlhQhV/1

解释:

(["'])->匹配'或'，一旦找到匹配，将其存储在反向引用\1中

.* ->贪婪的方法继续匹配所有内容0次或更多次，直到它在字符串末尾遇到'或"。遇到这种状态后，正则表达式引擎返回到上一个匹配字符，此时正则表达式结束，将移动到下一个正则表达式。

\1 ->匹配先前与第一个捕获组匹配的字符或字符串。

(?![^\s]) ->负前向，确保在之前的匹配之后不应该有任何非空格字符

2022-06-14 09:59:27

其他回答

string = "\" foo bar\" \"loloo\""
print re.findall(r'"(.*?)"',string)

试试这个，就像一个魅力!!

\表示跳过字符

2014-02-12 07:28:34

我喜欢《Axeman》更广阔的版本，但也遇到了一些问题(游戏邦注:例如它并不匹配

foo "string \\ string" bar

foo "string1"   bar   "string2"

所以我试着修正它:

# opening quote
(["'])
   (
     # repeat (non-greedy, so we don't span multiple strings)
     (?:
       # anything, except not the opening quote, and not 
       # a backslash, which are handled separately.
       (?!\1)[^\\]
       |
       # consume any double backslash (unnecessary?)
       (?:\\\\)*       
       |
       # Allow backslash to escape characters
       \\.
     )*?
   )
# same character as opening quote
\1

2013-10-01 19:41:10

与亚当的答案不同，我有一个简单但有效的答案:

(["'])(?:\\\1|.)*?\1

如果你想要得到引号中的内容，只需添加圆括号:

(["'])((?:\\\1|.)*?)\1

$1匹配引号字符，$2匹配内容字符串。

2018-05-06 03:32:28

我能够创建这个正则表达式来满足我的需求。

我需要匹配一个包含引号的特定值。它必须是完全匹配的，没有部分匹配可以触发命中

如。“test”不能与“test2”匹配。

reg = r"""(['"])(%s)\1"""
if re.search(reg%(needle), haystack, re.IGNORECASE):
    print "winning..."

猎人

2011-11-29 15:59:09

让我们看看处理转义引号的两种有效方法。这些模式不是为了简洁或美观而设计的，而是为了高效。

这些方法使用第一个字符区分快速查找字符串中的引号，而不需要进行替换。(这个想法是快速丢弃不是引号的字符，以测试交替的两个分支。)

引号之间的内容用一个展开的循环(而不是重复的交替)来描述，这样也更有效率:[^"\\]*(?:\\.[^"\\]*)*

显然，要处理没有平衡引号的字符串，可以使用所有格量词:[^"\\]*+(?:\\.[^"\\]*)*+或模仿它们的替代方法，以防止太多回溯。你也可以选择一个带引号的部分可以是一个开始引号，直到下一个(非转义)引号或字符串的结尾。在这种情况下，没有必要使用所有格量词，你只需要使最后一个引用是可选的。

注意:有时引号不是用反斜杠转义，而是通过重复引号转义。在这种情况下，内容子模式看起来像这样:[^"]*(?:""[^"]*)*

这些模式避免使用捕获组和反向引用(我的意思是(["']).....\1)，并使用简单的替换，但在factor开头使用["']。

Perl像:

["'](?:(?<=")[^"\\]*(?s:\\.[^"\\]*)*"|(?<=')[^'\\]*(?s:\\.[^'\\]*)*')

(注意，(?s:…)是一个语法糖，用于在非捕获组中打开dotall/单线模式。如果不支持此语法，您可以轻松地为所有模式打开此模式或将点替换为[\s\ s])

(这种模式的编写方式完全是“手工驱动的”，没有考虑到最终的引擎内部优化)

ECMA脚本:

(?=["'])(?:"[^"\\]*(?:\\[\s\S][^"\\]*)*"|'[^'\\]*(?:\\[\s\S][^'\\]*)*')

POSIX扩展:

"[^"\\]*(\\(.|\n)[^"\\]*)*"|'[^'\\]*(\\(.|\n)[^'\\]*)*'

或者仅仅是:

"([^"\\]|\\.|\\\n)*"|'([^'\\]|\\.|\\\n)*'

2015-04-05 00:13:03

RegEx:在引号之间抓取值

推荐文章

最新文章

标签