简单的正则表达式问题。我有一个字符串的以下格式:

this is a [sample] string with [some] special words. [another one]

提取方括号内的单词的正则表达式是什么?

sample
some
another one

注意:在我的用例中,括号不能嵌套。


当前回答

如果你不想在匹配中包含括号,下面是正则表达式:(?<=\[).*?(?=\])

让我们来分析一下

的。匹配除行结束符以外的任何字符。?=是一个正面的前瞻。当某个字符串跟在某个字符串后面时,正向向前查找该字符串。<=是一个正向的后视。当某个字符串位于某个字符串的前面时,正向向后查找查找该字符串。引用一下,

积极地向前看(?=) 在表达式B后面找到表达式A: (? = B) 正面看后面(?<=) 在表达式B中找到表达式A 之前: (? < = B)

另一种选择

如果您的正则表达式引擎不支持头视和后视,那么您可以使用正则表达式\[(.*?)\]来捕获组中括号的内部结构,然后您可以根据需要操作组。

这个正则表达式是如何工作的?

括号捕获组中的字符。. * ?以非贪婪的方式获取括号之间的所有字符(行结束符除外,除非启用了s标志)。

其他回答

你可以全局使用以下正则表达式:

\[(.*?)\]

解释:

\[:[是一个元字符,如果你想字面上匹配它,就需要转义。 (.*?):以非贪婪的方式匹配所有内容并捕获它。 \]:]是一个元字符,如果你想字面上匹配它,就需要转义。

在R中,试试:

x <- 'foo[bar]baz'
str_replace(x, ".*?\\[(.*?)\\].*", "\\1")
[1] "bar"
([[][a-z \s]+[]])

根据以下解释,上述方法应该有效

方括号[]内的字符定义了字符类,这意味着模式应该匹配方括号内提到的至少一个字符 \s指定一个空格 +表示前面提到的至少一个字符为+。

(?<=\[).+?(?=\])

将捕获没有括号的内容

(?<=\[) -[的正向回溯 . * ?-非贪婪匹配的内容 (?=\]) -正向预测]

编辑:对于嵌套括号,下面的正则表达式应该工作:

(\[(?:\[??[^\[]*?\]))

以防万一,你可能有不平衡的括号,你可能会设计一些递归的表达式,

\[(([^\]\[]+)|(?R))*+\]

当然,这与你可能使用的语言或RegEx引擎有关。

RegEx演示1


除此之外,

\[([^\]\[\r\n]*)\]

RegEx演示2

or,

(?<=\[)[^\]\[\r\n]*(?=\])

RegEx演示3

都是很好的选择。


如果您希望简化/修改/探索表达式,regex101.com的右上方面板中有解释。如果你愿意,你也可以在这个链接中观看,它是如何与一些样本输入匹配的。


RegEx电路

jex。Im可视化正则表达式:

Test

const regex = /\[([^\]\[\r\n]*)\]/gm; const str = `This is a [sample] string with [some] special words. [another one] This is a [sample string with [some special words. [another one This is a [sample[sample]] string with [[some][some]] special words. [[another one]]`; let m; while ((m = regex.exec(str)) !== null) { // This is necessary to avoid infinite loops with zero-width matches if (m.index === regex.lastIndex) { regex.lastIndex++; } // The result can be accessed through the `m`-variable. m.forEach((match, groupIndex) => { console.log(`Found match, group ${groupIndex}: ${match}`); }); }

匹配平衡括号的正则表达式