我想使用正则表达式匹配字符串的一部分,然后访问带括号的子字符串:

var myString=“something format_abc”;//我要“abc”var arr=/(?:^|\s)format_(.*?)(?:\s|$)/.exec(myString);控制台日志(arr);//打印:[“format_abc”,“abc”]。。到现在为止,一直都还不错。控制台日志(arr[1]);//打印:未定义(???)控制台日志(arr[0]);//打印:format_undefined(!!!)

我做错了什么?


我发现上面的正则表达式代码没有任何问题:我测试的实际字符串是这样的:

"date format_%A"

报告“%A”未定义似乎是一种非常奇怪的行为,但它与这个问题没有直接关系,所以我打开了一个新的问题,为什么匹配的子字符串在JavaScript中返回“undefined”?。


问题是console.log像printf语句一样接受其参数,因为我记录的字符串(“%a”)有一个特殊值,所以它试图查找下一个参数的值。


当前回答

使用代码:

console.log(arr[1]);  // prints: abc
console.log(arr[0]);  // prints:  format_abc

编辑:Safari 3,如果重要的话。

其他回答

我们可以通过使用反斜杠后跟匹配组的编号来访问正则表达式中的匹配组:

/([a-z])\1/

在由第一组([a-z])匹配的代码\ 1中

使用es2018,您现在可以对命名组使用String.match(),使正则表达式更明确地说明它要做什么。

const url =
  'https://stackoverflow.com/questions/432493/how-do-you-access-the-matched-groups-in-a-javascript-regular-expression?some=parameter';
const regex = /(?<protocol>https?):\/\/(?<hostname>[\w-\.]*)\/(?<pathname>[\w-\./]+)\??(?<querystring>.*?)?$/;
const { groups: segments } = url.match(regex);
console.log(segments);

你会得到类似的东西

{protocol:“https”,主机名:“stackerflow.com”,路径名:“questions/432493/how-do-you-acess-the-matched-groups-in-a-javascript-regular-expression”,querystring:“some=parameter”}

更新:2019-09-10

旧的迭代多个匹配的方法不是很直观。这导致了String.prototype.matchAll方法的提出。这种新方法在ECMAScript 2020规范中。它为我们提供了一个干净的API并解决了多个问题。自从Chrome 73+/Node 12+和Firefox 67+之后,它就出现在主流浏览器和JS引擎中。

该方法返回迭代器,用法如下:

const string=“something format_abc”;常量regexp=/(?:^|\s)format_(.*?)(?:\s|$)/g;const matches=string.matchAll(正则表达式);for(匹配的常量匹配){console.log(匹配);console.log(match.index)}

当它返回迭代器时,我们可以说它是懒惰的,这在处理大量捕获组或非常大的字符串时非常有用。但如果需要,可以使用扩展语法或Array.from方法将结果轻松转换为数组:

function getFirstGroup(regexp, str) {
  const array = [...str.matchAll(regexp)];
  return array.map(m => m[1]);
}

// or:
function getFirstGroup(regexp, str) {
  return Array.from(str.matchAll(regexp), m => m[1]);
}

与此同时,虽然这一提议得到了更广泛的支持,但您可以使用官方垫片包。

此外,该方法的内部工作也很简单。使用生成器函数的等效实现如下:

function* matchAll(str, regexp) {
  const flags = regexp.global ? regexp.flags : regexp.flags + "g";
  const re = new RegExp(regexp, flags);
  let match;
  while (match = re.exec(str)) {
    yield match;
  }
}

将创建原始regexp的副本;这是为了避免在进行多重匹配时由于lastIndex属性的突变而产生的副作用。

此外,我们需要确保正则表达式具有全局标志,以避免无限循环。

我也很高兴看到,在提案的讨论中甚至提到了这个StackOverflow问题。

原始答案

您可以这样访问捕获组:

var myString=“something format_abc”;var myRegexp=/(?:^|\s)format_(.*?)(?:\s|$)/g;var myRegexp=新RegExp(“(?:^|\s)format_(.*?)(?:\s|$)”,“g”);var matches=myRegexp.exec(myString);console.log(匹配[1]);//abc

如果有多个匹配项,您可以对它们进行迭代:

var myString=“something format_abc”;var myRegexp=新RegExp(“(?:^|\s)format_(.*?)(?:\s|$)”,“g”);match=myRegexp.exec(myString);while(匹配!=null){//匹配的文本:匹配[0]//匹配开始:match.index//捕获组n:匹配[n]console.log(匹配[0])match=myRegexp.exec(myString);}

只需使用RegExp$第1…$n组如:

1.匹配第一组RegExp$1.

匹配第二组RegExp$2.

如果在正则表达式中使用3组(请注意在string.match(正则表达式)之后使用)

注册Exp$1 RegExp$2 RegExp$3.

var str=“${印度}的雨很安全”;var res=str.match(/\${(.*?)\}/ig);//我在上面的例子中只使用了一个组,所以RegExp$1.console.log(RegExp.$1)

//最简单的方法是使用RegExp$1正则表达式中的第一组和第二组//注册Exp$如果存在,则在匹配后使用2var正则表达式=/\${(.*?)\}/ig;var str=“${SPAIN}的雨水主要停留在平原”;var res=str.match(正则表达式);for(res的常量匹配){var res=match.match(正则表达式);console.log(匹配);console.log(RegExp.$1)}

字符串#matchAll(参见阶段3草案/2018年12月7日提案),简化了对匹配对象中所有组的访问(请记住,组0是整个匹配,而其他组对应于模式中的捕获组):

如果matchAll可用,则可以避免while循环并使用/g执行。。。相反,通过使用matchAll,您可以返回一个迭代器,您可以更方便地使用它。。。of、array spread或array.from()构造

此方法产生的输出类似于C#中的Regex.Matches,Python中的re.finditer,PHP中的preg_match_all。

查看JS演示(在Google Chrome 73.0.3683.67(官方版本),测试版(64位)中测试):

var myString=“key1:value1,key2-value2!!@key3=value3”;var matches=myString.matchAll(/(\w+)[:=-](\w*)/g);console.log([…matches]);//所有匹配捕获组值

console.log([…matches])显示

您还可以使用

let matchData=“key1:value1,key2-value2!!@key3=value3”.matchAll(/(\w+)[:=-](\w+)/g)var matches=[…matchData];//注意matchAll结果不可重复console.log(Array.from(matches,m=>m[0]));//所有匹配(组0)值//=>[“key1:value1”,“key2-value2”,“key 3=value3”]console.log(Array.from(matches,m=>m[1]));//所有匹配(组1)值//=>[“key1”,“key2”,“key 3”]

注意:请参阅浏览器兼容性详细信息。