我想使用正则表达式匹配字符串的一部分,然后访问带括号的子字符串:

var myString=“something format_abc”;//我要“abc”var arr=/(?:^|\s)format_(.*?)(?:\s|$)/.exec(myString);控制台日志(arr);//打印:[“format_abc”,“abc”]。。到现在为止,一直都还不错。控制台日志(arr[1]);//打印:未定义(???)控制台日志(arr[0]);//打印:format_undefined(!!!)

我做错了什么?


我发现上面的正则表达式代码没有任何问题:我测试的实际字符串是这样的:

"date format_%A"

报告“%A”未定义似乎是一种非常奇怪的行为,但它与这个问题没有直接关系,所以我打开了一个新的问题,为什么匹配的子字符串在JavaScript中返回“undefined”?。


问题是console.log像printf语句一样接受其参数,因为我记录的字符串(“%a”)有一个特殊值,所以它试图查找下一个参数的值。


当前回答

正如@cms在ECMAScript(ECMA-262)中所说,您可以使用matchAll。它返回一个迭代器,并通过将其放入[…](扩展运算符)中转换为数组。(此正则表达式提取文件名的URL)

let text=`<a href=“http://myhost.com/myfile_01.mp4“>文件1</a><a href=”http://myhost.com/myfile_02.mp4“>文件2</a>`;let fileUrls=[…text.matchAll(/href=“(http://\/[^”]+\.\w{3})\”/g)].map(r=>r[1]);console.log(fileUrls);

其他回答

我们可以通过使用反斜杠后跟匹配组的编号来访问正则表达式中的匹配组:

/([a-z])\1/

在由第一组([a-z])匹配的代码\ 1中

您实际上不需要一个显式循环来解析多个匹配项-传递一个替换函数作为第二个参数,如String.protype.replace(regex,func)中所述:

var str=“我们的主要武器是{1}、{0}和{2}!”;var params=[“惊讶”、“恐惧”、“无情的效率”];var模式=/{([^}]+)}/g;str=str.replace(patt,函数(m0,m1,位置){return params[parseInt(m1)];});document.write(str);

m0参数表示完全匹配的子字符串{0}、{1}等。m1表示第一个匹配组,即正则表达式中括号内的部分,第一个匹配为0。位置是字符串中找到匹配组的起始索引,在本例中未使用。

获取所有组事件

设m=[],s=“something format_abc format_def format_ghi”;s.replace(/(?:^|\s)format_(.*?)(?:\s|$)/g,(x,y)=>m.push(y));控制台日志(m);

如果你和我一样,希望正则表达式返回这样的Object:

{
    match: '...',
    matchAtIndex: 0,
    capturedGroups: [ '...', '...' ]
}

然后从下面剪切函数

/***@param{string | number}输入*要匹配的输入字符串*@param{regex | string}表达式*正则表达式*@param{string}标志*可选标志* *@return{array}* [{匹配:“…”,matchAtIndex:0,捕获的组:[“…”,“…”]}] */函数regexMatch(输入,表达式,标志=“g”){让regex=RegExp的表达式实例?表达式:新RegExp(表达式,标志)let matches=input.matchAll(正则表达式)匹配=[…匹配]return matches.map(项=>{返回{匹配:项[0],matchAtIndex:项索引,捕获组:item.length>1?item.s切片(1):未定义}})}let input=“key1:value1,key2:value2”让正则表达式=/(\w+):(\w+)/glet matches=regexMatch(输入,regex)console.log(匹配项)

单线解决方案:

const matches = (text,regex) => [...text.matchAll(regex)].map(([match])=>match)

因此您可以使用这种方式(必须使用/g):

matches("something format_abc", /(?:^|\s)format_(.*?)(?:\s|$)/g)

结果:

[" format_abc"]