JavaScript中有RegExp.escape函数吗?

我只是想从任何可能的字符串中创建一个正则表达式。

var usersString = "Hello?!*`~World()[]";
var expression = new RegExp(RegExp.escape(usersString))
var matches = "Hello".match(expression);

有内置的方法吗?如果不是，人们用什么?Ruby有RegExp.escape。我觉得我不需要写我自己的，必须有一些标准的东西。

当前回答

另一种(更安全的)方法是使用unicode转义格式\u{code}转义所有字符(而不仅仅是我们目前知道的一些特殊字符):

function escapeRegExp(text) {
    return Array.from(text)
           .map(char => `\\u{${char.charCodeAt(0).toString(16)}}`)
           .join('');
}

console.log(escapeRegExp('a.b')); // '\u{61}\u{2e}\u{62}'

请注意，你需要传递u标志来让这个方法工作:

var expression = new RegExp(escapeRegExp(usersString), 'u');

2019-08-18 03:31:20

其他回答

其他答案中的函数对于转义整个正则表达式来说是多余的(它们对于转义正则表达式中稍后将连接到更大的regexp的部分可能有用)。

如果转义整个regexp并使用它，则引用独立的元字符(。, ?, +, *, ^, $, |, \) 或开始 ((, [, {) 是你所需要的:

String.prototype.regexEscape = function regexEscape() {
  return this.replace(/[.?+*^$|({[\\]/g, '\\$&');
};

是的，JavaScript没有这样的内置函数是令人失望的。

2014-08-02 01:06:46

过去和将来只有12个元字符需要转义被认为是字面上的

对转义字符串做什么并不重要，插入到平衡的正则表达式包装器或追加。没关系。

字符串替换使用这个吗

var escaped_string = oldstring.replace(/[\\^$.|?*+()[{]/g, '\\$&');

2019-09-18 01:40:57

另一种(更安全的)方法是使用unicode转义格式\u{code}转义所有字符(而不仅仅是我们目前知道的一些特殊字符):

function escapeRegExp(text) {
    return Array.from(text)
           .map(char => `\\u{${char.charCodeAt(0).toString(16)}}`)
           .join('');
}

console.log(escapeRegExp('a.b')); // '\u{61}\u{2e}\u{62}'

请注意，你需要传递u标志来让这个方法工作:

var expression = new RegExp(escapeRegExp(usersString), 'u');

2019-08-18 03:31:20

在https://github.com/benjamingr/RexExp.escape/上有一个RegExp.escape的ES7提议，在https://github.com/ljharb/regexp.escape上有一个polyfill可用。

2015-06-15 18:29:14

这里的大多数表达式都解决单个特定的用例。

这没关系，但我更喜欢“总是有效”的方法。

function regExpEscape(literal_string) {
    return literal_string.replace(/[-[\]{}()*+!<=:?.\/\\^$|#\s,]/g, '\\$&');
}

这将“完全转义”正则表达式中以下任何用法的字面值字符串:

插入正则表达式。例如:new RegExp(regExpEscape(str)) 在字符类中的插入。例如:new RegExp('[' + regExpEscape(str) + ']') 插入整数计数说明符。例如:new RegExp('x{1，' + regExpEscape(str) + '}') 在非javascript正则表达式引擎中执行。

涉及的特殊字符:

-: Creates a character range in a character class. [ / ]: Starts / ends a character class. { / }: Starts / ends a numeration specifier. ( / ): Starts / ends a group. * / + / ?: Specifies repetition type. .: Matches any character. \: Escapes characters, and starts entities. ^: Specifies start of matching zone, and negates matching in a character class. $: Specifies end of matching zone. |: Specifies alternation. #: Specifies comment in free spacing mode. \s: Ignored in free spacing mode. ,: Separates values in numeration specifier. /: Starts or ends expression. :: Completes special group types, and part of Perl-style character classes. !: Negates zero-width group. < / =: Part of zero-width group specifications.

注:

/在任何类型的正则表达式中都不是严格必要的。但是，如果有人(不寒而栗)执行eval("/" + pattern + "/"); ，确保如果字符串在数值说明符中是整数，它将正确地导致RegExp编译错误，而不是无声地编译错误。 #，和\s在JavaScript中不需要转义，但在许多其他风格中需要转义。它们在这里转义，以防稍后将正则表达式传递给另一个程序。

如果你还需要对JavaScript正则表达式引擎的潜在功能进行未来验证，我建议使用更偏执狂的方法:

function regExpEscapeFuture(literal_string) {
    return literal_string.replace(/[^A-Za-z0-9_]/g, '\\$&');
}

该函数转义所有字符，除了那些明确保证不会在将来的正则表达式中用于语法的字符。

对于真正热衷于卫生的人来说，考虑一下这个边缘情况:

var s = '';
new RegExp('(choice1|choice2|' + regExpEscape(s) + ')');

这在JavaScript中应该编译得很好，但在其他类型中就不行。如果打算传递给另一个flavor，则应该单独检查s === "的空大小写，如下所示:

var s = '';
new RegExp('(choice1|choice2' + (s ? '|' + regExpEscape(s) : '') + ')');

2015-06-15 17:09:01

JavaScript中有RegExp.escape函数吗?

推荐文章

最新文章

标签