是否存在用于检测有效正则表达式的正则表达式?

是否可以用另一个正则表达式检测一个有效的正则表达式?如果是这样，请给出下面的示例代码。

当前回答

/
^                                             # start of string
(                                             # first group start
  (?:
    (?:[^?+*{}()[\]\\|]+                      # literals and ^, $
     | \\.                                    # escaped characters
     | \[ (?: \^?\\. | \^[^\\] | [^\\^] )     # character classes
          (?: [^\]\\]+ | \\. )* \]
     | \( (?:\?[:=!]|\?<[=!]|\?>)? (?1)?? \)  # parenthesis, with recursive content
     | \(\? (?:R|[+-]?\d+) \)                 # recursive matching
     )
    (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )?   # quantifiers
  | \|                                        # alternative
  )*                                          # repeat content
)                                             # end first group
$                                             # end of string
/

这是一个递归正则表达式，许多正则表达式引擎都不支持。基于PCRE的程序应该支持它。

没有空格和注释:

/^((?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)?(?1)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*)$/

. net不直接支持递归。(?1)和(?R)结构。)递归必须转换为计算平衡的组:

^                                         # start of string
(?:
  (?: [^?+*{}()[\]\\|]+                   # literals and ^, $
   | \\.                                  # escaped characters
   | \[ (?: \^?\\. | \^[^\\] | [^\\^] )   # character classes
        (?: [^\]\\]+ | \\. )* \]
   | \( (?:\?[:=!]
         | \?<[=!]
         | \?>
         | \?<[^\W\d]\w*>
         | \?'[^\W\d]\w*'
         )?                               # opening of group
     (?<N>)                               #   increment counter
   | \)                                   # closing of group
     (?<-N>)                              #   decrement counter
   )
  (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )? # quantifiers
| \|                                      # alternative
)*                                        # repeat content
$                                         # end of string
(?(N)(?!))                                # fail if counter is non-zero.

压实:

^(?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>|\?<[^\W\d]\w*>|\?'[^\W\d]\w*')?(?<N>)|\)(?<-N>))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*$(?(N)(?!))

评论如下:

这将验证替换和转换吗?

它将只验证替换和转换的正则表达式部分。s / < >这一部分/…/

理论上不可能将所有有效的正则表达式语法与一个正则表达式匹配。

如果正则表达式引擎支持递归，比如PCRE，这是可能的，但它不能再被真正地称为正则表达式了。

实际上，“递归正则表达式”不是正则表达式。但这是一个经常被接受的正则表达式引擎的扩展…具有讽刺意味的是，这个扩展的正则表达式并不匹配扩展的正则表达式。

“在理论上，理论和实践是一样的。但实际上并非如此。”几乎所有了解正则表达式的人都知道正则表达式不支持递归。但是PCRE和大多数其他实现支持的不仅仅是基本的正则表达式。

在grep命令中使用这个shell脚本，它向我显示了一些错误。grep:{}的无效内容。我正在制作一个脚本，可以grep代码库找到所有包含正则表达式的文件

这个模式利用了一个名为递归正则表达式的扩展。正则表达式的POSIX风格不支持这一点。您可以尝试使用-P开关来启用PCRE正则表达式风格。

Regex本身“不是正则语言，因此不能用正则表达式来解析……”

这对于经典正则表达式是正确的。一些现代实现允许递归，这使得它成为一种上下文自由语言，尽管对于这个任务来说有点冗长。

我看到你匹配[]()/\。和其他特殊的正则表达式字符。哪里允许非特殊字符?它似乎可以匹配^(?:[\.]+)$，但不能匹配^abcdefg$。这是一个有效的正则表达式。

[^?+*{}()[\]\\|]将匹配任何单个字符，而不是任何其他结构的一部分。这包括文字(a - z)和某些特殊字符(^，$，.)。

2008-10-05 17:15:56

其他回答

/
^                                             # start of string
(                                             # first group start
  (?:
    (?:[^?+*{}()[\]\\|]+                      # literals and ^, $
     | \\.                                    # escaped characters
     | \[ (?: \^?\\. | \^[^\\] | [^\\^] )     # character classes
          (?: [^\]\\]+ | \\. )* \]
     | \( (?:\?[:=!]|\?<[=!]|\?>)? (?1)?? \)  # parenthesis, with recursive content
     | \(\? (?:R|[+-]?\d+) \)                 # recursive matching
     )
    (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )?   # quantifiers
  | \|                                        # alternative
  )*                                          # repeat content
)                                             # end first group
$                                             # end of string
/

这是一个递归正则表达式，许多正则表达式引擎都不支持。基于PCRE的程序应该支持它。

没有空格和注释:

/^((?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)?(?1)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*)$/

. net不直接支持递归。(?1)和(?R)结构。)递归必须转换为计算平衡的组:

^                                         # start of string
(?:
  (?: [^?+*{}()[\]\\|]+                   # literals and ^, $
   | \\.                                  # escaped characters
   | \[ (?: \^?\\. | \^[^\\] | [^\\^] )   # character classes
        (?: [^\]\\]+ | \\. )* \]
   | \( (?:\?[:=!]
         | \?<[=!]
         | \?>
         | \?<[^\W\d]\w*>
         | \?'[^\W\d]\w*'
         )?                               # opening of group
     (?<N>)                               #   increment counter
   | \)                                   # closing of group
     (?<-N>)                              #   decrement counter
   )
  (?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )? # quantifiers
| \|                                      # alternative
)*                                        # repeat content
$                                         # end of string
(?(N)(?!))                                # fail if counter is non-zero.

压实:

^(?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>|\?<[^\W\d]\w*>|\?'[^\W\d]\w*')?(?<N>)|\)(?<-N>))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*$(?(N)(?!))

评论如下:

这将验证替换和转换吗?

它将只验证替换和转换的正则表达式部分。s / < >这一部分/…/

理论上不可能将所有有效的正则表达式语法与一个正则表达式匹配。

如果正则表达式引擎支持递归，比如PCRE，这是可能的，但它不能再被真正地称为正则表达式了。

在grep命令中使用这个shell脚本，它向我显示了一些错误。grep:{}的无效内容。我正在制作一个脚本，可以grep代码库找到所有包含正则表达式的文件

这个模式利用了一个名为递归正则表达式的扩展。正则表达式的POSIX风格不支持这一点。您可以尝试使用-P开关来启用PCRE正则表达式风格。

Regex本身“不是正则语言，因此不能用正则表达式来解析……”

这对于经典正则表达式是正确的。一些现代实现允许递归，这使得它成为一种上下文自由语言，尽管对于这个任务来说有点冗长。

我看到你匹配[]()/\。和其他特殊的正则表达式字符。哪里允许非特殊字符?它似乎可以匹配^(?:[\.]+)$，但不能匹配^abcdefg$。这是一个有效的正则表达式。

[^?+*{}()[\]\\|]将匹配任何单个字符，而不是任何其他结构的一部分。这包括文字(a - z)和某些特殊字符(^，$，.)。

2008-10-05 17:15:56

好问题。

真正的规则语言不能任意地决定嵌套良好的圆括号。如果你的字母表中包含'('和')'，目标是判断这些字符串是否有格式良好的匹配圆括号。因为这是正则表达式的必要要求，所以答案是否定的。

但是，如果您放宽要求并添加递归，您可能就可以做到这一点。原因是递归可以作为一个堆栈，让您通过推入这个堆栈来“计算”当前嵌套深度。

Russ Cox写了“正则表达式匹配可以简单而快速”，这是一篇关于正则表达式引擎实现的精彩论文。

2008-10-05 17:38:50

不，如果你使用标准正则表达式。

原因是您不能满足常规语言的抽运引理。抽吸引理指出，属于语言“L”的字符串是正则的，如果存在一个数字“N”，使得将字符串分为三个子字符串x, y, z，使得|x|>=1 && |xy|<=N，你可以重复y多次，而整个字符串仍然属于L。

抽运引理的一个结果是，你不能有A ^Nb^Mc^N这样的正则字符串，也就是说，两个相同长度的子字符串被另一个字符串隔开。无论你以何种方式将这些字符串分割成x、y和z，你都不能在不获得“a”和“c”数量不同的字符串的情况下“抽取”y，从而保留原始语言。例如，正则表达式中的圆括号就是这种情况。

2019-04-08 14:27:33

有了这个版本，你可以用php检查一个字符串的regex -我从上面的例子，并修改了一点:

$re = '/((?:(?:[^?+*{}()[\]\\\\|]+|\\\\.|\[(?:\^?\\\\.|\^[^\\\\]|[^\\\\^])(?:[^\]\\\\]+|\\\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d*(?:,\d*)?\})[?+]?)?|\|)*)/';
$str = '[0-9]{1,}[a-z]';

preg_match($re, $str, $matches, PREG_OFFSET_CAPTURE, 0);

$length = strlen($str);
$length2 = strlen($matches[0][0]);

if($length == $length2) {

   echo "is regex";

} else {

   echo "is no regex";

}

2023-01-31 20:02:00

你可以将regex提交给preg_match，如果regex无效，preg_match将返回false。不要忘记使用@来抑制错误消息:

@preg_match($regexToTest, '');

如果正则表达式为//，则返回1。如果正则表达式没问题，将返回0。否则将返回false。

2011-08-28 18:09:37

是否存在用于检测有效正则表达式的正则表达式?

推荐文章

最新文章

标签