是否可以用另一个正则表达式检测一个有效的正则表达式?如果是这样,请给出下面的示例代码。
当前回答
不,如果你严格地说正则表达式,而不包括一些实际上是上下文无关语法的正则表达式实现。
正则表达式有一个限制,即不可能编写匹配所有且仅匹配正则表达式的正则表达式。不能匹配已配对的括号等实现。正则表达式使用许多这样的结构,让我们以[]为例。只要有[就必须有匹配],这对于正则表达式"\[.*\]"来说很简单。
正则表达式不可能实现的原因是它们可以被嵌套。如何编写匹配嵌套括号的正则表达式?答案是没有一个无限长的正则表达式就不能。你可以通过蛮力匹配任意数量的嵌套括号,但你永远不能匹配任意长的嵌套括号集。
此功能通常称为计数,因为您正在计数嵌套的深度。正则表达式根据定义不具备计数的能力。
最后我写了一篇关于正则表达式限制的文章。
其他回答
/
^ # start of string
( # first group start
(?:
(?:[^?+*{}()[\]\\|]+ # literals and ^, $
| \\. # escaped characters
| \[ (?: \^?\\. | \^[^\\] | [^\\^] ) # character classes
(?: [^\]\\]+ | \\. )* \]
| \( (?:\?[:=!]|\?<[=!]|\?>)? (?1)?? \) # parenthesis, with recursive content
| \(\? (?:R|[+-]?\d+) \) # recursive matching
)
(?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )? # quantifiers
| \| # alternative
)* # repeat content
) # end first group
$ # end of string
/
这是一个递归正则表达式,许多正则表达式引擎都不支持。基于PCRE的程序应该支持它。
没有空格和注释:
/^((?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)?(?1)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*)$/
. net不直接支持递归。(?1)和(?R)结构。)递归必须转换为计算平衡的组:
^ # start of string
(?:
(?: [^?+*{}()[\]\\|]+ # literals and ^, $
| \\. # escaped characters
| \[ (?: \^?\\. | \^[^\\] | [^\\^] ) # character classes
(?: [^\]\\]+ | \\. )* \]
| \( (?:\?[:=!]
| \?<[=!]
| \?>
| \?<[^\W\d]\w*>
| \?'[^\W\d]\w*'
)? # opening of group
(?<N>) # increment counter
| \) # closing of group
(?<-N>) # decrement counter
)
(?: (?:[?+*]|\{\d+(?:,\d*)?\}) [?+]? )? # quantifiers
| \| # alternative
)* # repeat content
$ # end of string
(?(N)(?!)) # fail if counter is non-zero.
压实:
^(?:(?:[^?+*{}()[\]\\|]+|\\.|\[(?:\^?\\.|\^[^\\]|[^\\^])(?:[^\]\\]+|\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>|\?<[^\W\d]\w*>|\?'[^\W\d]\w*')?(?<N>)|\)(?<-N>))(?:(?:[?+*]|\{\d+(?:,\d*)?\})[?+]?)?|\|)*$(?(N)(?!))
评论如下:
这将验证替换和转换吗?
它将只验证替换和转换的正则表达式部分。s / < >这一部分/…/
理论上不可能将所有有效的正则表达式语法与一个正则表达式匹配。
如果正则表达式引擎支持递归,比如PCRE,这是可能的,但它不能再被真正地称为正则表达式了。
实际上,“递归正则表达式”不是正则表达式。但这是一个经常被接受的正则表达式引擎的扩展…具有讽刺意味的是,这个扩展的正则表达式并不匹配扩展的正则表达式。
“在理论上,理论和实践是一样的。但实际上并非如此。”几乎所有了解正则表达式的人都知道正则表达式不支持递归。但是PCRE和大多数其他实现支持的不仅仅是基本的正则表达式。
在grep命令中使用这个shell脚本,它向我显示了一些错误。grep:{}的无效内容。我正在制作一个脚本,可以grep代码库找到所有包含正则表达式的文件
这个模式利用了一个名为递归正则表达式的扩展。正则表达式的POSIX风格不支持这一点。您可以尝试使用-P开关来启用PCRE正则表达式风格。
Regex本身“不是正则语言,因此不能用正则表达式来解析……”
这对于经典正则表达式是正确的。一些现代实现允许递归,这使得它成为一种上下文自由语言,尽管对于这个任务来说有点冗长。
我看到你匹配[]()/\。和其他特殊的正则表达式字符。哪里允许非特殊字符?它似乎可以匹配^(?:[\.]+)$,但不能匹配^abcdefg$。这是一个有效的正则表达式。
[^?+*{}()[\]\\|]将匹配任何单个字符,而不是任何其他结构的一部分。这包括文字(a - z)和某些特殊字符(^,$,.)。
你可以将regex提交给preg_match,如果regex无效,preg_match将返回false。不要忘记使用@来抑制错误消息:
@preg_match($regexToTest, '');
如果正则表达式为//,则返回1。 如果正则表达式没问题,将返回0。 否则将返回false。
不,如果你严格地说正则表达式,而不包括一些实际上是上下文无关语法的正则表达式实现。
正则表达式有一个限制,即不可能编写匹配所有且仅匹配正则表达式的正则表达式。不能匹配已配对的括号等实现。正则表达式使用许多这样的结构,让我们以[]为例。只要有[就必须有匹配],这对于正则表达式"\[.*\]"来说很简单。
正则表达式不可能实现的原因是它们可以被嵌套。如何编写匹配嵌套括号的正则表达式?答案是没有一个无限长的正则表达式就不能。你可以通过蛮力匹配任意数量的嵌套括号,但你永远不能匹配任意长的嵌套括号集。
此功能通常称为计数,因为您正在计数嵌套的深度。正则表达式根据定义不具备计数的能力。
最后我写了一篇关于正则表达式限制的文章。
好问题。
真正的规则语言不能任意地决定嵌套良好的圆括号。如果你的字母表中包含'('和')',目标是判断这些字符串是否有格式良好的匹配圆括号。因为这是正则表达式的必要要求,所以答案是否定的。
但是,如果您放宽要求并添加递归,您可能就可以做到这一点。原因是递归可以作为一个堆栈,让您通过推入这个堆栈来“计算”当前嵌套深度。
Russ Cox写了“正则表达式匹配可以简单而快速”,这是一篇关于正则表达式引擎实现的精彩论文。
有了这个版本,你可以用php检查一个字符串的regex -我从上面的例子,并修改了一点:
$re = '/((?:(?:[^?+*{}()[\]\\\\|]+|\\\\.|\[(?:\^?\\\\.|\^[^\\\\]|[^\\\\^])(?:[^\]\\\\]+|\\\\.)*\]|\((?:\?[:=!]|\?<[=!]|\?>)??\)|\(\?(?:R|[+-]?\d+)\))(?:(?:[?+*]|\{\d*(?:,\d*)?\})[?+]?)?|\|)*)/';
$str = '[0-9]{1,}[a-z]';
preg_match($re, $str, $matches, PREG_OFFSET_CAPTURE, 0);
$length = strlen($str);
$length2 = strlen($matches[0][0]);
if($length == $length2) {
echo "is regex";
} else {
echo "is no regex";
}
推荐文章
- Ruby正则表达式中\A \z和^ $的区别
- 用于匹配英国邮政编码的正则表达式
- 将所有非字母数字字符替换为空字符串
- 我如何能匹配一个字符串与正则表达式在Bash?
- 使用RegExp.exec从字符串中提取所有匹配项
- 仅用Regex替换某些组
- 使用正则表达式解析HTML:为什么不呢?
- 正则表达式来匹配不是空格的单个字符
- 在JavaScript中检查字符串包含另一个子字符串的最快方法?
- Python非贪婪正则表达式
- 正则表达式可以用来匹配嵌套模式吗?
- 在bash中使用正则表达式进行搜索和替换
- 将camelCaseText转换为标题大小写文本
- 正则表达式在Javascript中获取两个字符串之间的字符串
- Regex测试字符串是否以http://或https://开头