在探索正则表达式(也称为正则表达式)时,有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。
另一方面,也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法,并仅仅为了它而接受额外的编码,即使正则表达式将是一个更紧凑的解决方案。
为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?
在探索正则表达式(也称为正则表达式)时,有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。
另一方面,也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法,并仅仅为了它而接受额外的编码,即使正则表达式将是一个更紧凑的解决方案。
为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?
当前回答
regex的最佳有效和正常用法是用于电子邮件地址格式验证。
这是一个很好的应用。
我曾经无数次在TextPad中一次性使用正则表达式来编辑平面文件、创建csv文件、创建SQL插入语句等等。
写得好的正则表达式不应该太慢。通常替代选项,比如大量的Replace调用,都是非常慢的选项。还不如一口气搞定。
许多情况只需要正则表达式,而不需要其他任何东西。
用无害字符替换特殊的非打印字符是另一种很好的用法。
我当然可以想象,有一些代码库过度使用正则表达式,从而损害了可维护性。我自己从来没见过。实际上,我因为没有充分使用正则表达式而被代码评审员避而远之。
其他回答
regex的最佳有效和正常用法是用于电子邮件地址格式验证。
这是一个很好的应用。
我曾经无数次在TextPad中一次性使用正则表达式来编辑平面文件、创建csv文件、创建SQL插入语句等等。
写得好的正则表达式不应该太慢。通常替代选项,比如大量的Replace调用,都是非常慢的选项。还不如一口气搞定。
许多情况只需要正则表达式,而不需要其他任何东西。
用无害字符替换特殊的非打印字符是另一种很好的用法。
我当然可以想象,有一些代码库过度使用正则表达式,从而损害了可维护性。我自己从来没见过。实际上,我因为没有充分使用正则表达式而被代码评审员避而远之。
在某些情况下,我认为你必须使用它们。例如构建lexer。
在我看来,这是会写regexp的人和不会(或几乎不会)写regexp的人的观点。 我个人认为这是一个很好的想法,例如,有效的表单输入,它在javascript警告用户,或在服务器端语言。
“正则表达式:现在你有两个问题”是Jeff Atwood关于这个问题的一篇很棒的文章。基本上,正则表达式是“难”的!他们会制造新的问题。然而,它们是有效的。
regex是一个很棒的工具,但是人们认为“嘿,多么棒的工具,我要用它来做X!”而X是另一个工具更适合做的事情(通常是解析器)。这是标准的使用锤子,你需要一个螺丝刀的问题。
正则表达式对包括我自己在内的很多人来说都是一个严重的谜。这很有效,但就像看数学方程一样。我很高兴地告诉大家,有人终于在http://regexlib.com/上创建了各种正则表达式函数的统一位置。现在,如果微软只创建一个正则表达式类,它将自动完成许多常见的事情,如消除字母或过滤日期。