为什么正则表达式如此有争议?

在探索正则表达式(也称为正则表达式)时，有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。

另一方面，也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法，并仅仅为了它而接受额外的编码，即使正则表达式将是一个更紧凑的解决方案。

为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?

当前回答

这是一个有趣的话题。许多regexp爱好者似乎混淆了公式的简洁性和效率。最重要的是，一个需要大量思考的regexp会给它的作者带来巨大的满足感，使它立即变得合法。

但是…当性能不是问题，并且需要快速处理文本输出时(例如在Perl中)，regexp非常方便。此外，虽然性能是一个问题，但人们可能不愿意尝试使用可能有bug或效率较低的自制算法来击败regexp库。

此外，还有许多原因导致regexp受到不公平的批评

regexp效率不高，因为构建顶部的regexp并不明显有些程序员“忘记”只编译一次要多次使用的regexp(就像Java中的静态模式) 有些程序员采用试错策略——regexp的效果更差!

其他回答

人们倾向于认为正则表达式很难;但那是因为他们用错了。在没有任何注释、缩进或命名捕获的情况下编写复杂的一行程序。(你不会把复杂的SQL表达式塞进一行，没有注释、缩进或别名，对吧?)所以，是的，对很多人来说，它们没有意义。

然而，如果你的工作与文本解析有关(基本上所有的web应用程序都是如此)，而你不懂正则表达式，那你的工作就糟透了，你在浪费自己和雇主的时间。有很好的资源可以教你关于他们的一切，你需要知道的，甚至更多。

regex是一个很棒的工具，但是人们认为“嘿，多么棒的工具，我要用它来做X!”而X是另一个工具更适合做的事情(通常是解析器)。这是标准的使用锤子，你需要一个螺丝刀的问题。

因为它们缺少普遍接受的ide中最流行的学习工具:没有Regex Wizard。甚至连自动补全都不行。你必须自己编写整个程序。

你可能会问为什么goto会有争议。

基本上，当你拥有这么多“显而易见”的权力时，人们倾向于在它们不是最佳选择的情况下滥用它们。例如，要求用正则表达式解析csv或XML或HTML的人的数量让我感到震惊。这不是做这项工作的合适工具。但是一些用户还是坚持使用正则表达式。

就我个人而言，我试图找到一个中庸之道——在正则表达式擅长的地方使用它们，在它们不是最优的时候避免使用它们。

请注意，正则表达式仍然可以用于解析csv、XML、HTML等。但通常不是在一个正则表达式中。

我认为这是程序员中鲜为人知的技术。因此，它并没有被广泛接受。如果你有一个非技术经理来审查你的代码或工作，那么正则表达式是非常糟糕的。你会花几个小时写一个完美的正则表达式，而你会认为他/她写了这么少的代码，你会为这个模块得到很少的分数。此外，正如在其他地方所说，读取正则表达式是非常困难的任务。

推荐文章