为什么正则表达式如此有争议?

在探索正则表达式(也称为正则表达式)时，有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。

另一方面，也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法，并仅仅为了它而接受额外的编码，即使正则表达式将是一个更紧凑的解决方案。

为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?

当前回答

人们倾向于认为正则表达式很难;但那是因为他们用错了。在没有任何注释、缩进或命名捕获的情况下编写复杂的一行程序。(你不会把复杂的SQL表达式塞进一行，没有注释、缩进或别名，对吧?)所以，是的，对很多人来说，它们没有意义。

然而，如果你的工作与文本解析有关(基本上所有的web应用程序都是如此)，而你不懂正则表达式，那你的工作就糟透了，你在浪费自己和雇主的时间。有很好的资源可以教你关于他们的一切，你需要知道的，甚至更多。

其他回答

你可能会问为什么goto会有争议。

基本上，当你拥有这么多“显而易见”的权力时，人们倾向于在它们不是最佳选择的情况下滥用它们。例如，要求用正则表达式解析csv或XML或HTML的人的数量让我感到震惊。这不是做这项工作的合适工具。但是一些用户还是坚持使用正则表达式。

就我个人而言，我试图找到一个中庸之道——在正则表达式擅长的地方使用它们，在它们不是最优的时候避免使用它们。

请注意，正则表达式仍然可以用于解析csv、XML、HTML等。但通常不是在一个正则表达式中。

虽然我认为正则表达式是一个必要的工具，但关于它们最烦人的事情是有不同的实现。语法、修饰语，尤其是“贪婪”的细微差异会让事情变得非常混乱，需要反复试验，有时还会产生令人困惑的错误。

我觉得"有争议"这个词不太合适。

但我见过无数的例子，人们会问“我需要什么正则表达式来做这样那样的字符串操作?”这是X-Y问题。

换句话说，他们从假设regex是他们需要的开始，但是他们最好使用split()，一个像perl的tr///那样的转换，其中字符被一个替换为另一个，或者只是一个index()。

正则表达式对包括我自己在内的很多人来说都是一个严重的谜。这很有效，但就像看数学方程一样。我很高兴地告诉大家，有人终于在http://regexlib.com/上创建了各种正则表达式函数的统一位置。现在，如果微软只创建一个正则表达式类，它将自动完成许多常见的事情，如消除字母或过滤日期。

regex是一个很棒的工具，但是人们认为“嘿，多么棒的工具，我要用它来做X!”而X是另一个工具更适合做的事情(通常是解析器)。这是标准的使用锤子，你需要一个螺丝刀的问题。

推荐文章