为什么正则表达式如此有争议?

在探索正则表达式(也称为正则表达式)时，有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。

另一方面，也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法，并仅仅为了它而接受额外的编码，即使正则表达式将是一个更紧凑的解决方案。

为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?

当前回答

问题是正则表达式潜在地非常强大，以至于可以使用它们做一些应该使用不同的东西来做的事情。

一个好的程序员应该知道在什么地方使用它们，在什么地方不使用。典型的例子是解析非常规语言(请参阅确定一种语言是否为常规语言)。

我认为如果一开始就限制自己使用真正的正则表达式(没有扩展)，就不会出错。一些扩展可以使您的工作更简单一些，但是如果您发现一些很难用真正的正则表达式来表达的东西，这很可能表明正则表达式不是正确的工具。

其他回答

因为它们缺少普遍接受的ide中最流行的学习工具:没有Regex Wizard。甚至连自动补全都不行。你必须自己编写整个程序。

虽然我认为正则表达式是一个必要的工具，但关于它们最烦人的事情是有不同的实现。语法、修饰语，尤其是“贪婪”的细微差异会让事情变得非常混乱，需要反复试验，有时还会产生令人困惑的错误。

我认为学习正则表达式和保持正则表达式不受欢迎，大多数开发人员都很懒，或者他们中的大多数人都依赖于外部库来为他们做解析……他们依赖谷歌来获得答案，甚至在论坛上询问他们问题的完整代码。但当涉及到实现或修改/维护正则表达式时，它们就会失败。

有一个流行的说法是“朋友不让朋友使用Regex来解析HTML”

但就我而言，我已经使用Regex制作了完整的HTML解析器，我发现我自己，Regex在解析HTML字符串方面更好，无论是速度方面还是内存方面(如果你有一个想法，你要实现什么:))

人们倾向于认为正则表达式很难;但那是因为他们用错了。在没有任何注释、缩进或命名捕获的情况下编写复杂的一行程序。(你不会把复杂的SQL表达式塞进一行，没有注释、缩进或别名，对吧?)所以，是的，对很多人来说，它们没有意义。

然而，如果你的工作与文本解析有关(基本上所有的web应用程序都是如此)，而你不懂正则表达式，那你的工作就糟透了，你在浪费自己和雇主的时间。有很好的资源可以教你关于他们的一切，你需要知道的，甚至更多。

在lex和yacc中用于编译器定义的正则表达式系统是很好的、非常有用和干净的。在这些系统中，表达式类型是根据其他表达式类型定义的。在perl和sed代码(等等)中常见的丑陋的畸形的不可读的行噪声巨型一行正则表达式是“有争议的”(垃圾)。

推荐文章