为什么正则表达式如此有争议?

在探索正则表达式(也称为正则表达式)时，有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。

另一方面，也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法，并仅仅为了它而接受额外的编码，即使正则表达式将是一个更紧凑的解决方案。

为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?

当前回答

虽然我认为正则表达式是一个必要的工具，但关于它们最烦人的事情是有不同的实现。语法、修饰语，尤其是“贪婪”的细微差异会让事情变得非常混乱，需要反复试验，有时还会产生令人困惑的错误。

其他回答

几乎我认识的每个经常使用正则表达式的人(双关语)都有unix背景，他们使用的工具将正则视为一级编程结构，比如grep、sed、awk和Perl。由于使用正则表达式几乎没有语法开销，因此它们的效率会大大提高。

相比之下，使用正则作为外部库的语言的程序员往往不会考虑正则表达式可以带来什么。程序员的“时间成本”是如此之高，以至于a) REs从未出现在他们的培训中，b)他们不会从REs的角度“思考”，而是更喜欢使用更熟悉的模式。

问题是正则表达式潜在地非常强大，以至于可以使用它们做一些应该使用不同的东西来做的事情。

一个好的程序员应该知道在什么地方使用它们，在什么地方不使用。典型的例子是解析非常规语言(请参阅确定一种语言是否为常规语言)。

我认为如果一开始就限制自己使用真正的正则表达式(没有扩展)，就不会出错。一些扩展可以使您的工作更简单一些，但是如果您发现一些很难用真正的正则表达式来表达的东西，这很可能表明正则表达式不是正确的工具。

“正则表达式:现在你有两个问题”是Jeff Atwood关于这个问题的一篇很棒的文章。基本上，正则表达式是“难”的!他们会制造新的问题。然而，它们是有效的。

我不认为人们反对正则表达式是因为它们很慢，而是因为它们很难读和写，而且很难正确。虽然在某些情况下，正则表达式为问题提供了一种有效的、紧凑的解决方案，但有时它们会被硬塞到使用易于阅读、可维护的代码部分更好的情况中。

在某些情况下，我认为你必须使用它们。例如构建lexer。

在我看来，这是会写regexp的人和不会(或几乎不会)写regexp的人的观点。我个人认为这是一个很好的想法，例如，有效的表单输入，它在javascript警告用户，或在服务器端语言。

推荐文章