为什么正则表达式如此有争议?

在探索正则表达式(也称为正则表达式)时，有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。

另一方面，也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法，并仅仅为了它而接受额外的编码，即使正则表达式将是一个更紧凑的解决方案。

为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?

当前回答

我不认为他们有那么大的争议。

我也认为你已经回答了你自己的问题，因为你指出到处使用它们(不是所有的语言都是常规语言2)或根本避免使用它们是多么愚蠢。作为程序员，您必须做出一个明智的决定，即正则表达式何时有助于代码，何时有害于代码。当面临这样的决定时，要记住两件重要的事情:可维护性(这意味着可读性)和可扩展性。

对于那些特别讨厌它们的人，我猜他们从来没有学会正确使用它们。我认为大多数人只要花上几个小时学习一些不错的教程，就能很快掌握并熟练使用这些语言。以下是我的建议:

http://docs.python.org/howto/regex

尽管该页讨论的是Python上下文中的正则表达式，但我发现这些信息在其他地方也非常适用。有一些东西是python特有的，但我相信它们被清楚地指出来了，而且很容易记住。

其他回答

我不认为他们有那么大的争议。

http://docs.python.org/howto/regex

几乎我认识的每个经常使用正则表达式的人(双关语)都有unix背景，他们使用的工具将正则视为一级编程结构，比如grep、sed、awk和Perl。由于使用正则表达式几乎没有语法开销，因此它们的效率会大大提高。

相比之下，使用正则作为外部库的语言的程序员往往不会考虑正则表达式可以带来什么。程序员的“时间成本”是如此之高，以至于a) REs从未出现在他们的培训中，b)他们不会从REs的角度“思考”，而是更喜欢使用更熟悉的模式。

因为它们缺少普遍接受的ide中最流行的学习工具:没有Regex Wizard。甚至连自动补全都不行。你必须自己编写整个程序。

regex是一个很棒的工具，但是人们认为“嘿，多么棒的工具，我要用它来做X!”而X是另一个工具更适合做的事情(通常是解析器)。这是标准的使用锤子，你需要一个螺丝刀的问题。

我不认为人们反对正则表达式是因为它们很慢，而是因为它们很难读和写，而且很难正确。虽然在某些情况下，正则表达式为问题提供了一种有效的、紧凑的解决方案，但有时它们会被硬塞到使用易于阅读、可维护的代码部分更好的情况中。

推荐文章