为什么正则表达式如此有争议?

在探索正则表达式(也称为正则表达式)时，有许多人似乎将正则表达式视为圣杯。看起来如此复杂的东西——一定是任何问题的答案。他们倾向于认为每个问题都可以用正则表达式解决。

另一方面，也有很多人不惜一切代价试图避免正则表达式。他们试图找到一种绕过正则表达式的方法，并仅仅为了它而接受额外的编码，即使正则表达式将是一个更紧凑的解决方案。

为什么正则表达式被认为如此有争议?关于它们的工作原理是否存在广泛的误解?或者正则表达式通常比较慢是一种普遍的看法?

当前回答

我发现正则表达式有时是无价的。当我需要做一些“模糊”搜索时，可能会替换。当数据可能变化，具有一定的随机性时。然而，当我需要做一个简单的搜索和替换，或检查字符串，我不使用正则表达式。尽管我知道很多人这样做，但他们什么都用它。这就是争议所在。

如果你想在墙上钉钉子，不要用锤子。是的，它会起作用，但等你拿到锤子，我可以在墙上钉20个钉子。

正则表达式应该用于它们设计的目的，而不是别的。

2009-04-19 02:25:41

其他回答

你可能会问为什么goto会有争议。

基本上，当你拥有这么多“显而易见”的权力时，人们倾向于在它们不是最佳选择的情况下滥用它们。例如，要求用正则表达式解析csv或XML或HTML的人的数量让我感到震惊。这不是做这项工作的合适工具。但是一些用户还是坚持使用正则表达式。

就我个人而言，我试图找到一个中庸之道——在正则表达式擅长的地方使用它们，在它们不是最优的时候避免使用它们。

请注意，正则表达式仍然可以用于解析csv、XML、HTML等。但通常不是在一个正则表达式中。

2009-04-18 21:42:29

regex的最佳有效和正常用法是用于电子邮件地址格式验证。

这是一个很好的应用。

我曾经无数次在TextPad中一次性使用正则表达式来编辑平面文件、创建csv文件、创建SQL插入语句等等。

写得好的正则表达式不应该太慢。通常替代选项，比如大量的Replace调用，都是非常慢的选项。还不如一口气搞定。

许多情况只需要正则表达式，而不需要其他任何东西。

用无害字符替换特殊的非打印字符是另一种很好的用法。

我当然可以想象，有一些代码库过度使用正则表达式，从而损害了可维护性。我自己从来没见过。实际上，我因为没有充分使用正则表达式而被代码评审员避而远之。

2009-04-19 02:39:05

正则表达式允许您以紧凑的方式编写自定义有限状态机(FSM)来处理输入字符串。为什么使用正则表达式很难，至少有两个原因:

Old-school software development involves a lot of planning, paper models, and careful thought. Regular expressions fit into this model very well, because to write an effective expression properly involves a lot of staring at it, visualizing the paths of the FSM. Modern software developers would much rather hammer out code, and use a debugger to step through execution, to see if the code is correct. Regular expressions do not support this working style very well. One "run" of a regular expression is effectively an atomic operation. It's hard to observe stepwise execution in a debugger. It's too easy to write a regular expression that accidentally accepts more input than you intend. The value of a regular expression isn't really to match valid input, it's to fail to match invalid input. Techniques to do "negative tests" for regular expressions are not very advanced, or at least not widely used. This goes to the point of regular expressions being hard to read. Just by looking at a regular expression, it takes a lot of concentration to visualize all possible inputs that should be rejected, but are mistakenly accepted. Ever try to debug someone else's regular expression code?

如果现在软件开发人员对使用正则表达式有抵触情绪，我认为主要是由于这两个因素。

2009-04-18 22:19:08

在lex和yacc中用于编译器定义的正则表达式系统是很好的、非常有用和干净的。在这些系统中，表达式类型是根据其他表达式类型定义的。在perl和sed代码(等等)中常见的丑陋的畸形的不可读的行噪声巨型一行正则表达式是“有争议的”(垃圾)。

2010-11-08 06:55:17

虽然我认为正则表达式是一个必要的工具，但关于它们最烦人的事情是有不同的实现。语法、修饰语，尤其是“贪婪”的细微差异会让事情变得非常混乱，需要反复试验，有时还会产生令人困惑的错误。

2009-04-19 01:02:46

为什么正则表达式如此有争议?

推荐文章

最新文章

标签