如何否定正则表达式中的特定单词？

我知道我可以否定[^bar]中的一组字符，但我需要一个正则表达式，其中否定适用于特定单词-所以在我的示例中，我如何否定一个实际的条，而不是“条中的任何字符”？

当前回答

我只是想了些别的办法。它与我的第一个答案非常不同，因为它不使用正则表达式，所以我决定发布第二个答案。

在字符串上使用您选择的语言的split（）方法，该方法等效于将要否定的单词作为拆分对象的参数。使用Python的示例：

>>> text = 'barbarasdbarbar 1234egb ar bar32 sdfbaraadf'
>>> text.split('bar')
['', '', 'asd', '', ' 1234egb ar ', '32 sdf', 'aadf']

这样做的好处是，至少在Python中（我不记得在Visual Basic或Java中的功能是否相同），因为“bar”之间的空字符串包含在结果列表中（尽管开头的空字符串是因为字符串开头有一个“bar”），所以它可以间接地让您知道字符串中何时重复了“bar”。如果您不想这样做，只需从列表中删除空字符串即可。

2009-08-07 19:58:34

其他回答

接受的答案很好，但对于正则表达式中缺少简单的子表达式否定运算符来说，这确实是一个解决方案。这就是grep-invert匹配退出的原因。因此，在*nixes中，您可以使用管道和第二个正则表达式来实现所需的结果。

grep 'something I want' | grep --invert-match 'but not these ones'

仍然是一种变通方法，但可能更容易记住。

2016-01-04 00:04:46

下面的正则表达式将执行您想要的操作（只要支持负lookbehinds和lookahead），并正确匹配；唯一的问题是它匹配单个字符（即，每个匹配都是单个字符，而不是两个连续的“条”之间的所有字符），如果使用非常长的字符串，则可能会导致高开销。

b(?!ar)|(?<!b)a|a(?!r)|(?<!ba)r|[^bar]

2009-08-06 17:33:52

除非性能是最重要的，否则通常只需通过第二次测试来运行结果，跳过那些与您想要否定的单词相匹配的单词就更容易了。

正则表达式通常意味着您正在执行脚本编写或某种低性能任务，因此请找到一个易于阅读、易于理解和易于维护的解决方案。

2009-08-06 17:33:13

解决方案：

^(?!.*STRING1|.*STRING2|.*STRING3).*$

xxxxxx正常

xxxSTRING1xxx KO（是否需要）

xxxSTRING2xxx KO（是否需要）

xxxSTRING3xxx KO（是否需要）

2016-09-13 16:08:57

我想补充已接受的答案，并用我迟来的答案为讨论作出贡献。

@ChrisVanOpstal分享了这个正则表达式教程，这是学习正则表达式的一个很好的资源。

然而，通读起来确实很耗时。

为了便于记忆，我做了一张备忘单。

这个引用基于每个类前面的大括号[]、（）和{}，我觉得很容易回忆起来。

Regex = {
 'single_character': ['[]', '.', {'negate':'^'}],
 'capturing_group' : ['()', '|', '\\', 'backreferences and named group'],
 'repetition'      : ['{}', '*', '+', '?', 'greedy v.s. lazy'],
 'anchor'          : ['^', '\b', '$'],
 'non_printable'   : ['\n', '\t', '\r', '\f', '\v'],
 'shorthand'       : ['\d', '\w', '\s'],
 }

2017-12-06 06:32:16

如何否定正则表达式中的特定单词？

推荐文章

最新文章

标签