我知道我可以否定[^bar]中的一组字符,但我需要一个正则表达式,其中否定适用于特定单词-所以在我的示例中,我如何否定一个实际的条,而不是“条中的任何字符”?


当前回答

您可以使用消极的前瞻性或滞后性:

^(?!.*?bar).*
^(.(?<!bar))*?$

或者只使用基础知识:

^(?:[^b]+|b(?:$|[^a]|a(?:$|[^r])))*$

这些都与不包含bar的任何内容相匹配。

其他回答

要做到这一点,一个很好的方法是使用负面展望:

^(?!.*bar).*$

负先行结构是一对括号,左括号后跟问号和感叹号。在lookahead内部[是任何正则表达式模式]。

下面的正则表达式将执行您想要的操作(只要支持负lookbehinds和lookahead),并正确匹配;唯一的问题是它匹配单个字符(即,每个匹配都是单个字符,而不是两个连续的“条”之间的所有字符),如果使用非常长的字符串,则可能会导致高开销。

b(?!ar)|(?<!b)a|a(?!r)|(?<!ba)r|[^bar]

如果它真的是一个你不想匹配的词,那么:

^(?!.*\bbar\b).*$

以上内容将匹配任何不包含单词边界上的条的字符串,也就是说,与非单词字符分隔开。但是,除非使用正确的正则表达式标志,否则上述模式中使用的句点/点(.)将与换行符不匹配:

^(?s)(?!.*\bbar\b).*$

或者:

^(?!.*\bbar\b)[\s\S]*$

我们不使用任何特殊标志,而是寻找任何空白或非空白字符。这应该涵盖每个角色。

但如果我们想匹配可能包含bar但不包含特定单词bar的单词呢?

(?!\bbar\b)\b\[A-Za-z-]*bar[a-z-]*\b

(?!/bbar\b)断言下一个输入不是单词边界上的条。\b\[A-Za-z-]*bar[A-z-]*\b匹配包含bar的单词边界上的任何单词。

参见Regex演示

除非性能是最重要的,否则通常只需通过第二次测试来运行结果,跳过那些与您想要否定的单词相匹配的单词就更容易了。

正则表达式通常意味着您正在执行脚本编写或某种低性能任务,因此请找到一个易于阅读、易于理解和易于维护的解决方案。

我想补充已接受的答案,并用我迟来的答案为讨论作出贡献。

@ChrisVanOpstal分享了这个正则表达式教程,这是学习正则表达式的一个很好的资源。

然而,通读起来确实很耗时。

为了便于记忆,我做了一张备忘单。

这个引用基于每个类前面的大括号[]、()和{},我觉得很容易回忆起来。

Regex = {
 'single_character': ['[]', '.', {'negate':'^'}],
 'capturing_group' : ['()', '|', '\\', 'backreferences and named group'],
 'repetition'      : ['{}', '*', '+', '?', 'greedy v.s. lazy'],
 'anchor'          : ['^', '\b', '$'],
 'non_printable'   : ['\n', '\t', '\r', '\f', '\v'],
 'shorthand'       : ['\d', '\w', '\s'],
 }