显然,您可以使用|(管道?)来表示OR,但是是否也有一种方法来表示AND呢?

具体来说,我希望匹配包含某个短语的所有文本段落,但没有特定的顺序。


当前回答

您可以将输出输送到另一个正则表达式。使用grep,你可以这样做:

grep A |

其他回答

您需要像其他应答者所说的那样使用预读,但是预读必须考虑目标单词和当前匹配位置之间的其他字符。例如:

(?=.*word1)(?=.*word2)(?=.*word3)

第一个前向中的.*让它在到达"word1"之前匹配任意数量的字符。然后匹配位置被重置,第二个前向查找“word2”。再次重置,最后部分匹配“word3”;因为它是你要检查的最后一个单词,所以它没有必要出现在前瞻中,但这也无妨。

为了匹配整个段落,您需要在两端锚定正则表达式,并添加一个最后的.*来消耗剩余的字符。使用perl风格的符号,这将是:

/^(?=.*word1)(?=.*word2)(?=.*word3).*$/m

'm'修饰符用于多行模式;它允许^和$匹配段落边界(regex术语为“行边界”)。在这种情况下,重要的是不要使用's'修饰符,它允许点元字符匹配换行符以及所有其他字符。

最后,你要确保你匹配的是整个单词,而不是长单词的片段,所以你需要添加单词边界:

/^(?=.*\bword1\b)(?=.*\bword2\b)(?=.*\bword3\b).*$/m

顺序总是隐含在正则表达式的结构中。为了实现您想要的结果,您必须针对不同的表达式多次匹配输入字符串。

您想要做的事情是无法通过单个regexp实现的。

AND运算符在RegExp语法中是隐式的。 相反,必须使用管道指定OR操作符。 下面的RegExp:

var re = /ab/;

意思是字母a和字母b。 它还适用于组:

var re = /(co)(de)/;

它的意思是基团co和基团de。 将(隐式的)AND替换为OR需要以下几行代码:

var re = /a|b/;
var re = /(co)|(de)/;

在你的情况下,对几个匹配的结果做AND是不是不可能?在伪代码

regexp_match(pattern1, data) && regexp_match(pattern2, data) && ...

看看这个例子:

我们有两个正则表达式A和B,我们想要匹配它们,所以在伪代码中它看起来像这样:

pattern = "/A AND B/"

它可以在不使用AND操作符的情况下写成这样:

pattern = "/NOT (NOT A OR NOT B)/"

PCRE:

"/(^(^A|^B))/"

regexp_match(pattern,data)