显然,您可以使用|(管道?)来表示OR,但是是否也有一种方法来表示AND呢?
具体来说,我希望匹配包含某个短语的所有文本段落,但没有特定的顺序。
显然,您可以使用|(管道?)来表示OR,但是是否也有一种方法来表示AND呢?
具体来说,我希望匹配包含某个短语的所有文本段落,但没有特定的顺序。
当前回答
为什么不用awk呢? 用awk regex AND, OR的问题是如此简单
awk '/WORD1/ && /WORD2/ && /WORD3/' myfile
其他回答
使用非消耗正则表达式。
典型的(例如Perl/Java)表示法是:
(? = expr)
这意味着“匹配expr,但之后继续在原始匹配点进行匹配。”
你想做多少就做多少,这将是一个“并且”。例子:
(?=匹配这个表达式)(?=也配这个)(?=哦,还有这个)
如果需要保存其中的一些数据,甚至可以在非消费表达式中添加捕获组。
AND运算符在RegExp语法中是隐式的。 相反,必须使用管道指定OR操作符。 下面的RegExp:
var re = /ab/;
意思是字母a和字母b。 它还适用于组:
var re = /(co)(de)/;
它的意思是基团co和基团de。 将(隐式的)AND替换为OR需要以下几行代码:
var re = /a|b/;
var re = /(co)|(de)/;
你可以用正则表达式来做,但你可能会想用其他的表达式。例如,使用几个regexp并将它们组合在一个if子句中。
你可以用一个标准的regexp枚举所有可能的排列,像这样(以任意顺序匹配a, b和c):
(abc)|(bca)|(acb)|(bac)|(cab)|(cba)
但是,如果有多个项,这会使regexp变得非常长,而且可能效率很低。
如果您使用的是一些扩展的regexp版本,比如Perl或Java的,它们有更好的方法来实现这一点。其他答案建议使用正前向运算。
看看这个例子:
我们有两个正则表达式A和B,我们想要匹配它们,所以在伪代码中它看起来像这样:
pattern = "/A AND B/"
它可以在不使用AND操作符的情况下写成这样:
pattern = "/NOT (NOT A OR NOT B)/"
PCRE:
"/(^(^A|^B))/"
regexp_match(pattern,data)
在你的情况下,对几个匹配的结果做AND是不是不可能?在伪代码
regexp_match(pattern1, data) && regexp_match(pattern2, data) && ...