我试图使用grep来匹配包含两个不同字符串的行。我已经尝试了以下方法,但这匹配了包含不是我想要的string1或string2的行。

grep 'string1\|string2' filename

那么我如何匹配与grep只包含两个字符串的行?


当前回答

如果您有一个grep,其中有一个-P选项用于有限的perl regex,您可以使用

grep -P '(?=.*string1)(?=.*string2)'

它的优点是处理重叠的字符串。使用perl作为grep更直接,因为你可以更直接地指定and逻辑:

perl -ne 'print if /string1/ && /string2/'

其他回答

正则表达式中的|操作符表示或。也就是说,string1或string2将匹配。你可以这样做:

grep 'string1' filename | grep 'string2'

它将把第一个命令的结果输送到第二个grep中。这应该只会给出两者都匹配的行。

ripgrep

下面是使用rg的例子:

rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt

它是最快的抓取工具之一,因为它建立在Rust的正则引擎之上,该引擎使用有限自动机、SIMD和积极的文字优化来使搜索非常快。

使用它,特别是在处理大量数据时。

参见GH-875中的相关功能请求。

搜索两个String,只突出显示string1和string2

grep -E 'string1.*string2|string2.*string1' filename | grep -E 'string1|string2'

or

grep 'string1.*string2\|string2.*string1' filename | grep -E 'string1\|string2'

你可以尝试这样做:

(pattern1.*pattern2|pattern2.*pattern1)

发现仅以6个空格开始并以以下内容结束的行:

 cat my_file.txt | grep
 -e '^      .*(\.c$|\.cpp$|\.h$|\.log$|\.out$)' # .c or .cpp or .h or .log or .out
 -e '^      .*[0-9]\{5,9\}$' # numers between 5 and 9 digist
 > nolog.txt