我试图使用grep来匹配包含两个不同字符串的行。我已经尝试了以下方法,但这匹配了包含不是我想要的string1或string2的行。

grep 'string1\|string2' filename

那么我如何匹配与grep只包含两个字符串的行?


当前回答

ripgrep

下面是使用rg的例子:

rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt

它是最快的抓取工具之一,因为它建立在Rust的正则引擎之上,该引擎使用有限自动机、SIMD和积极的文字优化来使搜索非常快。

使用它,特别是在处理大量数据时。

参见GH-875中的相关功能请求。

其他回答

在任意位置搜索包含所有单词的任意顺序的文件:

grep -ril \'action\' | xargs grep -il \'model\' | xargs grep -il \'view_type\'

第一个grep启动递归搜索(r),忽略大小写(i)并列出(打印出)文件中任何地方出现的与(l)匹配的一个项(带有单引号的'action')的文件名。

后续的grep搜索其他术语,保留大小写不敏感并列出匹配文件。

您将获得的最终文件列表将是包含这些术语的文件,在文件的任何位置以任意顺序排列。

正如人们建议的perl和python,以及复杂的shell脚本,这里有一个简单的awk方法:

awk '/string1/ && /string2/' filename

看了评论,得到了公认的答案:不,这没有多行;但这也不是问题作者想要的。

我觉得这就是你想要的

grep -E "string1|string2" filename

我认为答案是这样的:

grep 'string1.*string2\|string2.*string1' filename

只匹配两者都存在的情况,而不是其中一个或另一个或两者都存在的情况。

发现仅以6个空格开始并以以下内容结束的行:

 cat my_file.txt | grep
 -e '^      .*(\.c$|\.cpp$|\.h$|\.log$|\.out$)' # .c or .cpp or .h or .log or .out
 -e '^      .*[0-9]\{5,9\}$' # numers between 5 and 9 digist
 > nolog.txt

你应该有这样的grep:

$ grep 'string1' file | grep 'string2'