如何使用grep跨多行找到模式?

我想找到有“abc”和“efg”的文件，这两个字符串在该文件中的不同行。一个包含以下内容的文件:

blah blah..
blah blah..
blah abc blah
blah blah..
blah blah..
blah blah..
blah efg blah blah
blah blah..
blah blah..

应该匹配。

当前回答

我不知道如何用grep做到这一点，但我会用awk做这样的事情:

awk '/abc/{ln1=NR} /efg/{ln2=NR} END{if(ln1 && ln2 && ln1 < ln2){print "found"}else{print "not found"}}' foo

不过，你需要注意如何做到这一点。您希望正则表达式匹配子字符串还是整个单词?适当添加\w标记。此外，虽然这严格符合您陈述的示例，但当abc在efg之后第二次出现时，它并不完全有效。如果你想处理这个问题，在/abc/ case等中添加一个If。

其他回答

虽然sed选项是最简单、最简单的，但遗憾的是，LJ的一行程序并不是最可移植的。那些受困于C Shell(而不是bash)版本的人将需要摆脱他们的刘海:

sed -e '/abc/,/efg/\!d' [file]

不幸的是，这一行在bash等中不起作用。

如果你需要两个单词彼此接近，例如不超过3行，你可以这样做:

find . -exec grep -Hn -C 3 "abc" {} \; | grep -C 3 "efg"

同样的例子，但是只过滤*.txt文件:

find . -name *.txt -exec grep -Hn -C 3 "abc" {} \; | grep -C 3 "efg"

如果你想，你也可以用正则表达式替换grep命令。

随着几个月前ugrep的发布:

ugrep 'abc(\n|.)+?efg'

这个工具是高度优化的速度。它也是GNU/BSD/PCRE-grep兼容的。

注意我们应该使用惰性重复+?，除非您想将所有efg行匹配在一起，直到文件中的最后一个efg。

我不知道如何用grep做到这一点，但我会用awk做这样的事情:

awk '/abc/{ln1=NR} /efg/{ln2=NR} END{if(ln1 && ln2 && ln1 < ln2){print "found"}else{print "not found"}}' foo

这应该可以工作:

cat FILE | egrep 'abc|efg'

如果有多个匹配项，可以使用grep -v过滤掉

推荐文章