如何使用grep跨多行找到模式?

我想找到有“abc”和“efg”的文件，这两个字符串在该文件中的不同行。一个包含以下内容的文件:

blah blah..
blah blah..
blah abc blah
blah blah..
blah blah..
blah blah..
blah efg blah blah
blah blah..
blah blah..

应该匹配。

当前回答

我在几天前发布了一个grep替代方案，它直接支持这一点，通过多行匹配或使用条件——希望它对搜索这里的人有用。下面是示例命令的样子:

多行:

sift -lm 'abc.*efg' testfile

条件:

sift -l 'abc' testfile --followed-by 'efg'

你也可以指定'efg'必须在一定的行数内跟在'abc'后面:

sift -l 'abc' testfile --followed-within 5:'efg'

你可以在sift-tool.org上找到更多信息。

其他回答

下面是一个受到这个答案启发的解决方案:

如果'abc'和'efg'可以在同一行: Grep -zl 'abc。*efg' <您的文件列表> 如果'abc'和'efg'必须在不同的行上: grep -Pzl '(?s)abc.*\n.;*efg' <您的文件列表>

参数:

-P使用perl兼容的正则表达式。将输入视为一组行，每一行以0字节结束，而不是换行符。例如，grep将输入视为一行。注意，如果你不使用-l，它将显示匹配后的NUL字符，见注释。 -l list只匹配文件名。 (?s)激活PCRE_DOTALL，这意味着'。'查找任何字符或换行符。

sed应该足够了，就像海报LJ上面说的，

而不是!d，你可以简单地使用p打印:

sed -n '/abc/,/efg/p' file

Grep是这种操作的笨拙工具。

在大多数现代Linux系统中都可以找到pcregrep，可以用作

pcregrep -M  'abc.*(\n|.)*efg' test.txt

where -M，——multiline允许模式匹配多行

还有一个更新的pcre2grep。两者都是由PCRE项目提供的。

pcre2grep可以通过Mac Ports作为pcre2端口的一部分用于Mac OS X:

% sudo port install pcre2

并通过Homebrew为:

% brew install pcre

或者pcre2

% brew install pcre2

pcre2grep在Linux (Ubuntu 18.04+)上也可用

$ sudo apt install pcre2-utils # PCRE2
$ sudo apt install pcregrep    # Older PCRE

这可以通过首先使用tr用其他字符替换换行符来轻松完成:

tr '\n' '\a' | grep -o 'abc.*def' | tr '\a' '\n'

这里，我使用警报字符\a (ASCII 7)来代替换行符。这在你的文本中几乎找不到，而且grep可以用一个.匹配它，或者专门用\a匹配它。

下面是一种连续使用两个grep的方法:

egrep -o 'abc|efg' $file | grep -A1 abc | grep efg | wc -l

返回0或正整数。

egrep -o(只显示匹配，技巧:同一行上的多个匹配会产生多行输出，就好像它们在不同的行上一样)

grep -A1 abc(打印abc及其后面的行) Grep efg | wc -l(在ABC之后的相同或后面的行中发现的efg行数为0-n，结果可用于'if") 如果需要模式匹配，可以将Grep更改为egrep等

推荐文章