如何使用grep跨多行找到模式?

我想找到有“abc”和“efg”的文件，这两个字符串在该文件中的不同行。一个包含以下内容的文件:

blah blah..
blah blah..
blah abc blah
blah blah..
blah blah..
blah blah..
blah efg blah blah
blah blah..
blah blah..

应该匹配。

当前回答

随着几个月前ugrep的发布:

ugrep 'abc(\n|.)+?efg'

这个工具是高度优化的速度。它也是GNU/BSD/PCRE-grep兼容的。

注意我们应该使用惰性重复+?，除非您想将所有efg行匹配在一起，直到文件中的最后一个efg。

2020-01-22 19:40:03

其他回答

我在几天前发布了一个grep替代方案，它直接支持这一点，通过多行匹配或使用条件——希望它对搜索这里的人有用。下面是示例命令的样子:

多行:

sift -lm 'abc.*efg' testfile

条件:

sift -l 'abc' testfile --followed-by 'efg'

你也可以指定'efg'必须在一定的行数内跟在'abc'后面:

sift -l 'abc' testfile --followed-within 5:'efg'

你可以在sift-tool.org上找到更多信息。

2015-02-06 00:08:54

我不知道如何用grep做到这一点，但我会用awk做这样的事情:

awk '/abc/{ln1=NR} /efg/{ln2=NR} END{if(ln1 && ln2 && ln1 < ln2){print "found"}else{print "not found"}}' foo

不过，你需要注意如何做到这一点。您希望正则表达式匹配子字符串还是整个单词?适当添加\w标记。此外，虽然这严格符合您陈述的示例，但当abc在efg之后第二次出现时，它并不完全有效。如果你想处理这个问题，在/abc/ case等中添加一个If。

2010-04-21 20:12:01

awk一行程序:

awk '/abc/,/efg/' [file-with-content]

2013-01-17 03:10:30

作为Balu Mohan的答案的替代方案，可以只使用grep、head和tail来强制模式的顺序:

for f in FILEGLOB; do tail $f -n +$(grep -n "pattern1" $f | head -n1 | cut -d : -f 1) 2>/dev/null | grep "pattern2" &>/dev/null && echo $f; done

不过，这个不太漂亮。格式化得更容易读:

for f in FILEGLOB; do
    tail $f -n +$(grep -n "pattern1" $f | head -n1 | cut -d : -f 1) 2>/dev/null \
    | grep -q "pattern2" \
    && echo $f
done

这将打印所有“pattern2”出现在“pattern1”之后，或者两者都出现在同一行的文件名称:

$ echo "abc
def" > a.txt
$ echo "def
abc" > b.txt
$ echo "abcdef" > c.txt; echo "defabc" > d.txt
$ for f in *.txt; do tail $f -n +$(grep -n "abc" $f | head -n1 | cut -d : -f 1) 2>/dev/null | grep -q "def" && echo $f; done
a.txt
c.txt
d.txt

解释

Tail -n +i -打印第i行之后的所有行，包括 Grep -n -在匹配的行前加上行号头-n1 -只打印第一行 Cut -d: -f 1 -打印第一个切割列，使用:作为分隔符 2>/dev/null -如果$()表达式返回空，则出现沉默尾部错误输出 Grep -q—关闭Grep并在找到匹配时立即返回，因为我们只对退出码感兴趣

2013-08-02 08:18:56

下面是一个受到这个答案启发的解决方案:

如果'abc'和'efg'可以在同一行: Grep -zl 'abc。*efg' <您的文件列表> 如果'abc'和'efg'必须在不同的行上: grep -Pzl '(?s)abc.*\n.;*efg' <您的文件列表>

参数:

-P使用perl兼容的正则表达式。将输入视为一组行，每一行以0字节结束，而不是换行符。例如，grep将输入视为一行。注意，如果你不使用-l，它将显示匹配后的NUL字符，见注释。 -l list只匹配文件名。 (?s)激活PCRE_DOTALL，这意味着'。'查找任何字符或换行符。

2014-08-07 10:53:42

如何使用grep跨多行找到模式?

推荐文章

最新文章

标签