如何使用grep跨多行找到模式?

我想找到有“abc”和“efg”的文件，这两个字符串在该文件中的不同行。一个包含以下内容的文件:

blah blah..
blah blah..
blah abc blah
blah blah..
blah blah..
blah blah..
blah efg blah blah
blah blah..
blah blah..

应该匹配。

当前回答

我非常依赖于pcregrep，但是对于更新的grep，您不需要安装它的许多特性。只需使用grep -P。

在OP的问题的例子中，我认为以下选项很好地发挥了作用，第二好的选项符合我对问题的理解:

grep -Pzo "abc(.|\n)*efg" /tmp/tes*
grep -Pzl "abc(.|\n)*efg" /tmp/tes*

我将文本复制为/tmp/test1，删除'g'并保存为/tmp/test2。下面的输出显示，第一个显示匹配的字符串，第二个只显示文件名(典型的-o显示匹配，典型的-l只显示文件名)。请注意，'z'对于多行是必要的，'(.|\n)'意味着匹配'换行符以外的任何内容'或'换行符' -即任何内容:

user@host:~$ grep -Pzo "abc(.|\n)*efg" /tmp/tes*
/tmp/test1:abc blah
blah blah..
blah blah..
blah blah..
blah efg
user@host:~$ grep -Pzl "abc(.|\n)*efg" /tmp/tes*
/tmp/test1

要确定你的版本是否足够新，运行man grep，看看顶部是否出现类似的内容:

   -P, --perl-regexp
          Interpret  PATTERN  as a Perl regular expression (PCRE, see
          below).  This is highly experimental and grep -P may warn of
          unimplemented features.

它来自GNU grep 2.10。

2015-10-29 15:27:51

其他回答

这可以通过首先使用tr用其他字符替换换行符来轻松完成:

tr '\n' '\a' | grep -o 'abc.*def' | tr '\a' '\n'

这里，我使用警报字符\a (ASCII 7)来代替换行符。这在你的文本中几乎找不到，而且grep可以用一个.匹配它，或者专门用\a匹配它。

2016-07-09 00:41:57

文件模式*.sh对于防止目录被检查很重要。当然，一些测试也可以防止这种情况发生。

for f in *.sh
do
  a=$( grep -n -m1 abc $f )
  test -n "${a}" && z=$( grep -n efg $f | tail -n 1) || continue 
  (( ((${z/:*/}-${a/:*/})) > 0 )) && echo $f
done

The

grep -n -m1 abc $f

搜索最大1个匹配项并返回(-n)行数。如果找到一个匹配(test -n…)，找到efg的最后一个匹配(找到所有，并使用tail -n 1取最后一个匹配)。

z=$( grep -n efg $f | tail -n 1)

其他的继续。

由于结果类似于18:foofile.sh String alf="abc";我们需要从“:”开始切到行尾。

((${z/:*/}-${a/:*/}))

如果第二个表达式的最后一个匹配超过了第一个表达式的第一个匹配，则应返回正结果。

然后我们报告文件名echo $f。

2018-04-15 01:02:54

这个也能用吗?!

perl -lpne 'print $ARGV if /abc.*?efg/s' file_list

$ARGV包含从file_list读取当前文件时的文件名 /s修饰符跨换行搜索。

2016-02-18 19:58:35

如果您愿意使用上下文，这可以通过输入来实现

grep -A 500 abc test.txt | grep -B 500 efg

这将显示“abc”和“efg”之间的所有内容，只要它们之间的距离不超过500行。

2014-03-10 15:48:58

这应该可以工作:

cat FILE | egrep 'abc|efg'

如果有多个匹配项，可以使用grep -v过滤掉

2017-03-09 10:26:16

如何使用grep跨多行找到模式?

推荐文章

最新文章

标签