如何使用grep跨多行找到模式?

我想找到有“abc”和“efg”的文件，这两个字符串在该文件中的不同行。一个包含以下内容的文件:

blah blah..
blah blah..
blah abc blah
blah blah..
blah blah..
blah blah..
blah efg blah blah
blah blah..
blah blah..

应该匹配。

当前回答

你至少有几个选择

DOTALL方法

用(?s) DOTALL the。包含\n的字符你也可以使用一个超前(?=\n)——不会在匹配中被捕获

example-text:

true
match me

false
match me one

false
match me two

true
match me three
third line!!
{BLANK_LINE}

命令:

grep -Pozi '(?s)true.+?\n(?=\n)' example-text

-p用于perl正则表达式

-o只匹配模式，而不是整行

-z允许换行

-i不区分大小写

输出:

true                                                  
match me                                              
true                                                  
match me three                                        
third line!!

注:

- +? makes modifier non-greedy so matches shortest string instead of largest (prevents from returning one match containing entire text)

你可以使用老式的O.G.手动方法，使用\n

命令:

grep -Pozi 'true(.|\n)+?\n(?=\n)'

输出:

true                                                  
match me                                              
true                                                  
match me three                                        
third line!!

2021-08-19 19:22:48

其他回答

我在几天前发布了一个grep替代方案，它直接支持这一点，通过多行匹配或使用条件——希望它对搜索这里的人有用。下面是示例命令的样子:

多行:

sift -lm 'abc.*efg' testfile

条件:

sift -l 'abc' testfile --followed-by 'efg'

你也可以指定'efg'必须在一定的行数内跟在'abc'后面:

sift -l 'abc' testfile --followed-within 5:'efg'

你可以在sift-tool.org上找到更多信息。

2015-02-06 00:08:54

下面是一个受到这个答案启发的解决方案:

如果'abc'和'efg'可以在同一行: Grep -zl 'abc。*efg' <您的文件列表> 如果'abc'和'efg'必须在不同的行上: grep -Pzl '(?s)abc.*\n.;*efg' <您的文件列表>

参数:

-P使用perl兼容的正则表达式。将输入视为一组行，每一行以0字节结束，而不是换行符。例如，grep将输入视为一行。注意，如果你不使用-l，它将显示匹配后的NUL字符，见注释。 -l list只匹配文件名。 (?s)激活PCRE_DOTALL，这意味着'。'查找任何字符或换行符。

2014-08-07 10:53:42

我非常依赖于pcregrep，但是对于更新的grep，您不需要安装它的许多特性。只需使用grep -P。

在OP的问题的例子中，我认为以下选项很好地发挥了作用，第二好的选项符合我对问题的理解:

grep -Pzo "abc(.|\n)*efg" /tmp/tes*
grep -Pzl "abc(.|\n)*efg" /tmp/tes*

我将文本复制为/tmp/test1，删除'g'并保存为/tmp/test2。下面的输出显示，第一个显示匹配的字符串，第二个只显示文件名(典型的-o显示匹配，典型的-l只显示文件名)。请注意，'z'对于多行是必要的，'(.|\n)'意味着匹配'换行符以外的任何内容'或'换行符' -即任何内容:

user@host:~$ grep -Pzo "abc(.|\n)*efg" /tmp/tes*
/tmp/test1:abc blah
blah blah..
blah blah..
blah blah..
blah efg
user@host:~$ grep -Pzl "abc(.|\n)*efg" /tmp/tes*
/tmp/test1

要确定你的版本是否足够新，运行man grep，看看顶部是否出现类似的内容:

   -P, --perl-regexp
          Interpret  PATTERN  as a Perl regular expression (PCRE, see
          below).  This is highly experimental and grep -P may warn of
          unimplemented features.

它来自GNU grep 2.10。

2015-10-29 15:27:51

虽然sed选项是最简单、最简单的，但遗憾的是，LJ的一行程序并不是最可移植的。那些受困于C Shell(而不是bash)版本的人将需要摆脱他们的刘海:

sed -e '/abc/,/efg/\!d' [file]

不幸的是，这一行在bash等中不起作用。

2011-10-27 16:57:36

Grep是这种操作的笨拙工具。

在大多数现代Linux系统中都可以找到pcregrep，可以用作

pcregrep -M  'abc.*(\n|.)*efg' test.txt

where -M，——multiline允许模式匹配多行

还有一个更新的pcre2grep。两者都是由PCRE项目提供的。

pcre2grep可以通过Mac Ports作为pcre2端口的一部分用于Mac OS X:

% sudo port install pcre2

并通过Homebrew为:

% brew install pcre

或者pcre2

% brew install pcre2

pcre2grep在Linux (Ubuntu 18.04+)上也可用

$ sudo apt install pcre2-utils # PCRE2
$ sudo apt install pcregrep    # Older PCRE

2010-04-21 21:29:25

如何使用grep跨多行找到模式?

推荐文章

最新文章

标签