是否可以在连续流上使用grep?

我的意思是有点像tail-f<file>命令,但输出上有grep,以便只保留我感兴趣的行。

我尝试过tail-f<file>|grep模式,但似乎只有在tail完成后才能执行grep,也就是说永远不会执行。


当前回答

如果你想在整个文件中找到匹配项(而不仅仅是尾部),并且你想让它坐下来等待任何新的匹配项,这很好:

tail -c +0 -f <file> | grep --line-buffered <pattern>

-c+0标志表示输出应该从文件开头(+)开始0字节(-c)。

其他回答

在大多数情况下,您可以跟踪-f/var/log/some.log | grep-foo,它会很好地工作。

如果需要在运行的日志文件上使用多个grep,并且发现没有输出,则可能需要将--line缓冲开关插入中间的grep,如下所示:

tail -f /var/log/some.log | grep --line-buffered foo | grep bar

我认为你的问题是grep使用了一些输出缓冲。尝试

tail -f file | stdbuf -o0 grep my_pattern

它将grep的输出缓冲模式设置为无缓冲。

如果你想在整个文件中找到匹配项(而不仅仅是尾部),并且你想让它坐下来等待任何新的匹配项,这很好:

tail -c +0 -f <file> | grep --line-buffered <pattern>

-c+0标志表示输出应该从文件开头(+)开始0字节(-c)。

使用BSD grep(FreeBSD、Mac OS X等)时,打开grep的行缓冲模式

tail -f file | grep --line-buffered my_pattern

这看起来像是前一段时间——行缓冲区对于GNUgrep(几乎在任何Linux上都使用)都不重要,因为它在默认情况下被刷新(对于其他Unix类,如SmartOS、AIX或QNX,则为YMMV)。然而,截至2020年11月,需要--行缓冲(至少在openSUSE中使用GNU grep 3.5,但根据下面的评论,似乎通常需要)。

sed将是更好的选择(流编辑器)

tail-n0-f<file>| sed-n‘/search string/p‘

然后,如果您希望在找到特定字符串后退出tail命令:

tail--pid=$(($BASHPID+1))-n0-f<file>|sed-n'/search string/{p;q}'

显然是一种抨击:$BASHPID将是tail命令的进程id。sed命令在管道中位于tail之后,因此sed进程id将为$BASHPID+1。