试图调试服务器的一个问题,我唯一的日志文件是一个20GB的日志文件(甚至没有时间戳!)为什么人们使用System.out.println()作为日志?在生产吗? !)
使用grep,我找到了我想要查看的文件区域,第347340107行。
除了做一些
head -<$LINENUM + 10> filename | tail -20
... 这将需要头读取日志文件的前3.47亿行,是否有一个快速而简单的命令将行347340100 - 347340200(例如)转储到控制台?
我完全忘记了grep可以打印匹配前后的上下文…这很有效。谢谢!
我发现了其他两个解决方案,如果你知道行号,但没有其他(没有grep可能):
假设你需要第20到40行,
sed -n '20,40p;41q' file_name
or
awk 'FNR>=20 && FNR<=40' file_name
When using sed it is more efficient to quit processing after having printed the last line than continue processing until the end of the file. This is especially important in the case of large files and printing lines at the beginning. In order to do so, the sed command above introduces the instruction 41q in order to stop processing after line 41 because in the example we are interested in lines 20-40 only. You will need to change the 41 to whatever the last line you are interested in is, plus one.
要通过<line#>显示<textfile>中的一行,只需这样做:
perl -wne 'print if $. == <line#>' <textfile>
如果你想用更强大的方法用正则表达式来显示一行范围——我不会说为什么grep是一个坏主意,这应该是相当明显的——这个简单的表达式将在一次传递中显示你的范围,这是你在处理~20GB文本文件时想要的:
perl -wne 'print if m/<regex1>/ .. m/<regex2>/' <filename>
(提示:如果你的regex中有/,使用类似m!<regex>!相反)
这将打印出<filename>,从匹配<regex1>的行开始,直到(并包括)匹配<regex2>的行。
不需要一个向导,就可以看到一些调整可以使它更加强大。
最后一点:perl,因为它是一种成熟的语言,有许多隐藏的增强来提高速度和性能。考虑到这一点,它成为这种操作的明显选择,因为它最初是为处理大型日志文件、文本、数据库等而开发的。