我有一个很长的文件,我想打印,跳过前1,000,000行,例如。

我查看了猫的手册页,但我没有看到任何选项可以这样做。我正在寻找一个命令来执行此操作或一个简单的Bash程序。


当前回答

这个shell脚本对我来说很好:

#!/bin/bash
awk -v initial_line=$1 -v end_line=$2 '{
    if (NR >= initial_line && NR <= end_line) 
    print $0
}' $3

与这个示例文件(file.txt)一起使用:

one
two
three
four
five
six

命令(它将从文件的第二行到第四行提取):

edu@debian5:~$./script.sh 2 4 file.txt

命令输出:

two
three
four

当然,你可以改进它,例如通过测试所有参数值都是预期的:-)

其他回答

如果你想跳过前两行:

tail -n +3 <filename>

如果你想跳过第一个x行:

tail -n +$((x+1)) <filename>

如果您的系统上有GNU tail可用,您可以执行以下操作:

tail -n +1000001 huge-file.log

它是你想要的+字符。引用手册页中的内容:

如果K的第一个字符(字节数或行数)是a ' +',从每个文件开头的第k项开始打印。

因此,正如注释中所指出的那样,输入+1000001开始打印前1,000,000行之后的第一项。

使用带范围地址的sed delete命令。例如:

sed 1,100d file.txt # Print file.txt omitting lines 1-100.

或者,如果你只想打印一个已知的范围,使用带-n标志的print命令:

sed -n 201,300p file.txt # Print lines 201-300 from file.txt

这个解决方案应该在所有Unix系统上可靠地工作,而不管是否存在GNU实用程序。

使用AWK的一个不那么冗长的版本:

awk 'NR > 1e6' myfile.txt

但我建议使用整数。

这个shell脚本对我来说很好:

#!/bin/bash
awk -v initial_line=$1 -v end_line=$2 '{
    if (NR >= initial_line && NR <= end_line) 
    print $0
}' $3

与这个示例文件(file.txt)一起使用:

one
two
three
four
five
six

命令(它将从文件的第二行到第四行提取):

edu@debian5:~$./script.sh 2 4 file.txt

命令输出:

two
three
four

当然,你可以改进它,例如通过测试所有参数值都是预期的:-)