如何从Unix上的文本文件中提取预先确定的行范围?

我有一个~23000行的SQL转储，其中包含几个数据库的数据价值。我需要提取这个文件的某个部分(即单个数据库的数据)，并将其放在一个新文件中。我知道我想要的数据的开始行号和结束行号。

谁知道一个Unix命令(或一系列命令)可以从文件中提取16224到16482行之间的所有行，然后将它们重定向到一个新文件中?

当前回答

我写了一个叫做splitter的Haskell程序，它就是这样做的:阅读我发布的博客文章。

您可以使用该程序如下:

$ cat somefile | splitter 16224-16482

这就是它的全部。您将需要Haskell来安装它。只是:

$ cabal install splitter

这样就做完了。我希望这个程序对您有用。

其他回答

您可以使用'vi'，然后使用以下命令:

:16224,16482w!/tmp/some-file

另外:

cat file | head -n 16482 | tail -n 258

编辑:-只是补充解释，您使用head -n 16482显示前16482行，然后使用tail -n 258显示第一次输出的最后258行。

使用ruby:

ruby -ne 'puts "#{$.}: #{$_}" if $. >= 32613500 && $. <= 32614500' < GND.rdf > GND.extract.rdf

我一直在寻找这个问题的答案，但最终我不得不编写自己的代码。以上的答案都不令人满意。假设您有一个非常大的文件，并且有一些想要打印的行号，但这些行号不是按顺序排列的。您可以执行以下操作:

我的文件比较大对于{a..k};执行echo $letter;完成| cat -n > myfile.txt

我想要的具体行号: shuf -i 1-11 -n 4 > line_numbers_I_want.txt

要打印这些行号，请执行以下操作。 awk ` {system("head myfile.txt -n " $0 " | tail -n 1")} ` line_numbers_I_want.txt

上面所做的是头n行，然后采取最后一行使用尾巴

如果您希望行号按顺序排列，首先sort (is -n numeric sort)，然后获取行。

cat line_numbers_I_want.txt | sort -n | awk '{system("head myfile.txt -n " $0 " | tail -n 1")}'

cat dump.txt | head -16224 | tail -258

应该能行。这种方法的缺点是，您需要做算术来确定tail的参数，并考虑是否希望“between”包含结束行。

Sed -n '16224,16482p' < dump.sql

推荐文章