如何从Unix上的文本文件中提取预先确定的行范围?

我有一个~23000行的SQL转储，其中包含几个数据库的数据价值。我需要提取这个文件的某个部分(即单个数据库的数据)，并将其放在一个新文件中。我知道我想要的数据的开始行号和结束行号。

谁知道一个Unix命令(或一系列命令)可以从文件中提取16224到16482行之间的所有行，然后将它们重定向到一个新文件中?

当前回答

我正准备发布头部/尾部技巧，但实际上我可能只是启动emacs。: -)

Esc-x goto-line ret 16224 马克(ctrl-space) Esc-x goto-line ret 16482 esc-w

打开新的输出文件ctl-y 保存

让我看看发生了什么。

2008-09-17 13:49:50

其他回答

使用ruby:

ruby -ne 'puts "#{$.}: #{$_}" if $. >= 32613500 && $. <= 32614500' < GND.rdf > GND.extract.rdf

2015-05-21 12:23:02

我写了一个叫做splitter的Haskell程序，它就是这样做的:阅读我发布的博客文章。

您可以使用该程序如下:

$ cat somefile | splitter 16224-16482

这就是它的全部。您将需要Haskell来安装它。只是:

$ cabal install splitter

这样就做完了。我希望这个程序对您有用。

2013-07-25 22:43:32

我一直在寻找这个问题的答案，但最终我不得不编写自己的代码。以上的答案都不令人满意。假设您有一个非常大的文件，并且有一些想要打印的行号，但这些行号不是按顺序排列的。您可以执行以下操作:

我的文件比较大对于{a..k};执行echo $letter;完成| cat -n > myfile.txt

我想要的具体行号: shuf -i 1-11 -n 4 > line_numbers_I_want.txt

要打印这些行号，请执行以下操作。 awk ` {system("head myfile.txt -n " $0 " | tail -n 1")} ` line_numbers_I_want.txt

上面所做的是头n行，然后采取最后一行使用尾巴

如果您希望行号按顺序排列，首先sort (is -n numeric sort)，然后获取行。

cat line_numbers_I_want.txt | sort -n | awk '{system("head myfile.txt -n " $0 " | tail -n 1")}'

2021-02-27 03:22:52

由于我们讨论的是从文本文件中提取文本行，所以我将给出一个特殊情况，即您希望提取与某个模式匹配的所有行。

myfile content:
=====================
line1 not needed
line2 also discarded
[Data]
first data line
second data line
=====================
sed -n '/Data/,$p' myfile

将打印[Data]行和其余部分。如果想要从第一行到模式的文本，输入:sed -n '1，/Data/p' myfile。此外，如果您知道两个模式(最好在文本中是唯一的)，则可以使用匹配指定范围的开始行和结束行。

sed -n '/BEGIN_MARK/,/END_MARK/p' myfile

2018-02-14 22:52:13

cat dump.txt | head -16224 | tail -258

应该能行。这种方法的缺点是，您需要做算术来确定tail的参数，并考虑是否希望“between”包含结束行。

2008-09-17 13:49:29

如何从Unix上的文本文件中提取预先确定的行范围?

推荐文章

最新文章

标签