从文件中获取第n行的Bash工具

有没有一种“规范”的方法？我一直在使用head-n|tail-1来完成这个任务，但我一直在想是否有一个Bash工具专门从文件中提取一行（或一系列行）。

我所说的“规范”是指一个主要功能就是这样做的程序。

当前回答

获取第n行（单行）

如果您想要一些以后可以自定义而不必处理bash的东西，可以编译这个c程序，并将二进制文件放到您的自定义二进制文件目录中。这假设您知道如何编辑.bashrc文件相应地（仅当您想要编辑路径变量时），如果您不知道，这是一个有用的链接。

要运行此代码，请使用（假设您将二进制代码命名为“行”）。

line [target line] [target file]

实例

line 2 somefile.txt

代码：

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int main(int argc, char* argv[]){

  if(argc != 3){
      fprintf(stderr, "line needs a line number and a file name");
      exit(0);     
  }

  int lineNumber = atoi(argv[1]); 
  int counter = 0; 
  char *fileName = argv[2];

  FILE *fileReader = fopen(fileName, "r");
  if(fileReader == NULL){
      fprintf(stderr, "Failed to open file"); 
      exit(0); 
  }

  size_t lineSize = 0;
  char* line = NULL;

  while(counter < lineNumber){
     getline(&line, &linesize, fileReader);
     counter++
  }

  getline(&line, &lineSize, fileReader);

  printf("%s\n", line);     

  fclose(fileReader); 
  return 0; 
}

EDIT：删除fseek并用while循环替换它

2022-11-23 06:16:40

其他回答

以上所有答案都直接回答了这个问题。但这是一个不那么直接的解决方案，但可能是一个更重要的想法，可以引起人们的思考。

由于行长度是任意的，因此需要读取文件第n行之前的所有字节。如果您有一个巨大的文件或需要多次重复此任务，并且此过程非常耗时，那么您应该认真考虑是否应该首先以不同的方式存储数据。

真正的解决方案是有一个索引，例如在文件的开头，指示行开始的位置。您可以使用数据库格式，或者在文件开头添加一个表。或者，创建一个单独的索引文件，与大型文本文件一起使用。

例如，您可以为换行符创建一个字符位置列表：

awk 'BEGIN{c=0;print(c)}{c+=length()+1;print(c+1)}' file.txt > file.idx

然后用tail读取，它实际上直接查找文件中的适当点！

例如获得线1000:

tail -c +$(awk 'NR=1000' file.idx) file.txt | head -1

这可能不适用于2字节/多字节字符，因为awk是“字符识别”的，但tail不是。我还没有对一个大文件进行测试。另请参阅此答案。或者，将文件拆分为更小的文件！

2017-10-12 10:44:16

如果有多行由\n分隔（通常为新行）。您也可以使用“cut”：

echo "$data" | cut -f2 -d$'\n'

您将从文件中获得第二行-f3给你第三行。

2016-01-07 16:27:53

对于一个巨大的文件来说，头部和尾部的管道会很慢。我建议您这样做：

sed 'NUMq;d' file

其中NUM是要打印的行数；例如，sed’10q；d'文件以打印文件的第10行。

说明：

当行号为NUM时，NUMq将立即退出。

d将删除该行而不是打印该行；这在最后一行被禁止，因为q会导致退出时跳过脚本的其余部分。

如果变量中有NUM，则需要使用双引号而不是单引号：

sed "${NUM}q;d" file

2011-05-16 19:38:33

大文件的最快解决方案始终是尾部|头部，前提是两个距离：

从文件开头到开始行。我们称之为S从最后一行到文件结尾的距离。是E吗

是已知的。然后，我们可以使用这个：

mycount="$E"; (( E > S )) && mycount="+$S"
howmany="$(( endline - startline + 1 ))"
tail -n "$mycount"| head -n "$howmany"

多少只是所需的行数。

更多详情请参见https://unix.stackexchange.com/a/216614/79743

2015-07-17 05:34:26

要使用sed和变量作为行号打印第n行，请执行以下操作：

a=4
sed -e $a'q:d' file

这里的“-e”标志用于将脚本添加到要执行的命令中。

2015-03-13 06:40:24

从文件中获取第n行的Bash工具

推荐文章

最新文章

标签