从文件中获取第n行的Bash工具

有没有一种“规范”的方法？我一直在使用head-n|tail-1来完成这个任务，但我一直在想是否有一个Bash工具专门从文件中提取一行（或一系列行）。

我所说的“规范”是指一个主要功能就是这样做的程序。

当前回答

作为CaffeineConnisseur非常有用的基准测试答案的后续。。。我很好奇“mapfile”方法与其他方法相比的速度有多快（因为没有测试），所以我自己尝试了一个快速而肮脏的速度比较，因为我手边有bash 4。在我做这项测试时，我在顶部答案的一条评论中提到了“tail|head”方法（而不是head|tail），因为人们都在称赞它。我没有使用的测试文件的大小；我能在短时间内找到的最好的文件是一个14M的谱系文件（用空格分隔的长行，略低于12000行）。

短版本：mapfile看起来比cut方法快，但比其他任何方法都慢，所以我称它为无用的。tail|head，OTOH，看起来可能是最快的，尽管与sed相比，这种大小的文件差异并不大。

$ time head -11000 [filename] | tail -1
[output redacted]

real    0m0.117s

$ time cut -f11000 -d$'\n' [filename]
[output redacted]

real    0m1.081s

$ time awk 'NR == 11000 {print; exit}' [filename]
[output redacted]

real    0m0.058s

$ time perl -wnl -e '$.== 11000 && print && exit;' [filename]
[output redacted]

real    0m0.085s

$ time sed "11000q;d" [filename]
[output redacted]

real    0m0.031s

$ time (mapfile -s 11000 -n 1 ary < [filename]; echo ${ary[0]})
[output redacted]

real    0m0.309s

$ time tail -n+11000 [filename] | head -n1
[output redacted]

real    0m0.028s

希望这有帮助！

2018-01-10 14:11:15

其他回答

您也可以使用sed打印并退出：

sed -n '10{p;q;}' file   # print line 10

2011-05-17 11:49:24

哇，所有的可能性！

试试看：

sed -n "${lineNum}p" $file

或者根据您的Awk版本选择其中之一：

awk  -vlineNum=$lineNum 'NR == lineNum {print $0}' $file
awk -v lineNum=4 '{if (NR == lineNum) {print $0}}' $file
awk '{if (NR == lineNum) {print $0}}' lineNum=$lineNum $file

（您可能需要尝试nawk或gawk命令）。

是否有一种工具只打印特定的行？不是标准工具之一。然而，sed可能是最接近和最简单的用法。

2011-05-17 12:52:15

已经有很多好答案了。我个人喜欢awk。为了方便起见，如果您使用bash，只需将以下内容添加到~/.bash_profile中即可。下次登录时（或者如果您在本次更新后获取.bash_profile的源代码），您将有一个新的漂亮的“第n”函数可用于管道传输文件。

执行此命令或将其放入~/.bash_profile（如果使用bash）并重新打开bash（或执行源~/.bach_profile）

# print just the nth piped in line
nth () { awk -vlnum=${1} 'NR==lnum {print; exit}'; }

然后，要使用它，只需通过管道。例如：

$ yes line | cat -n | nth 5
     5  line

2017-11-17 15:42:57

这不是一个bash解决方案，但我发现顶级选择不能满足我的需求，例如，

sed 'NUMq;d' file

速度足够快，但挂了几个小时，没有告诉任何进展。我建议编译这个cpp程序并使用它来查找所需的行。您可以使用g++main.cpp编译它，其中main.cpp是包含以下内容的文件。我得到了一个，并执行了它/a.输出

#include <iostream>
#include <string>
#include <fstream>

using namespace std;

int main() {
    string filename;
    cout << "Enter filename ";
    cin >> filename;

    int needed_row_number;
    cout << "Enter row number ";
    cin >> needed_row_number;

    int progress_line_count;
    cout << "Enter at which every number of rows to monitor progress ";
    cin >> progress_line_count;

    char ch;
    int row_counter = 1;
    fstream fin(filename, fstream::in);
    while (fin >> noskipws >> ch) {
        int ch_int = (int) ch;
        if (row_counter == needed_row_number) {
            cout << ch;
        }
        if (ch_int == 10) {
            if (row_counter == needed_row_number) {
                return 0;
            }
            row_counter++;
            if (row_counter % progress_line_count == 0) {
                cout << "Progress: line " << row_counter << endl;
            }
        }

    }
    return 0;
}

2022-07-21 10:25:11

要使用sed和变量作为行号打印第n行，请执行以下操作：

a=4
sed -e $a'q:d' file

这里的“-e”标志用于将脚本添加到要执行的命令中。

2015-03-13 06:40:24

从文件中获取第n行的Bash工具

推荐文章

最新文章

标签