我如何才能快速和所有的数字在一个文件?

我有一个包含数千个数字的文件，每个数字都在自己的行上:

我想写一个脚本，它将打印文件中所有数字的总和。我有一个解决办法，但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?

当前回答

这是另一个简单的句子

( echo 0 ; sed 's/$/ +/' foo ; echo p ) | dc

这假设数字是整数。如果你需要小数，试试

( echo 0 2k ; sed 's/$/ +/' foo ; echo p ) | dc

将2调整为所需的小数数。

2010-04-26 11:34:12

其他回答

C总是以速度取胜:

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char **argv) {
    ssize_t read;
    char *line = NULL;
    size_t len = 0;
    double sum = 0.0;

    while (read = getline(&line, &len, stdin) != -1) {
        sum += atof(line);
    }

    printf("%f", sum);
    return 0;
}

1M数字的计时(与我的python答案相同的机器/输入):

$ gcc sum.c -o sum && time ./sum < numbers 
5003371677.000000
real    0m0.188s
user    0m0.180s
sys     0m0.000s

2013-08-22 12:25:29

这是另一个简单的句子

( echo 0 ; sed 's/$/ +/' foo ; echo p ) | dc

这假设数字是整数。如果你需要小数，试试

( echo 0 2k ; sed 's/$/ +/' foo ; echo p ) | dc

将2调整为所需的小数数。

2010-04-26 11:34:12

对于这样的任务，我更喜欢使用GNU数据集，因为它比perl或awk更简洁易读。例如

datamash sum 1 < myfile

其中1表示数据的第一列。

2016-09-13 10:34:22

$ perl -MList::Util=sum -le 'print sum <>' nums.txt

2014-03-13 12:59:54

对于Perl一行程序，它基本上与Ayman Hourieh回答中的awk解决方案是一样的:

 % perl -nle '$sum += $_ } END { print $sum'

如果您对Perl一行程序的功能感到好奇，可以将它们分离:

 %  perl -MO=Deparse -nle '$sum += $_ } END { print $sum'

结果是一个更冗长的程序版本，其形式是没有人会自己编写的:

BEGIN { $/ = "\n"; $\ = "\n"; }
LINE: while (defined($_ = <ARGV>)) {
    chomp $_;
    $sum += $_;
}
sub END {
    print $sum;
}
-e syntax OK

只是为了搞笑，我用一个包含1,000,000个数字(范围为0 - 9,999)的文件尝试了这个方法。在我的Mac Pro上，它几乎是立即返回的。这太糟糕了，因为我希望使用mmap会非常快，但它只是在同一时间:

use 5.010;
use File::Map qw(map_file);

map_file my $map, $ARGV[0];

$sum += $1 while $map =~ m/(\d+)/g;

say $sum;

2010-04-23 23:49:31

我如何才能快速和所有的数字在一个文件?

推荐文章

最新文章

标签