我如何才能快速和所有的数字在一个文件?

我有一个包含数千个数字的文件，每个数字都在自己的行上:

我想写一个脚本，它将打印文件中所有数字的总和。我有一个解决办法，但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?

当前回答

到目前为止，没有一个解决方案使用浆糊。这里有一个:

paste -sd+ filename | bc

如果文件有一个尾随换行符，尾随+将导致语法错误。通过移除后面的+来修复错误:

paste -sd+ fiilename | sed 's/+$//g' | bc

例如，计算Σn，其中1<=n<=100000:

$ seq 100000 | paste -sd+ | bc -l
5000050000

(对于好奇的人来说，seqn会在给定正数n的情况下打印从1到n的数字序列。)

2013-12-07 05:27:42

其他回答

到目前为止，没有一个解决方案使用浆糊。这里有一个:

paste -sd+ filename | bc

如果文件有一个尾随换行符，尾随+将导致语法错误。通过移除后面的+来修复错误:

paste -sd+ fiilename | sed 's/+$//g' | bc

例如，计算Σn，其中1<=n<=100000:

$ seq 100000 | paste -sd+ | bc -l
5000050000

(对于好奇的人来说，seqn会在给定正数n的情况下打印从1到n的数字序列。)

2013-12-07 05:27:42

下面是一个使用python和生成器表达式的解决方案。在我破旧的笔记本电脑上测试了无数个数字。

time python -c "import sys; print sum((float(l) for l in sys.stdin))" < file

real    0m0.619s
user    0m0.512s
sys     0m0.028s

2013-08-22 12:05:19

更简洁:

# Ruby
ruby -e 'puts open("random_numbers").map(&:to_i).reduce(:+)'

# Python
python -c 'print(sum(int(l) for l in open("random_numbers")))'

2015-09-13 19:43:28

sed ':a;N;s/\n/+/;ta' file|bc

2010-04-24 02:32:53

C总是以速度取胜:

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char **argv) {
    ssize_t read;
    char *line = NULL;
    size_t len = 0;
    double sum = 0.0;

    while (read = getline(&line, &len, stdin) != -1) {
        sum += atof(line);
    }

    printf("%f", sum);
    return 0;
}

1M数字的计时(与我的python答案相同的机器/输入):

$ gcc sum.c -o sum && time ./sum < numbers 
5003371677.000000
real    0m0.188s
user    0m0.180s
sys     0m0.000s

2013-08-22 12:25:29

我如何才能快速和所有的数字在一个文件?

推荐文章

最新文章

标签