我正在寻找一个命令,它将接受(作为输入)多行文本,每行包含一个整数,并输出这些整数的和。
作为一点背景知识,我有一个日志文件,其中包括计时测量。通过grepping的相关行和一点sed重新格式化,我可以列出该文件中的所有时间。我想算出总数。我可以将这个中间输出输出到任何命令,以便进行最终求和。我过去一直使用expr,但除非它在RPN模式下运行,否则我不认为它会处理这个问题(即使这样也会很棘手)。
我怎样才能得到整数的和?
我正在寻找一个命令,它将接受(作为输入)多行文本,每行包含一个整数,并输出这些整数的和。
作为一点背景知识,我有一个日志文件,其中包括计时测量。通过grepping的相关行和一点sed重新格式化,我可以列出该文件中的所有时间。我想算出总数。我可以将这个中间输出输出到任何命令,以便进行最终求和。我过去一直使用expr,但除非它在RPN模式下运行,否则我不认为它会处理这个问题(即使这样也会很棘手)。
我怎样才能得到整数的和?
当前回答
一点awk就行了?
awk '{s+=$1} END {print s}' mydatafile
注意:如果要添加超过2^31(2147483647)的值,某些版本的awk会有一些奇怪的行为。查看评论了解更多背景信息。一个建议是使用printf而不是print:
awk '{s+=$1} END {printf "%.0f", s}' mydatafile
其他回答
C(未简化)
seq 1 10 | tcc -run <(cat << EOF
#include <stdio.h>
int main(int argc, char** argv) {
int sum = 0;
int i = 0;
while(scanf("%d", &i) == 1) {
sum = sum + i;
}
printf("%d\n", sum);
return 0;
}
EOF)
下面是一个漂亮而干净的Raku(以前称为Perl 6)一行程序:
say [+] slurp.lines
我们可以这样使用它:
% seq 10 | raku -e "say [+] slurp.lines"
55
它是这样工作的:
不带任何参数的Slurp默认从标准输入读取;它返回一个字符串。在字符串上调用lines方法将返回字符串的行列表。
+周围的括号将+转换为一个约简元操作符,将列表缩减为一个值:列表中值的和。Say然后用换行符将其打印到标准输出。
需要注意的一点是,我们从未显式地将行转换为数字——raku足够聪明,可以为我们做到这一点。然而,这意味着我们的代码在输入绝对不是数字时中断:
% echo "1\n2\nnot a number" | raku -e "say [+] slurp.lines"
Cannot convert string to number: base-10 number must begin with valid digits or '.' in '⏏not a number' (indicated by ⏏)
in block <unit> at -e line 1
提前为反勾号(“'”)的可读性道歉,但这些在shell中工作,而不是bash,因此更易于粘贴。如果你使用一个接受它的shell, $(command…)格式比' command…所以为了你的理智,请随意修改。
我在bashrc中有一个简单的函数,它将使用awk来计算一些简单的数学项
calc(){
awk 'BEGIN{print '"$@"' }'
}
这将做 +,-,*,/,^,%, √6,罪恶,因为,括号……(取决于你的awk版本)…你甚至可以用printf和格式化浮点输出,但这是我通常需要的
对于这个特定的问题,我将对每一行简单地这样做:
calc `echo "$@"|tr " " "+"`
所以对每一行求和的代码块看起来像这样:
while read LINE || [ "$LINE" ]; do
calc `echo "$LINE"|tr " " "+"` #you may want to filter out some lines with a case statement here
done
如果你想逐行求和的话。但是,对于数据文件中的每个数字的总数
VARS=`<datafile`
calc `echo ${VARS// /+}`
顺便说一句,如果我需要在桌面上快速做一些事情,我使用这个:
xcalc() {
A=`calc "$@"`
A=`Xdialog --stdout --inputbox "Simple calculator" 0 0 $A`
[ $A ] && xcalc $A
}
您可以使用num-utils,尽管对于您所需要的来说它可能太过了。这是一组用于在shell中操作数字的程序,可以做一些漂亮的事情,当然包括将它们相加。它有点过时了,但它们仍然有效,如果你需要做更多的事情,它们可以很有用。
https://suso.suso.org/programs/num-utils/index.phtml
使用起来非常简单:
$ seq 10 | numsum
55
但内存不足,无法输入大量数据。
$ seq 100000000 | numsum
Terminado (killed)
我对现有的答案做了一个快速的基准测试
只使用标准工具(不好意思像lua或rocket), 都是真正的俏皮话, 能够添加大量的数字(1亿),和 速度很快(我忽略了那些超过一分钟的)。
我总是把数字从1亿加到1亿,这在我的机器上可以在一分钟内完成几个解决方案。
以下是调查结果:
Python
:; seq 100000000 | python -c 'import sys; print sum(map(int, sys.stdin))'
5000000050000000
# 30s
:; seq 100000000 | python -c 'import sys; print sum(int(s) for s in sys.stdin)'
5000000050000000
# 38s
:; seq 100000000 | python3 -c 'import sys; print(sum(int(s) for s in sys.stdin))'
5000000050000000
# 27s
:; seq 100000000 | python3 -c 'import sys; print(sum(map(int, sys.stdin)))'
5000000050000000
# 22s
:; seq 100000000 | pypy -c 'import sys; print(sum(map(int, sys.stdin)))'
5000000050000000
# 11s
:; seq 100000000 | pypy -c 'import sys; print(sum(int(s) for s in sys.stdin))'
5000000050000000
# 11s
Awk
:; seq 100000000 | awk '{s+=$1} END {print s}'
5000000050000000
# 22s
膏& Bc
我的机器内存不足了。它适用于一半大小的输入(5000万个数字):
:; seq 50000000 | paste -s -d+ - | bc
1250000025000000
# 17s
:; seq 50000001 100000000 | paste -s -d+ - | bc
3750000025000000
# 18s
所以我猜1亿个数字大约需要35秒。
Perl
:; seq 100000000 | perl -lne '$x += $_; END { print $x; }'
5000000050000000
# 15s
:; seq 100000000 | perl -e 'map {$x += $_} <> and print $x'
5000000050000000
# 48s
Ruby
:; seq 100000000 | ruby -e "puts ARGF.map(&:to_i).inject(&:+)"
5000000050000000
# 30s
C
为了比较起见,我编译了C版本并进行了测试,只是为了了解基于工具的解决方案有多慢。
#include <stdio.h>
int main(int argc, char** argv) {
long sum = 0;
long i = 0;
while(scanf("%ld", &i) == 1) {
sum = sum + i;
}
printf("%ld\n", sum);
return 0;
}
:; seq 100000000 | ./a.out
5000000050000000
# 8s
结论
C当然是用8秒最快的,但Pypy解决方案只增加了很少的开销,约为11秒的30%。但是,公平地说,Pypy并不是完全标准的。大多数人只安装了CPython,它非常慢(22秒),和流行的Awk解决方案一样快。
基于标准工具的最快解决方案是Perl(15秒)。