我有一个包含数千个数字的文件,每个数字都在自己的行上:
34
42
11
6
2
99
...
我想写一个脚本,它将打印文件中所有数字的总和。我有一个解决办法,但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?
我有一个包含数千个数字的文件,每个数字都在自己的行上:
34
42
11
6
2
99
...
我想写一个脚本,它将打印文件中所有数字的总和。我有一个解决办法,但不是很有效。(运行需要几分钟。)我在寻找一个更有效的解决方案。有什么建议吗?
当前回答
我不能只是路过……下面是我的Haskell俏皮话。它实际上是相当可读的:
sum <$> (read <$>) <$> lines <$> getContents
不幸的是,没有ghci -e来运行它,所以它需要main函数、打印和编译。
main = (sum <$> (read <$>) <$> lines <$> getContents) >>= print
为了澄清,我们读取整个输入(getContents),按行分割,读取为数字和和。<$>是fmap操作符-我们使用它而不是通常的函数应用程序,因为这一切都发生在IO中。Read需要一个额外的fmap,因为它也在列表中。
$ ghc sum.hs
[1 of 1] Compiling Main ( sum.hs, sum.o )
Linking sum ...
$ ./sum
1
2
4
^D
7
下面是一个奇怪的升级,让它与浮动一起工作:
main = ((0.0 + ) <$> sum <$> (read <$>) <$> lines <$> getContents) >>= print
$ ./sum
1.3
2.1
4.2
^D
7.6000000000000005
其他回答
Ruby:
ruby -e "File.read('file.txt').split.inject(0){|mem, obj| mem += obj.to_f}"
Bash变体
raw=$(cat file)
echo $(( ${raw//$'\n'/+} ))
$ wc -l file
10000 file
$ time ./test
323390
real 0m3,096s
user 0m3,095s
sys 0m0,000s
这里发生了什么?读取一个文件的内容到$raw var中,然后通过将所有新行更改为“+”来从该var创建数学语句
我更喜欢用R来表示:
$ R -e 'sum(scan("filename"))'
对于Perl一行程序,它基本上与Ayman Hourieh回答中的awk解决方案是一样的:
% perl -nle '$sum += $_ } END { print $sum'
如果您对Perl一行程序的功能感到好奇,可以将它们分离:
% perl -MO=Deparse -nle '$sum += $_ } END { print $sum'
结果是一个更冗长的程序版本,其形式是没有人会自己编写的:
BEGIN { $/ = "\n"; $\ = "\n"; }
LINE: while (defined($_ = <ARGV>)) {
chomp $_;
$sum += $_;
}
sub END {
print $sum;
}
-e syntax OK
只是为了搞笑,我用一个包含1,000,000个数字(范围为0 - 9,999)的文件尝试了这个方法。在我的Mac Pro上,它几乎是立即返回的。这太糟糕了,因为我希望使用mmap会非常快,但它只是在同一时间:
use 5.010;
use File::Map qw(map_file);
map_file my $map, $ARGV[0];
$sum += $1 while $map =~ m/(\d+)/g;
say $sum;
我不能只是路过……下面是我的Haskell俏皮话。它实际上是相当可读的:
sum <$> (read <$>) <$> lines <$> getContents
不幸的是,没有ghci -e来运行它,所以它需要main函数、打印和编译。
main = (sum <$> (read <$>) <$> lines <$> getContents) >>= print
为了澄清,我们读取整个输入(getContents),按行分割,读取为数字和和。<$>是fmap操作符-我们使用它而不是通常的函数应用程序,因为这一切都发生在IO中。Read需要一个额外的fmap,因为它也在列表中。
$ ghc sum.hs
[1 of 1] Compiling Main ( sum.hs, sum.o )
Linking sum ...
$ ./sum
1
2
4
^D
7
下面是一个奇怪的升级,让它与浮动一起工作:
main = ((0.0 + ) <$> sum <$> (read <$>) <$> lines <$> getContents) >>= print
$ ./sum
1.3
2.1
4.2
^D
7.6000000000000005