如何评测Python脚本？

Project Euler和其他编码竞赛通常有最长的运行时间，或者人们吹嘘他们的特定解决方案运行速度有多快。对于Python，有时方法有些笨拙——即向__main__添加计时代码。

描述Python程序运行时间的好方法是什么？

当前回答

@Maxy对这个答案的评论对我帮助很大，我认为它应该得到自己的答案：我已经有了cProfile生成的.pstats文件，我不想用pycallgraph重新运行这些文件，所以我使用了gprof2dot，得到了很好的svgs：

$ sudo apt-get install graphviz
$ git clone https://github.com/jrfonseca/gprof2dot
$ ln -s "$PWD"/gprof2dot/gprof2dot.py ~/bin
$ cd $PROJECT_DIR
$ gprof2dot.py -f pstats profile.pstats | dot -Tsvg -o callgraph.svg

还有BLAM！

它使用点（与pycallgraph使用的相同），因此输出看起来类似。我觉得gprof2dot丢失的信息更少：

2012-12-11 23:16:39

其他回答

获取IPython笔记本上的快速配置文件统计信息。人们可以将line_profiler和memory_profile直接嵌入到笔记本中。

另一个有用的包是Pympler。它是一个强大的评测包，能够跟踪类、对象、函数、内存泄漏等。

了解了！

!pip install line_profiler
!pip install memory_profiler
!pip install pympler

加载它！

%load_ext line_profiler
%load_ext memory_profiler

使用它！

%时间

%time print('Outputs CPU time,Wall Clock time') 
#CPU times: user 2 µs, sys: 0 ns, total: 2 µs Wall time: 5.96 µs

给予：

CPU时间：CPU级执行时间systimes:系统级执行时间总计：CPU时间+系统时间墙上时间：墙上时钟时间

%计时

%timeit -r 7 -n 1000 print('Outputs execution time of the snippet') 
#1000 loops, best of 7: 7.46 ns per loop

给出给定循环次数（n）中的最佳运行次数（r）。输出系统缓存的详细信息：当代码片段被多次执行时，系统会缓存一些操作并不再执行，这可能会影响概要文件报告的准确性。

%普鲁士人

%prun -s cumulative 'Code to profile'

给予：

函数调用数（ncall）每个函数调用有个条目（不同）每次呼叫所用时间（百分比）到函数调用为止的时间（cumtime）调用的函数/模块的名称等。。。

%记忆，记忆

%memit 'Code to profile'
#peak memory: 199.45 MiB, increment: 0.00 MiB

给予：

内存使用情况

%低压运行

#Example function
def fun():
  for i in range(10):
    print(i)

#Usage: %lprun <name_of_the_function> function
%lprun -f fun fun()

给予：

按行统计

系统大小

sys.getsizeof('code to profile')
# 64 bytes

返回对象的大小（以字节为单位）。

来自pympler的asizeof（）

from pympler import asizeof
obj = [1,2,("hey","ha"),3]
print(asizeof.asizeof(obj,stats=4))

pympler.asizeof可用于调查某些Python对象消耗多少内存。与sys.getsizeof不同，asizeof递归地调整对象大小

来自pympler的跟踪器

from pympler import tracker
tr = tracker.SummaryTracker()
def fun():
  li = [1,2,3]
  di = {"ha":"haha","duh":"Umm"}
fun()
tr.print_diff()

跟踪函数的生存期。

Pympler包包含大量用于评测代码的高实用函数。这里无法涵盖所有这些。有关详细的概要文件实现，请参阅随附的文档。

Pympler文档

2020-05-25 15:07:39

值得指出的是，使用探查器仅在主线程上有效（默认情况下），如果使用它们，您将无法从其他线程获得任何信息。这可能有点棘手，因为探查器文档中完全没有提到它。

如果您还想评测线程，那么您需要查看文档中的threading.setprofile（）函数。

您也可以创建自己的线程.Thread子类：

class ProfiledThread(threading.Thread):
    # Overrides threading.Thread.run()
    def run(self):
        profiler = cProfile.Profile()
        try:
            return profiler.runcall(threading.Thread.run, self)
        finally:
            profiler.dump_stats('myprofile-%d.profile' % (self.ident,))

并使用ProfiledThread类而不是标准类。它可能会给你更多的灵活性，但我不确定它是否值得，特别是如果你使用的是不使用你的类的第三方代码。

2009-12-17 16:30:34

cProfile非常适合快速分析，但大多数时候它都以错误结束。函数runctx通过正确初始化环境和变量来解决这个问题，希望它对某些人有用：

import cProfile
cProfile.runctx('foo()', None, locals())

2015-03-30 11:11:13

在Virtaal的源代码中，有一个非常有用的类和装饰器，它可以使分析（甚至对于特定的方法/函数）非常简单。然后可以在KCacheGrind中非常舒适地查看输出。

2009-02-24 20:31:10

不久前，我制作了pycallgraph，它从您的Python代码生成可视化。编辑：我已经将示例更新为使用3.3，这是本文撰写时的最新版本。

在pip安装pycallgraph并安装GraphViz之后，您可以从命令行运行它：

pycallgraph graphviz -- ./mypythonscript.py

或者，您可以分析代码的特定部分：

from pycallgraph import PyCallGraph
from pycallgraph.output import GraphvizOutput

with PyCallGraph(output=GraphvizOutput()):
    code_to_profile()

其中任何一个都将生成类似下图的pycallgraph.png文件：

2012-08-06 05:37:07

如何评测Python脚本？

推荐文章

最新文章

标签