博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
关于Python Profilers性能分析器
阅读量:6902 次
发布时间:2019-06-27

本文共 2206 字,大约阅读时间需要 7 分钟。

想了解一下python的性能调试方法,结果就看到这一篇文章,想翻译下来作个记录

原文来自于:

1. 介绍性能分析器

profiler是一个程序,用来描述运行时的程序性能,并且从不同方面提供统计数据加以表述。Python中含有3个模块提供这样的功能,分别是cProfile, profile和pstats。这些分析器提供的是对Python程序的确定性分析。同时也提供一系列的报表生成工具,允许用户快速地检查分析结果。

Python标准库提供了3个不同的性能分析器:

  1. cProfile,推荐给大部分的用户,是C的一个扩展应用,因为其合理的运行开销,所以适合分析运行时间较长的。是基于lsprof。
  2. profile,一个纯python模块,它的接口和cProfile一致。在分析程序时,增加了很大的运行开销。如果你想扩展profiler的功能,可以试着继承这个模块
  3. hotshot, 一个试验性的c模块,关注减少分析时的运行开销,但是是以需要更长的数据后处理的次数为代价。不过这个模块不再被维护,也有可能在新的python版本中被弃用。

2. 使用方法

def foo():    sum = 0    for i in range(10000):        sum += i    sumA = bar()    sumB = bar()    return sum    def bar():    sum = 0    for i in range(100000):        sum += i    return sum if __name__ == "__main__":    import cProfile    #直接把分析结果打印到控制台    cProfile.run("foo()")    #把分析结果保存到文件中,不过内容可读性差...需要调用pstats模块分析结果    cProfile.run("foo()", "result")    #还可以直接使用命令行进行操作    #>python -m cProfile myscript.py -o result        import pstats    #创建Stats对象    p = pstats.Stats("result")    #这一行的效果和直接运行cProfile.run("foo()")的显示效果是一样的    p.strip_dirs().sort_stats(-1).print_stats()    #strip_dirs():从所有模块名中去掉无关的路径信息    #sort_stats():把打印信息按照标准的module/name/line字符串进行排序    #print_stats():打印出所有分析信息    #按照函数名排序     p.strip_dirs().sort_stats("name").print_stats()    #按照在一个函数中累积的运行时间进行排序    #print_stats(3):只打印前3行函数的信息,参数还可为小数,表示前百分之几的函数信息    p.strip_dirs().sort_stats("cumulative").print_stats(3)    #还有一种用法    p.sort_stats('time', 'cum').print_stats(.5, 'foo')    #先按time排序,再按cumulative时间排序,然后打倒出前50%中含有函数信息    #如果想知道有哪些函数调用了bar,可使用    p.print_callers(0.5, "bar")    #同理,查看foo()函数中调用了哪些函数    p.print_callees("foo")

以上是profile以及pstats模块的简单应用.

3.分析结果图解

4. 什么是确定性性能分析(Deterministic Profiling)

确定性性能分析指的是反映所有的函数调用,返回,和异常事件的执行所用的时间,以及它们之间的时间间隔。相比之下,统计性性能分析指的是取样有效的程序指令,然后推导出所需要的时间,后者花费比较少的开销,但是给出的结果不够精确。

在Python中,因为其是解释性语言,所以在执行程序的时候,会加入解释器的执行,这部分的执行是不需要进行性能分析的。Python自动为每一个事件提供一个hook,来定位需要分析的代码。除此之外,因为Python解释型语言的本质往往需要在执行程序的时候加入很多其它的开销,而确定性性能分析只会加入一点点处理开销。这样一来,确定性性能分析其实开销不大,还可以提供丰富的统计信息。

函数调用次数的统计能够被用于确定程序中的bug,比如一个不符合常理的次数,明显偏多之类的,还可以用来确定可能的内联函数。函数内部运行时间的统计可被用来确定”hot loops”,那些需要运行时间过长,需要优化的部分;累积时间的统计可被用来确定比较高层次的错误,比如算法选择上的错误。Python的性能分析可以允许直接比较算法的递归实现与迭代实现的。

转载于:https://www.cnblogs.com/btchenguang/archive/2012/02/03/2337112.html

你可能感兴趣的文章
外链的理解
查看>>
机器学习:选对时机直线超车
查看>>
Java基础基本常识
查看>>
谈谈Python实战数据可视化之matplotlib模块(实战篇)
查看>>
2.27linux和windows互传文件 3.1 用户配置文件和密码配置文件 3.2 用户组管理
查看>>
Java程序员需要技术能力达到什么程度,才能拿到月薪30k?
查看>>
Java之品优购课程讲义_day14(5)
查看>>
Jenkins 持续集成使用教程
查看>>
MongoDB复制集
查看>>
oracle sql
查看>>
强制弹出页面代码(以及自动最小化功能)
查看>>
关于Centos7无法连接网络,安装tree命令及修改ONBOOT选项后退出的程序!
查看>>
VRRP单备份配置
查看>>
好程序员学习笔记:函数
查看>>
如何打造工业物联网帝国?
查看>>
Linux系统安全之grub密码和用户权限
查看>>
超人学院Hadoop大数据资源分享
查看>>
C# 压缩PDF图片
查看>>
mouseover事件mouseenter事件
查看>>
mysql 截取字符串
查看>>