Python内置len()函数的代价是什么?(列表/元组/字符串/字典)
当前回答
在这些数据类型上调用len()是CPython中的O(1), CPython是Python语言的官方和最常见的实现。这里有一个表的链接,它提供了CPython中许多不同函数的算法复杂度:
TimeComplexity Python Wiki页面
其他回答
所有这些对象都记录自己的长度。提取长度的时间很短(大O表示法中的O(1)),主要由[粗略描述,用Python术语编写,而不是C术语]组成:在字典中查找“len”并将其分派给内置len函数,该函数将查找对象的__len__方法并调用它…它所要做的就是返回self。length
下面的测量结果证明,对于常用的数据结构,len()为O(1)。
关于timeit的注意事项:当使用-s标志并将两个字符串传递给timeit时,第一个字符串只执行一次,并且不计时。
列表:
$ python -m timeit -s "l = range(10);" "len(l)"
10000000 loops, best of 3: 0.0677 usec per loop
$ python -m timeit -s "l = range(1000000);" "len(l)"
10000000 loops, best of 3: 0.0688 usec per loop
元组:
$ python -m timeit -s "t = (1,)*10;" "len(t)"
10000000 loops, best of 3: 0.0712 usec per loop
$ python -m timeit -s "t = (1,)*1000000;" "len(t)"
10000000 loops, best of 3: 0.0699 usec per loop
字符串:
$ python -m timeit -s "s = '1'*10;" "len(s)"
10000000 loops, best of 3: 0.0713 usec per loop
$ python -m timeit -s "s = '1'*1000000;" "len(s)"
10000000 loops, best of 3: 0.0686 usec per loop
字典(Dictionary -comprehension在2.7+中可用):
$ python -mtimeit -s"d = {i:j for i,j in enumerate(range(10))};" "len(d)"
10000000 loops, best of 3: 0.0711 usec per loop
$ python -mtimeit -s"d = {i:j for i,j in enumerate(range(1000000))};" "len(d)"
10000000 loops, best of 3: 0.0727 usec per loop
数组:
$ python -mtimeit -s"import array;a=array.array('i',range(10));" "len(a)"
10000000 loops, best of 3: 0.0682 usec per loop
$ python -mtimeit -s"import array;a=array.array('i',range(1000000));" "len(a)"
10000000 loops, best of 3: 0.0753 usec per loop
Set (Set -comprehension在2.7+中可用):
$ python -mtimeit -s"s = {i for i in range(10)};" "len(s)"
10000000 loops, best of 3: 0.0754 usec per loop
$ python -mtimeit -s"s = {i for i in range(1000000)};" "len(s)"
10000000 loops, best of 3: 0.0713 usec per loop
发现:
$ python -mtimeit -s"from collections import deque;d=deque(range(10));" "len(d)"
100000000 loops, best of 3: 0.0163 usec per loop
$ python -mtimeit -s"from collections import deque;d=deque(range(1000000));" "len(d)"
100000000 loops, best of 3: 0.0163 usec per loop
在这些数据类型上调用len()是CPython中的O(1), CPython是Python语言的官方和最常见的实现。这里有一个表的链接,它提供了CPython中许多不同函数的算法复杂度:
TimeComplexity Python Wiki页面
len是O(1),因为在RAM中,列表存储为表(一系列连续的地址)。要知道表何时停止,计算机需要两个东西:长度和起点。这就是为什么len()是O(1),计算机存储值,所以它只需要查找它。
它是O(1)(常数时间,不依赖于元素的实际长度-非常快)对于你提到的每一种类型,加上set和其他如array.array。
推荐文章
- 如何更新SQLAlchemy行条目?
- name 'reduce'在Python中没有定义
- 如何计算一个NumPy bool数组中的真实元素的数量
- 在python中,在函数结束(例如检查失败)之前退出函数(没有返回值)的最佳方法是什么?
- 在Python中检查一个单词是否在字符串中
- Python glob多个文件类型
- 如何可靠地打开与当前运行脚本在同一目录下的文件
- Python csv字符串到数组
- 如何用动态规划确定最长递增子序列?
- 在c++程序中以编程方式检测字节序
- 理解递归
- 如何在Python中进行热编码?
- 如何嵌入HTML到IPython输出?
- 在Python生成器上使用“send”函数的目的是什么?
- 段树、区间树、二叉索引树和范围树之间有什么区别?