在Python中哪个更快:x**。5还是math.sqrt(x)?

我想了很久了。就像题目说的，哪个更快，是实际函数还是简单地取1 / 2次幂?

更新

这不是一个过早优化的问题。这只是一个底层代码如何实际工作的问题。Python代码的工作原理是什么?

我给Guido van Rossum发了一封邮件，因为我真的很想知道这些方法的区别。

我的电子邮件:

在Python中至少有3种方法来求平方根:math。返回值, '**'运算符和pow(x，.5)。我只是好奇它们之间的区别每一个的实现。说到效率是更好吗?

他的回答:

Pow和**是等价的;数学。根号方根不适用于复数，并链接到C的sqrt()函数。至于哪一个是快点，我不知道……

当前回答

我最近解决的SQRMINSUM问题需要在一个大型数据集上重复计算平方根。在我做其他优化之前，我历史上最老的2个提交，唯一的区别是用sqrt()替换**0.5，从而将PyPy中的运行时从3.74秒减少到0.51秒。这几乎是克劳狄测量的400%的巨大改进的两倍。

2017-11-23 14:37:13

其他回答

在这些微观基准测试中，数学。SQRT会慢一些，因为在数学名称空间中查找SQRT所花费的时间很少。你可以用

 from math import sqrt

即使这样，在timeit中运行一些变化，显示x**的轻微(4-5%)性能优势。5

有趣的是,做

 import math
 sqrt = math.sqrt

进一步加速，速度差异在1%以内，几乎没有统计学意义。

我将重复Kibbee，并说这可能是一个不成熟的优化。

2008-11-29 01:45:49

有人评论《雷神之锤3》中的“快速牛顿-拉弗森平方根”……我用ctypes实现了它，但与本机版本相比，它非常慢。我将尝试一些优化和替代实现。

from ctypes import c_float, c_long, byref, POINTER, cast

def sqrt(num):
 xhalf = 0.5*num
 x = c_float(num)
 i = cast(byref(x), POINTER(c_long)).contents.value
 i = c_long(0x5f375a86 - (i>>1))
 x = cast(byref(i), POINTER(c_float)).contents.value

 x = x*(1.5-xhalf*x*x)
 x = x*(1.5-xhalf*x*x)
 return x * num

这是另一个使用struct的方法，比ctypes版本快3.6倍，但仍然是C的1/10。

from struct import pack, unpack

def sqrt_struct(num):
 xhalf = 0.5*num
 i = unpack('L', pack('f', 28.0))[0]
 i = 0x5f375a86 - (i>>1)
 x = unpack('f', pack('L', i))[0]

 x = x*(1.5-xhalf*x*x)
 x = x*(1.5-xhalf*x*x)
 return x * num

2010-04-23 05:27:31

很可能是math.sqrt(x)，因为它针对平方根进行了优化。

基准测试将为您提供您正在寻找的答案。

2008-11-29 01:25:16

在python 2.6中，(float).__pow__()函数使用C pow()函数，math.sqrt()函数使用C sqrt()函数。

在glibc编译器中，pow(x,y)的实现相当复杂，并且针对各种例外情况进行了很好的优化。例如，调用C pow(x,0.5)只调用sqrt()函数。

**或数学使用速度的差异。sqrt是由围绕C函数的包装器引起的，速度很大程度上取决于系统上使用的优化标志/C编译器。

编辑:

这是克劳狄算法在我机器上的结果。我得到了不同的结果:

zoltan@host:~$ python2.4 p.py 
Took 0.173994 seconds
Took 0.158991 seconds
zoltan@host:~$ python2.5 p.py 
Took 0.182321 seconds
Took 0.155394 seconds
zoltan@host:~$ python2.6 p.py 
Took 0.166766 seconds
Took 0.097018 seconds

2010-04-23 04:17:49

python要优化的是可读性。为此，我认为显式地使用平方根函数是最好的。话虽如此，我们还是来研究一下性能。

我为Python 3更新了Claudiu的代码，并使其不可能优化计算(未来一个优秀的Python编译器可能会做的事情):

from sys import version
from time import time
from math import sqrt, pi, e

print(version)

N = 1_000_000

def timeit1():
  z = N * e
  s = time()
  for n in range(N):
    z += (n * pi) ** .5 - z ** .5
  print (f"Took {(time() - s):.4f} seconds to calculate {z}")

def timeit2():
  z = N * e
  s = time()
  for n in range(N):
    z += sqrt(n * pi) - sqrt(z)
  print (f"Took {(time() - s):.4f} seconds to calculate {z}")

def timeit3(arg=sqrt):
  z = N * e
  s = time()
  for n in range(N):
    z += arg(n * pi) - arg(z)
  print (f"Took {(time() - s):.4f} seconds to calculate {z}")

timeit1()
timeit2()
timeit3()

结果不同，但一个示例输出是:

3.6.6 (default, Jul 19 2018, 14:25:17) 
[GCC 8.1.1 20180712 (Red Hat 8.1.1-5)]
Took 0.3747 seconds to calculate 3130485.5713865166
Took 0.2899 seconds to calculate 3130485.5713865166
Took 0.2635 seconds to calculate 3130485.5713865166

还有一个最近的输出:

3.7.4 (default, Jul  9 2019, 16:48:28) 
[GCC 8.3.1 20190223 (Red Hat 8.3.1-2)]
Took 0.2583 seconds to calculate 3130485.5713865166
Took 0.1612 seconds to calculate 3130485.5713865166
Took 0.1563 seconds to calculate 3130485.5713865166

你自己试试。

2018-10-18 08:52:10

在Python中哪个更快:x**。5还是math.sqrt(x)?

推荐文章

最新文章

标签