Python的数学模块包含方便的函数,如floor和ceil。这些函数接受一个浮点数,并返回该浮点数下面或上面最接近的整数。然而,这些函数以浮点数的形式返回答案。例如:

import math
f=math.floor(2.3)

现在f返回:

2.0

从这个浮点数中获取一个整数,而不存在舍入错误的风险(例如,如果浮点数等于1.99999),或者我应该完全使用另一个函数,最安全的方法是什么?


当前回答

这是不琐碎的工作在所有!IEEE浮点表表法的一个性质是:int(floor(2.3))的大小足够小,那么int(floor(2.3)) =⌊⌋。但在不同的情况下,int(floor(2.3))可能是1。

这篇文章解释了为什么它在这个范围内有效。

在double类型中,可以毫无问题地表示32位整数。不可能有舍入问题。更准确地说,双精度变量可以表示253和-253之间的所有整数。

简单解释一下:double最多可以存储53个二进制数字。当您需要更多时,数字在右侧用零填充。

由此可见,53个1是在没有填充的情况下可以存储的最大数字。自然地,所有需要较少数字的(整数)数字都可以被准确地存储。

111(省略)111(53个one)加1等于100…000(53个0)。我们知道,我们可以存储53位数字,这使得最右边的填充为零。

253就是这么来的。


更多细节:我们需要考虑IEEE-754浮点是如何工作的。

  1 bit    11 / 8     52 / 23      # bits double/single precision
[ sign |  exponent | mantissa ]

然后计算该数字如下(不包括这里无关的特殊情况):

-1号× 1。尾数×2exponent -偏差

其中偏差= 2指数- 1 - 1,即双精度和单精度分别为1023和127。

知道乘以2X只是将所有的位向左移动X位,很容易看出任何整数的尾数中所有的位都必须在小数点的右边为零。

除0以外的任何整数在二进制中都有以下形式:

1 x…x,其中x表示MSB(最高有效位)右侧的位。

因为我们排除了0,所以总有一个MSB是1,这就是它不被存储的原因。要存储整数,必须将其转换为前面提到的形式:-1sign × 1。尾数×2exponent -偏差。

也就是说小数点上移位直到只有MSB往左。小数点右边的所有位都存储在尾数中。

从这里,我们可以看到,除了MSB,我们最多可以存储52个二进制数字。

因此,所有显式存储的位的最大值为

111(omitted)111.   that's 53 ones (52 + implicit 1) in the case of doubles.

为此,我们需要设置指数,这样小数点将移动52位。如果我们要把指数加1,我们就不知道小数点后从右到左的数字。

111(omitted)111x.

按照惯例,它是0。将整个尾数设置为0,我们收到以下数字:

100(omitted)00x. = 100(omitted)000.

1后面跟着53个0,52个存起来,1个加起来。

它表示253,它标志着我们可以准确表示所有整数的边界(负数和正数)。如果我们想给253加1,我们必须将隐式0(用x表示)设为1,但这是不可能的。

其他回答

使用int(你的非整数)将解决它。

print int(2.3) # "2"
print int(math.sqrt(5)) # "2"

数学。Floor将始终返回一个整数,因此int(math.floor(some_float))将永远不会引入舍入错误。

不过,舍入错误可能已经在math.floor(some_large_float)中引入,甚至在首先将一个大数存储在浮点数中时也引入了。(较大的数字在浮点数中存储时可能会失去精度。)

既然你问的是“最安全”的方法,我就提供上面答案之外的另一个答案。

确保不丢失精度的一个简单方法是检查转换后的值是否相等。

if int(some_value) == some_value:
     some_value = int(some_value)

例如,如果浮点数为1.0,则1.0等于1。所以int的转换将会执行。如果浮点数为1.1,则int(1.1)等于1,并且1.1 != 1。所以这个值仍然是浮点数,你不会失去任何精度。

结合前面的两个结果,我们得到:

int(round(some_float))

这相当可靠地将浮点数转换为整数。

所有可以用浮点数表示的整数都有精确的表示法。所以你可以安全地对结果使用int。只有当您试图表示一个分母不是2的幂的有理数时,才会出现不精确的表示。

这是不琐碎的工作在所有!IEEE浮点表表法的一个性质是:int(floor(2.3))的大小足够小,那么int(floor(2.3)) =⌊⌋。但在不同的情况下,int(floor(2.3))可能是1。

引用维基百科,

任何绝对值小于等于224的整数都可以用单精度格式精确表示,任何绝对值小于等于253的整数都可以用双精度格式精确表示。