有几个关于浮点表示法的问题被提交给了SO。例如,十进制数0.1没有精确的二进制表示,因此使用==操作符将其与另一个浮点数进行比较是危险的。我理解浮点表示法背后的原理。

我不明白的是,为什么从数学的角度来看,小数点右边的数字比左边的数字更“特殊”?

例如,数字61.0具有精确的二进制表示,因为任何数字的整数部分总是精确的。但6.10这个数字并不准确。我所做的只是把小数点移了一位突然间我就从精确乌托邦变成了不精确镇。从数学上讲,这两个数字之间不应该有本质差别——它们只是数字。

相比之下,如果我把小数点向另一个方向移动一位,得到数字610,我仍然在Exactopia。我可以继续往这个方向(6100,610000000,610000000000000)它们仍然是完全,完全,完全的。但是一旦小数点越过某个阈值,这些数字就不再精确了。

这是怎么呢

编辑:为了澄清,我不想讨论诸如IEEE之类的行业标准表示,而是坚持我所相信的数学上的“纯粹”方式。以10为基数,位置值为:

... 1000  100   10    1   1/10  1/100 ...

在二进制中,它们将是:

... 8    4    2    1    1/2  1/4  1/8 ...

这些数字也没有任意的限制。位置向左和向右无限增加。


如果你有足够的空间,十进制数可以精确地表示出来——只是不能用浮点二进制数表示。如果您使用浮点小数点类型(例如System。. net中的十进制),那么许多不能用二进制浮点数精确表示的值都可以被精确表示。

让我们从另一个角度来看——以10为基数,你可能会觉得舒服,你不能准确地表示1/3。这是0.3333333……(重复)。不能将0.1表示为二进制浮点数的原因与此完全相同。你可以表示3 9和27,但不是1/3 1/9或1/27。

问题是3是质数,不是10的因数。当你想将一个数乘以3时,这不是一个问题:你总是可以乘以一个整数而不会遇到问题。但是当你除以一个质数而不是底数的因数时,你就会遇到麻烦(如果你试图用1除以这个数,你就会遇到麻烦)。

虽然0.1通常被用作精确十进制数的最简单例子,它不能用二进制浮点数精确表示,但可以说0.2是一个更简单的例子,因为它是1/5,而5是导致十进制和二进制之间存在问题的素数。


边注:处理有限表示的问题:

Some floating decimal point types have a fixed size like System.Decimal others like java.math.BigDecimal are "arbitrarily large" - but they'll hit a limit at some point, whether it's system memory or the theoretical maximum size of an array. This is an entirely separate point to the main one of this answer, however. Even if you had a genuinely arbitrarily large number of bits to play with, you still couldn't represent decimal 0.1 exactly in a floating binary point representation. Compare that with the other way round: given an arbitrary number of decimal digits, you can exactly represent any number which is exactly representable as a floating binary point.


如果你用浮点数做一个足够大的数(它可以做指数),那么小数点前也会不精确。所以我不认为你的问题是完全正确的,因为前提是错误的;移位10并不总是会产生更高的精度,因为在某些情况下,浮点数将不得不使用指数来表示数字的大小,这样也会失去一些精度。


BCD -二进制编码的十进制-表示是精确的。它们不是很节省空间,但在这种情况下,这是为了准确性而必须做出的权衡。


问题是你并不知道这个数字是否真的是61.0。考虑一下:

浮动a = 60; 浮动b = 0.1; c = a + b * 10;

c的值是多少?它不是61,因为b不是。1因为。1不是精确的二进制表示。


根(数学)原因是,当你处理整数时,它们是可数无限的。

这意味着,即使它们的数量是无限的,我们也可以“数出”序列中的所有项目,而不会跳过任何一项。这意味着,如果我们想要在列表中的第610000000000000th位置上得到一项,我们可以通过一个公式来计算它。

然而,实数是无限的。你不能说“给我位置610000000000000的真实数字”并得到一个答案。原因是,即使在0到1之间,当考虑浮点值时,也有无限个值。这同样适用于任何两个浮点数。

更多信息:

http://en.wikipedia.org/wiki/Countable_set

http://en.wikipedia.org/wiki/Uncountable_set

更新: 很抱歉,我似乎误解了这个问题。我的回答是关于为什么我们不能表示每一个真实的值,我没有意识到浮点数被自动归类为理性。


数字61.0确实有一个精确的浮点运算——但这并不是对所有整数都适用。如果您编写了一个循环,将一个双精度浮点数和一个64位整数都加了1,最终您将达到这样的情况:64位整数完美地表示一个数字,而浮点数却不能——因为没有足够的有效位。

只是在小数点右边求近似值要容易得多。如果你把所有的数字都写成二进制浮点数,这就更有意义了。

另一种思考的方式是,当你注意到61.0完全可以用10为底表示时,移动小数点并不会改变这一点,你是在执行10的幂乘法(10^1,10^-1)。在浮点数中,乘以2的幂并不影响数字的精度。试着用61.0反复除以3来说明一个非常精确的数字是如何失去它的精确表示的。


这和你不能精确地以10为基数表示1/3的原因是一样的,你需要说0.33333(3)。在二进制中,这是相同类型的问题,只是发生在不同的数字集上。


有理数的数量是无限的,而用来表示有理数的比特的数量是有限的。见http://en.wikipedia.org/wiki/Floating_point # Accuracy_problems。


有一个阈值,因为数字的含义已经从整数变成了非整数。要表示61,有6*10^1 + 1*10^0;10^1和10^0都是整数。6.1是6*10^0 + 1*10^-1,但10^-1是1/10,显然不是整数。这就是你在不精确镇的下场。


分数和整数可以构成比例尺。有些分数,如1/7,如果没有很多很多的小数,就不能用十进制形式表示。因为浮点数是基于二进制的,所以特殊情况会发生变化,但同样的精度问题也会出现。


你们知道整数,对吧?每一位代表2^n

2 ^ 4 = 16 2 ^ 3 = 8 2 ^ 2 = 4 2 ^ 1 = 2 2 ^ 0 = 1

浮点数也是一样的(有一些区别),但是比特代表2^-n 2 ^ 1 = 1/2 = 0.5 2 ^ 2 = 1 / (2 * 2) = 0.25 2 ^ 3 = 0.125 2 ^ 4 = 0.0625

浮点二进制表示法:

符号指数分数(我认为无形的1被附加到分数) B11 b10 b9 b8 b7 b6 b5 b4 b3 b2 b1 b0


(注意:我将在这里添加'b'来表示二进制数。其他数字均为十进制)

一种思考方法是用科学记数法。我们习惯看到用科学符号表示的数字,比如6.022141 * 10^23。浮点数内部使用类似的格式存储——尾数和指数,但使用2的幂而不是10。

你的61.0可以重写为1.90625 * 2^5,或者1.11101b * 2^101b加上尾数和指数。把它乘以10(移动小数点),我们可以这样做:

(1.90625 * 2 ^ 5) * 1.25 * 2 ^ (3) = 2.3828125 * 2 ^ (8) = 1.19140625 * 2 ^ (9)

或者在二进制中用尾数和指数:

(1.1110b * 2^101b) * (1.01b * 2^11b) = (10.011000b * 2^1000b) = (1.0011000b * 2^1001b)

Note what we did there to multiply the numbers. We multiplied the mantissas and added the exponents. Then, since the mantissa ended greater than two, we normalized the result by bumping the exponent. It's just like when we adjust the exponent after doing an operation on numbers in decimal scientific notation. In each case, the values that we worked with had a finite representation in binary, and so the values output by the basic multiplication and addition operations also produced values with a finite representation.

现在,考虑一下我们如何用61除以10。我们先把尾数分成1.90625和1.25。小数是1.525,一个很短的数。但是如果我们把它转换成二进制呢?我们会用通常的方法来做——尽可能减去2的最大幂,就像把整数小数转换成二进制一样,但我们将使用2的负幂:

1.525         - 1*2^0   --> 1
0.525         - 1*2^-1  --> 1
0.025         - 0*2^-2  --> 0
0.025         - 0*2^-3  --> 0
0.025         - 0*2^-4  --> 0
0.025         - 0*2^-5  --> 0
0.025         - 1*2^-6  --> 1
0.009375      - 1*2^-7  --> 1
0.0015625     - 0*2^-8  --> 0
0.0015625     - 0*2^-9  --> 0
0.0015625     - 1*2^-10 --> 1
0.0005859375  - 1*2^-11 --> 1
0.00009765625...

哦哦。现在我们有麻烦了。原来,1.90625 / 1.25 = 1.525,用二进制表示时是一个重复分数:1.1110b / 1.01b = 1.10000110011…b我们的机器只有这么多位来容纳尾数,所以它们会四舍五入,假设超过某一点是零。当你用61除以10时,你看到的错误是:

1.100001100110011001100110011001100110011……B * 2^10b 而且,说: 1.100001100110011001100110b * 2^10b

正是尾数的舍入导致了我们与浮点值相关的精度损失。即使当尾数可以精确地表示(例如,当只是两个数字相加时),如果在标准化指数后尾数需要太多数字来拟合,我们仍然会得到数字损失。

实际上,我们一直在做这样的事情,当我们把小数四舍五入到一个可管理的大小时,只给出它的前几位。因为我们用十进制表示结果,所以感觉很自然。但是如果我们四舍五入一个小数,然后把它转换成不同的底数,它看起来就像我们通过浮点四舍五入得到的小数一样难看。


这是个好问题。

你所有的问题都是基于“我们如何表示一个数字?”

所有的数字都可以用十进制表示,也可以用二进制(2的补码)表示。所有人!!

但有些(大多数)需要无穷多个元素(二进制位置为“0”或“1”,十进制表示为“0”,“1”到“9”)。

比如十进制表示的1/3(1/3 = 0.3333333…<-包含无限个“3”)

比如二进制中的0.1 (0.1 = 0.00011001100110011....<-带有无限个“0011”)

一切都在这个概念中。由于您的计算机只能考虑有限的数字集(十进制或二进制),只有一些数字可以准确地表示在您的计算机…

乔恩说过,3是质数,不是10的因数,所以1/3不能用以10为底的有限个数来表示。

即使使用任意精度的算术,以2为基数的编号位置系统也不能完全描述6.1,尽管它可以表示61。

对于6.1,我们必须使用另一种表示法(比如十进制表示法,或者允许以2为底或以10为底表示浮点值的IEEE 854)。


例如,数字61.0具有精确的二进制表示,因为任何数字的整数部分总是精确的。但6.10这个数字并不准确。我所做的只是把小数点移了一位突然间我就从精确乌托邦变成了不精确镇。从数学上讲,这两个数字之间不应该有本质差别——它们只是数字。

让我们暂时撇开以10为底和以2为底的细节。我们问一下,在以b为底的情况下,哪些数字有终止表示,哪些数字没有?稍微思考一下,我们就知道一个数字x有一个终止的b表示,当且仅当存在一个整数n,使得x b^n是一个整数。

例如,x = 11/500有一个终止10表示,因为我们可以选择n = 3,然后x b^n = 22,一个整数。但是x = 1/3不是,因为不管n取多少都不能消掉3。

第二个例子促使我们思考因子,我们可以看到,对于任何有理数x = p/q(假设是最小值),我们可以通过比较b和q的质因数分解来回答这个问题。如果q有任何不在b的质因数分解中的质因数,我们将永远无法找到一个合适的n来摆脱这些因数。

因此,对于以10为底的任何p/q,其中q有除2或5之外的素数因子,将没有终止表示。

现在回到以10和2为底,我们看到任何以10为底的有理数都是p/q的形式当q的质因数分解中只有2s和5s时;当q的质因数分解中只有2时,同样的数会有一个终止的2表示。

但其中一个案例是另一个案例的子集!每当

Q的质因数分解只有2

这显然也是正确的

Q的质因数分解只有2和5

换句话说,只要p/q有终止的2表示,p/q就有终止的10表示。然而反过来就不成立了——只要q的质因数分解中有一个5,它就会有一个终止的10表示,而不是终止的2表示。这是其他答案提到的0.1的例子。

这就是问题的答案了因为2的质因数是10的质因数的子集,所以所有以2结尾的数都是以10结尾的数,反之则不然。不是61比6.1,而是10比2。

最后提醒一下,如果有些人使用17进制,而我们的计算机使用5进制,你的直觉永远不会被这引入歧途——在这两种情况下都不会有(非零,非整数)数字终止!


上面的高分答案完全正确。

首先,你的问题中混合了以2为底和以10为底的数,然后当你把一个不能整除的数放在右边时,你就有问题了。比如十进制的1/3因为3不能整除10的幂,或者二进制的1/5不能整除2的幂。

Another comment though NEVER use equal with floating point numbers, period. Even if it is an exact representation there are some numbers in some floating point systems that can be accurately represented in more than one way (IEEE is bad about this, it is a horrible floating point spec to start with, so expect headaches). No different here 1/3 is not EQUAL to the number on your calculator 0.3333333, no matter how many 3's there are to the right of the decimal point. It is or can be close enough but is not equal. so you would expect something like 2*1/3 to not equal 2/3 depending on the rounding. Never use equal with floating point.


重复一下我在给斯基特先生的评论中所说的话:我们可以用十进制表示1/3、1/9、1/27或任何有理数。我们通过添加一个额外的符号来实现。例如,在数字的十进制展开中重复的数字上的一行。将十进制数表示为二进制数序列所需要的是1)一个二进制数序列,2)一个基数点,以及3)一些其他符号来表示序列的重复部分。

赫纳的引用符号就是一种方法。他用引号表示序列中重复的部分。文章地址:http://www.cs.toronto.edu/~hehner/ratno.pdf,维基百科词条:http://en.wikipedia.org/wiki/Quote_notation。

并没有说我们不能在表示系统中添加一个符号,所以我们可以用二进制引号表示十进制有理数,反之亦然。


我很惊讶居然没有人说过:使用连分式。任何有理数都可以用二进制有限地表示。

一些例子:

1/3 (0.3333...)

0; 3

5/9 (0.5555...)

0; 1, 1, 4

10/43 (0.232558139534883720930...).

0; 4, 3, 3

9093/18478 (0.49209871198181621387596060179673...).

0; 2, 31, 7, 8, 5

从这里开始,有多种已知的方法可以在内存中存储整数序列。

除了精确地存储数字外,连分式还有其他一些好处,比如最佳有理逼近。如果您决定提前终止连分式中的数字序列,则剩余的数字(当重新组合为分数时)将给出可能的最佳分数。这是如何找到圆周率的近似值的:

π的连分式:

3; 7, 15, 1, 292 ...

在1处终止序列,得到的分数是:

355/113

这是一个很好的有理近似。


正如我们一直在讨论的,在浮点算术中,十进制0.1不能完美地用二进制表示。

浮点和整数表示形式为所表示的数字提供网格或格子。当完成算术运算时,结果会从网格中脱落,必须通过舍入将其放回网格中。例如二进制网格上的1/10。

如果我们像一位先生建议的那样,使用二进制编码的十进制表示,我们能在网格上保持数字吗?


在等式中

2^x = y ;  
x = log(y) / log(2)

因此,我想知道我们是否可以有一个二进制的对数制,

 2^1, 2^0, 2^(log(1/2) / log(2)), 2^(log(1/4) / log(2)), 2^(log(1/8) / log(2)),2^(log(1/16) / log(2)) ........

这也许能解决问题,所以如果你想把32.41写成二进制,那就是

2^5 + 2^(log(0.4) / log(2)) + 2^(log(0.01) / log(2))

Or

2^5 + 2^(log(0.41) / log(2))

一个简单的答案是:计算机没有无限的内存来存储分数(在以科学记数法的形式表示十进制数之后)。根据IEEE 754双精度浮点数标准,我们只有53位的限制来存储分数。 欲了解更多信息:http://mathcenter.oxford.emory.edu/site/cs170/ieee754/


我不想重复其他20个答案的总结,所以我只简单地回答:

答案在你的内容中:

为什么以两为基数的数字不能精确地表示一定的比率?

出于同样的原因,小数不足以表示某些比率,即分母中包含除2或5之外的素数因子的不可约分数,至少在其小数展开的尾数中总是有一个不确定的字符串。

为什么十进制数不能精确地用二进制表示?

This question at face value is based on a misconception regarding values themselves. No number system is sufficient to represent any quantity or ratio in a manner that the thing itself tells you that it is both a quantity, and at the same time also gives the interpretation in and of itself about the intrinsic value of the representation. As such, all quantitative representations, and models in general, are symbolic and can only be understood a posteriori, namely, after one has been taught how to read and interpret these numbers.

由于模型是主观的东西,在反映现实的范围内是正确的,我们不需要严格地将二进制字符串解释为2的负幂和正幂的和。相反,我们可以观察到,我们可以创建一组任意的符号,这些符号以2为基底或任何其他基底来精确地表示任何数字或比例。只要考虑一下,我们可以用一个词甚至一个符号来指代无穷大,而不需要“显示无穷大”本身。

As an example, I am designing a binary encoding for mixed numbers so that I can have more precision and accuracy than an IEEE 754 float. At the time of writing this, the idea is to have a sign bit, a reciprocal bit, a certain number of bits for a scalar to determine how much to "magnify" the fractional portion, and then the remaining bits are divided evenly between the integer portion of a mixed number, and the latter a fixed-point number which, if the reciprocal bit is set, should be interpreted as one divided by that number. This has the benefit of allowing me to represent numbers with infinite decimal expansions by using their reciprocals which do have terminating decimal expansions, or alternatively, as a fraction directly, potentially as an approximation, depending on my needs.


你不能用二进制精确地表示0.1,就像你不能用传统的英国尺测量0.1英寸一样。

英国的尺子,就像二进制分数一样,都是关于一半的。你可以测量半英寸,或四分之一英寸(当然是一半),或八分之一,或十六分之一,等等。

If you want to measure a tenth of an inch, though, you're out of luck. It's less than an eighth of an inch, but more than a sixteenth. If you try to get more exact, you find that it's a little more than 3/32, but a little less than 7/64. I've never seen an actual ruler that had gradations finer than 64ths, but if you do the math, you'll find that 1/10 is less than 13/128, and it's more than 25/256, and it's more than 51/512. You can keep going finer and finer, to 1024ths and 2048ths and 4096ths and 8192nds, but you will never find an exact marking, even on an infinitely-fine base-2 ruler, that exactly corresponds to 1/10, or 0.1.

不过,你会发现一些有趣的事情。让我们看看我列出的所有近似值,对于每一个近似值,明确地记录0.1是大是小:

fraction decimal 0.1 is... as 0/1
1/2 0.5 less 0
1/4 0.25 less 0
1/8 0.125 less 0
1/16 0.0625 greater 1
3/32 0.09375 greater 1
7/64 0.109375 less 0
13/128 0.1015625 less 0
25/256 0.09765625 greater 1
51/512 0.099609375 greater 1
103/1024 0.1005859375 less 0
205/2048 0.10009765625 less 0
409/4096 0.099853515625 greater 1
819/8192 0.0999755859375 greater 1

现在,如果向下读最后一列,就会得到0001100110011。1/10的无限重复二进制分数是0.0001100110011,这不是巧合……