为什么GCC不将a*a*a*a*a*a优化为（a*a**a）*（a*a*a）？

因为32位浮点数（例如1.024）不是1.024。在计算机中，1.024是一个间隔：从（1.024-e）到（1.024+e），其中“e”表示错误。有些人没有意识到这一点，还认为a中的*代表任意精度数字的乘法，而这些数字没有任何错误。有些人没有意识到这一点的原因可能是他们在小学进行的数学计算：只使用理想数字而不附加错误，并且认为在执行乘法时忽略“e”是可以的。他们看不到“float a=1.2”、“a*a*a”和类似C代码中隐含的“e”。

如果大多数程序员认识到（并能够执行）C表达式a*a*a*a*a*a实际上不适用于理想的数字，那么GCC编译器就可以自由地将“a*a*a*a*a*a*a”优化为“t=（a*a）；t*t*t”，这需要更少的乘法运算。但不幸的是，GCC编译器不知道编写代码的程序员是否认为“a”是一个有或没有错误的数字。所以GCC只会做源代码的样子——因为这是GCC用“肉眼”看到的。

…一旦你知道自己是什么样的程序员，你就可以使用“-fast math”开关告诉GCC“嘿，GCC，我知道我在做什么！”。这将允许GCC将a*a*a*a*a*a转换为一段不同的文本-它看起来与a*a*a*a*a*a*a*b*a不同-但仍在a*a a*a a*a*a a*的错误间隔内计算一个数字。这是可以的，因为你已经知道你使用的是时间间隔，而不是理想的数字。

2011-06-23 10:07:41

Lambdageek正确地指出，由于关联性不适用于浮点数，所以a*a*a*a*a*a到（a*a**a）*（a*a*a）的“优化”可能会改变值。这就是C99不允许它的原因（除非用户通过编译器标志或pragma特别允许）。一般来说，假设程序员写的东西是有原因的，编译器应该尊重这一点。如果你想要（a*a*a）*（a*a*a），请写下。

不过，写起来可能会很痛苦；当你使用pow（a，6）时，编译器为什么不能做正确的事情？因为这样做是错误的。在一个拥有良好数学库的平台上，pow（a，6）比a*a*a*a*a*a或（a*a**a）*（a*a*a）要准确得多。为了提供一些数据，我在我的Mac Pro上做了一个小实验，测量了在评估所有[1,2）之间的单精度浮点数的^6时的最差误差：

worst relative error using    powf(a, 6.f): 5.96e-08
worst relative error using (a*a*a)*(a*a*a): 2.94e-07
worst relative error using     a*a*a*a*a*a: 2.58e-07

使用pow而不是乘法树可以将误差范围减少4倍。编译器不应该（通常也不会）进行增加错误的“优化”，除非获得用户的许可（例如通过-fast math）。

注意，GCC提供__builtin_powi（x，n）作为pow（）的替代方案，pow应该生成内联乘法树。如果您想以精度换取性能，但不想启用快速数学，请使用该选项。

2011-06-22 15:32:18

另一个类似的情况是：大多数编译器不会将a+b+c+d优化为（a+b）+（c+d）（这是一种优化，因为第二个表达式可以更好地进行流水线处理），并按照给定的方式对其求值（即（（（a+c）+d））。这也是因为角落案例：

float a = 1e35, b = 1e-5, c = -1e35, d = 1e-5;
printf("%e %e\n", a + b + c + d, (a + b) + (c + d));

这将输出1.00000e-05 0.000000e+00

2011-06-22 22:39:13

因为32位浮点数（例如1.024）不是1.024。在计算机中，1.024是一个间隔：从（1.024-e）到（1.024+e），其中“e”表示错误。有些人没有意识到这一点，还认为a中的*代表任意精度数字的乘法，而这些数字没有任何错误。有些人没有意识到这一点的原因可能是他们在小学进行的数学计算：只使用理想数字而不附加错误，并且认为在执行乘法时忽略“e”是可以的。他们看不到“float a=1.2”、“a*a*a”和类似C代码中隐含的“e”。

如果大多数程序员认识到（并能够执行）C表达式a*a*a*a*a*a实际上不适用于理想的数字，那么GCC编译器就可以自由地将“a*a*a*a*a*a*a”优化为“t=（a*a）；t*t*t”，这需要更少的乘法运算。但不幸的是，GCC编译器不知道编写代码的程序员是否认为“a”是一个有或没有错误的数字。所以GCC只会做源代码的样子——因为这是GCC用“肉眼”看到的。

…一旦你知道自己是什么样的程序员，你就可以使用“-fast math”开关告诉GCC“嘿，GCC，我知道我在做什么！”。这将允许GCC将a*a*a*a*a*a转换为一段不同的文本-它看起来与a*a*a*a*a*a*a*b*a不同-但仍在a*a a*a a*a*a a*的错误间隔内计算一个数字。这是可以的，因为你已经知道你使用的是时间间隔，而不是理想的数字。

2011-06-23 10:07:41

因为浮点数学不是关联的。浮点乘法中操作数的分组方式会影响答案的数值精度。

因此，大多数编译器对重新排序浮点计算非常保守，除非他们能够确定答案不变，或者除非你告诉他们你不在乎数值精度。例如：gcc的-fassociative math选项允许gcc重新关联浮点运算，或者甚至-fast math选项，允许更积极地权衡精度与速度。

2011-06-21 18:56:51

这个问题已经有了一些很好的答案，但为了完整起见，我想指出C标准的适用部分是5.1.2.2.3/15（与C++11标准中的1.9/9节相同）。本节指出，只有当运算符真的是结合的或可交换的时，才能重新组合它们。

2013-10-01 19:33:31

为什么GCC不将aaaaaa优化为（aa**a）（aa*a）？

推荐文章

最新文章

标签