未初始化的局部变量是最快的随机数生成器吗?

我知道未初始化的局部变量是未定义的行为(UB)，而且值可能有陷阱表示，这可能会影响进一步的操作，但有时我想使用随机数仅为视觉表示，而不会在程序的其他部分进一步使用它们，例如，在视觉效果中设置随机颜色的东西，例如:

void updateEffect(){
    for(int i=0;i<1000;i++){
        int r;
        int g;
        int b;
        star[i].setColor(r%255,g%255,b%255);
        bool isVisible;
        star[i].setVisible(isVisible);
    }
}

比那么快吗

void updateEffect(){
    for(int i=0;i<1000;i++){
        star[i].setColor(rand()%255,rand()%255,rand()%255);
        star[i].setVisible(rand()%2==0?true:false);
    }
}

也比其他随机数生成器快吗?

当前回答

您的特定代码示例可能无法实现您所期望的功能。虽然从技术上讲，循环的每次迭代都为r、g和b值重新创建局部变量，但实际上它们在堆栈上是完全相同的内存空间。因此，它不会在每次迭代中重新随机化，你最终将为1000种颜色中的每一种分配相同的3个值，而不管r、g和b最初是多么随机。

事实上，如果它确实有效，我会非常好奇是什么让它重新随机化。我唯一能想到的就是在这个堆栈上有一个交错的中断，这是不太可能的。也许内部优化将它们作为寄存器变量，而不是真正的内存位置，在循环中寄存器被重用，这也会奏效，特别是如果设置可见性函数特别需要寄存器的话。不过，这远不是随机的。

2015-07-31 14:32:20

其他回答

未定义的行为意味着编译器的作者可以自由地忽略这个问题，因为无论发生什么，程序员都没有权利抱怨。

理论上，当进入UB域时，任何事情都可能发生(包括守护进程从你鼻子上飞出去)，通常意味着编译器作者不会关心，对于局部变量，其值将是当时堆栈内存中的任何值。

这也意味着内容通常是“奇怪的”，但是是固定的，或者是稍微随机的，或者是可变的，但是有一个清晰的模式(例如，在每次迭代中增加值)。

当然，你不能指望它是一个不错的随机生成器。

2015-07-31 06:56:08

有很多很好的答案，但请允许我补充另一个并强调一点，在确定性计算机中，没有什么是随机的。对于伪rng生成的数字和堆栈上为C/ c++局部变量保留的内存区域中发现的看似“随机”的数字都是如此。

但是…这里有一个关键的区别。

由优秀的伪随机生成器生成的数字具有统计上与真正的随机抽取相似的属性。例如，分布是均匀的。循环长度很长:在循环重复之前，你可以得到数百万个随机数。序列不是自相关的:例如，如果你取第2个、第3个或第27个数字，或者查看生成的数字中的特定数字，你不会开始看到奇怪的模式出现。

相比之下，留在堆栈上的“随机”数字没有任何这些属性。它们的值和明显的随机性完全取决于程序的构造方式、编译方式以及编译器对程序的优化方式。举例来说，这是你的想法的一个变体，作为一个自包含的程序:

#include <stdio.h>

notrandom()
{
        int r, g, b;

        printf("R=%d, G=%d, B=%d", r&255, g&255, b&255);
}

int main(int argc, char *argv[])
{
        int i;
        for (i = 0; i < 10; i++)
        {
                notrandom();
                printf("\n");
        }

        return 0;
}

当我在Linux机器上用GCC编译这段代码并运行它时，结果是相当不愉快的确定性:

R=0, G=19, B=0
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255
R=130, G=16, B=255

If you looked at the compiled code with a disassembler, you could reconstruct what was going on, in detail. The first call to notrandom() used an area of the stack that was not used by this program previously; who knows what was in there. But after that call to notrandom(), there is a call to printf() (which the GCC compiler actually optimizes to a call to putchar(), but never mind) and that overwrites the stack. So the next and subsequent times, when notrandom() is called, the stack will contain stale data from the execution of putchar(), and since putchar() is always called with the same arguments, this stale data will always be the same, too.

因此，这种行为绝对不是随机的，通过这种方式获得的数字也不具有编写良好的伪随机数生成器的任何理想属性。事实上，在大多数现实场景中，它们的值是重复的并且高度相关的。

事实上，和其他人一样，我也会认真考虑解雇那些试图把这个想法当作“高性能RNG”的人。

2015-07-31 18:29:37

由于安全原因，必须清理分配给程序的新内存，否则信息可能会被使用，密码可能会从一个应用程序泄漏到另一个应用程序。只有在重用内存时，才会得到不同于0的值。很有可能，在堆栈上，前一个值是固定的，因为前一个内存的使用是固定的。

2015-07-31 07:03:26

我做了一个非常简单的测试，它根本不是随机的。

#include <stdio.h>

int main() {

    int a;
    printf("%d\n", a);
    return 0;
}

每次我运行程序，它都输出相同的数字(在我的例子中是32767)——没有比这更随机的了。这大概是运行时库中留在堆栈上的启动代码。由于每次程序运行时都使用相同的启动代码，并且在两次运行之间程序中没有其他变化，因此结果是完全一致的。

2015-08-05 15:16:37

我喜欢你的思维方式。真的是跳出了框框。然而，这种权衡真的不值得。内存和运行时的权衡是一个问题，但运行时的未定义行为却不是。

知道自己使用如此“随机”的业务逻辑，一定会让您感到非常不安。我不会那么做的。

2015-08-17 10:30:19

未初始化的局部变量是最快的随机数生成器吗?

推荐文章

最新文章

标签