理解“随机性”

我无法理解这个，哪个更随机？

rand()

OR:

rand() * rand()

我发现这是一个真正的脑筋急转弯，你能帮我吗？

编辑：

直觉上，我知道数学上的答案是它们是同样随机的，但我不禁想，如果你在将两者相乘时“运行随机数算法”两次，你会创建比只做一次更随机的东西。

当前回答

这不是很明显，但rand（）通常比rand（*rand）更随机。重要的是，对于大多数用途来说，这实际上不是很重要。

但首先，它们产生了不同的分布。如果这是你想要的，这不是问题，但这很重要。如果你需要一个特定的分布，那么忽略整个“哪个更随机”的问题。那么为什么rand（）更随机呢？

rand（）之所以更随机（假设它产生的是[0..1]范围内的浮点随机数，这是非常常见的）的核心是，当你将两个FP数与尾数中的大量信息相乘时，你会在结尾处丢失一些信息；IEEE双精度浮点中没有足够的位来保存从[0..1]中均匀随机选择的两个IEEE双精度浮点数中的所有信息，这些额外的信息位将丢失。当然，这无关紧要，因为你（可能）不会使用这些信息，但损失是真实的。您产生哪种分布（即，使用哪种操作进行组合）也并不重要。这些随机数中的每一个都有（最多）52位随机信息——这就是IEEE双精度的容量——如果你将两个或多个随机数合并为一个，那么你仍然只能拥有最多52位的随机信息。

大多数随机数的使用甚至没有使用随机源中实际可用的那么多随机性。得到一个好的PRNG，不要太担心它。（“好”的程度取决于你在用它做什么；你在做蒙特卡洛模拟或密码学时必须小心，否则你可能会使用标准PRNG，因为这通常要快得多。）

2010-10-19 10:51:18

其他回答

答案将是，这取决于，希望rand（）*rand（（）比rand）更随机，但如下所示：

两个答案都取决于你的值的位数在大多数情况下，你根据伪随机算法生成（它主要是一个数字生成器，依赖于你的计算机时钟，而不是那么随机）。让你的代码更可读（不要用这种咒语来召唤一些随机的巫毒神）。

好吧，如果你检查上面的任何一个，我建议你使用简单的“rand（）”。因为你的代码会更可读（不会问自己为什么要写这个，时间……嗯……超过2秒），易于维护（如果你想用super_rand替换rand函数）。

如果你想要更好的随机性，我建议你从任何提供足够噪声的源（无线电静态）流式传输，然后一个简单的rand（）就足够了。

2010-10-18 06:54:39

关于“随机性”的一些事情是反直觉的。

假设rand（）的平面分布，下面将得到非平面分布：

高偏差：sqrt（rand（范围^2））中间偏差峰值：（rand（range）+rand（range））/2低：偏差：范围-sqrt（rand（范围^2））

有很多其他方法可以创建特定的偏置曲线。我对rand（）*rand（（）做了一个快速测试，它得到了一个非常非线性的分布。

2010-10-18 04:03:57

当你对随机数的组合会发生什么感到怀疑时，你可以利用你在统计理论中学到的经验。

在OP的情况下，他想知道X*X=X^2的结果是什么，其中X是沿统一[0,1]分布的随机变量。我们将使用CDF技术，因为它只是一对一映射。

由于X~Uniform[0,1]，其cdf为：fX（X）=1我们需要转换Y<-X^2，因此Y=X^2求逆x（y）：sqrt（y）=x，这给出了x作为y的函数。接下来，求导数dx/dy:d/dy（sqrt（y））=1/（2sqrt（y）

Y的分布如下：fY（Y）=fX（x（Y））|dx/dy |=1/（2 sqrt（Y）

我们还没有完成，我们必须得到Y的域，因为0<=x<1，0<=x^2<1因此Y在范围[0，1）内。如果你想检查Y的pdf是否真的是pdf，请在域中集成它：从0到1集成1/（2 sqrt（Y）），实际上，它会弹出为1。此外，请注意所述函数的形状看起来像belisarious发布的内容。

至于X1+X2+…+Xn，（其中Xi ~一致[0,1]），我们可以求助于中心极限定理，它适用于存在矩的任何分布。这就是Z检验存在的原因。

用于确定生成的pdf的其他技术包括雅可比变换（这是cdf技术的广义版本）和MGF技术。

编辑：作为澄清，请注意，我所说的是结果转换的分布，而不是其随机性。这实际上是一个单独的讨论。我实际上得到的是（rand（））^2。对于rand（）*rand（（），它要复杂得多，无论如何，这不会导致任何类型的均匀分布。

2010-10-18 14:02:34

好的，所以我会尝试添加一些值来补充其他答案，说你正在创建和使用一个随机数生成器。

随机数发生器是一种具有多种特性的设备（从非常普遍的意义上讲），可以根据需要进行修改。其中一些（来自我）是：

熵：如香农熵分布：统计分布（泊松、正态等）类型：数字的来源（算法、自然事件、组合等）和应用的算法。效率：执行的速度或复杂性。模式：周期、顺序、运行等。也许还有更多。。。

在这里的大多数答案中，分布是主要的关注点，但通过混合和匹配函数和参数，您可以创建生成随机数的新方法，这些随机数将具有不同的特征，其中一些特征乍一看可能不明显。

2011-06-02 13:51:08

用更离散的数字来考虑可能会有所帮助。考虑一下要生成1到36之间的随机数，所以您决定最简单的方法是投掷两个公平的6面骰子。你得到了这个：

     1    2    3    4    5    6
  -----------------------------
1|   1    2    3    4    5    6
2|   2    4    6    8   10   12
3|   3    6    9   12   15   18
4|   4    8   12   16   20   24   
5|   5   10   15   20   25   30
6|   6   12   18   24   30   36

所以我们有36个数字，但并不是所有数字都得到了公平的表示，有些数字根本没有出现。靠近中心对角线（左下角到右上角）的数字将以最高频率出现。

描述骰子之间不公平分布的相同原则同样适用于0.0和1.0之间的浮点数。

2010-10-18 20:25:07

理解“随机性”

推荐文章

最新文章

标签