理解“随机性”

我无法理解这个，哪个更随机？

rand()

OR:

rand() * rand()

我发现这是一个真正的脑筋急转弯，你能帮我吗？

编辑：

直觉上，我知道数学上的答案是它们是同样随机的，但我不禁想，如果你在将两者相乘时“运行随机数算法”两次，你会创建比只做一次更随机的东西。

当前回答

你要寻找的概念是“熵”，即弦的无序程度位。从“最大熵”的概念来看，这个概念最容易理解。

具有最大熵的比特串的一个近似定义是，它不能用更短的比特串来精确表达（即，使用某种算法将较小的字符串扩展回原始字符串）。

最大熵与随机性的相关性源于以下事实：如果你“随机”选择一个数字，你几乎肯定会选择一个其比特串接近于具有最大熵，也就是说，它不能被压缩。这是我们对“随机”数特征的最好理解。

所以，如果你想从两个随机样本中产生一个随机数，它是随机，将两个位字符串连接在一起。实际上，你只是将样本填充到双倍长度单词的高半部分和低半部分。

从更实际的角度来看，如果你发现自己背负着一个蹩脚的rand（），它可以有时有助于将两个样本混合在一起——尽管，如果真的是盈亏平衡的话那个程序没用。

2010-10-18 19:01:15

其他回答

当你对随机数的组合会发生什么感到怀疑时，你可以利用你在统计理论中学到的经验。

在OP的情况下，他想知道X*X=X^2的结果是什么，其中X是沿统一[0,1]分布的随机变量。我们将使用CDF技术，因为它只是一对一映射。

由于X~Uniform[0,1]，其cdf为：fX（X）=1我们需要转换Y<-X^2，因此Y=X^2求逆x（y）：sqrt（y）=x，这给出了x作为y的函数。接下来，求导数dx/dy:d/dy（sqrt（y））=1/（2sqrt（y）

Y的分布如下：fY（Y）=fX（x（Y））|dx/dy |=1/（2 sqrt（Y）

我们还没有完成，我们必须得到Y的域，因为0<=x<1，0<=x^2<1因此Y在范围[0，1）内。如果你想检查Y的pdf是否真的是pdf，请在域中集成它：从0到1集成1/（2 sqrt（Y）），实际上，它会弹出为1。此外，请注意所述函数的形状看起来像belisarious发布的内容。

至于X1+X2+…+Xn，（其中Xi ~一致[0,1]），我们可以求助于中心极限定理，它适用于存在矩的任何分布。这就是Z检验存在的原因。

用于确定生成的pdf的其他技术包括雅可比变换（这是cdf技术的广义版本）和MGF技术。

编辑：作为澄清，请注意，我所说的是结果转换的分布，而不是其随机性。这实际上是一个单独的讨论。我实际上得到的是（rand（））^2。对于rand（）*rand（（），它要复杂得多，无论如何，这不会导致任何类型的均匀分布。

2010-10-18 14:02:34

假设rand（）返回一个介于[0，1）之间的数字，很明显rand（*rand）将偏向于0。这是因为将x乘以[0，1）之间的数字将得到一个小于x的数字。下面是10000个随机数的分布：

google.charts.load（“current”，{packages:[“corechart”]}）；google.cacharts.setOnLoadCallback（drawChart）；函数drawChart（）{变量i；var randomNumbers=[]；对于（i=0；i<10000；i++）{randomNumbers.push（Math.rrandom（）*Math.random（））；}var chart=新的google.visability.Histogram（document.getElementById（“chart-1”））；var data=新的google.visibility.DataTable（）；data.addColumn（“数字”，“值”）；randomNumbers.forEach（函数（randomNumber）{data.addRow（[randomNumber]）；});chart.draw（数据{title:randomNumbers.length+“rand（）*rand（值介于[0，1）之间”，图例：｛位置：“无”｝});}<script src=“https://www.gstatic.com/charts/loader.js“></script><div id=“chart-1”style=“height:500px”>正在生成图表</分区>

如果rand（）返回[x，y]之间的整数，则得到以下分布。注意奇数与偶数的数量：

google.charts.load（“current”，{packages:[“corechart”]}）；google.cacharts.setOnLoadCallback（drawChart）；document.querySelector（“#绘制图表”）.addEventListener（“单击”，绘制图表）；函数randomInt（最小值，最大值）{return Math.floor（Math.random（）*（max-min+1））+min；}函数drawChart（）{var min=编号（document.querySelector（“#rand min”）.value）；var max=编号（document.querySelector（“#rand max”）.value）；如果（最小值>=最大值）{回来}变量i；var randomNumbers=[]；对于（i=0；i<10000；i++）{randomNumbers.push（randomInt（最小，最大）*randomInt（最小，最小））；}var chart=新的google.visability.Histogram（document.getElementById（“chart-1”））；var data=新的google.visibility.DataTable（）；data.addColumn（“数字”，“值”）；randomNumbers.forEach（函数（randomNumber）{data.addRow（[randomNumber]）；});chart.draw（数据{title:randomNumbers.length+“rand（）*rand（（）值介于[“+min+”，“+max+”]”之间，图例：｛位置：“无”｝，直方图：｛bucketSize:1｝});}<script src=“https://www.gstatic.com/charts/loader.js“></script><input-type=“number”id=“rand-min”value=“0”min=“0“max=“10”><input type=“number”id=“rand max”value=“9”min=“0”max=“10”><input type=“button”id=“draw chart”value=“Apply”><div id=“chart-1”style=“height:500px”>正在生成图表</分区>

2018-05-14 21:22:13

“随机”与“更随机”有点像问哪个零更为零。

在这种情况下，rand是PRNG，所以不是完全随机的。（事实上，如果种子是已知的，那是完全可以预测的）。将其乘以另一个值，使其不再随机。

真正的加密类型RNG实际上是随机的。通过任何类型的函数运行值都不能增加更多的熵，而且很可能会删除熵，使其不再随机。

2010-10-18 03:45:09

只是一个澄清

尽管每当你试图发现伪随机变量或其乘法的随机性时，前面的答案都是正确的，但你应该知道，虽然random（）通常是均匀分布的，但random（*random）却不是。

实例

这是通过伪随机变量模拟的均匀随机分布样本：

        BarChart[BinCounts[RandomReal[{0, 1}, 50000], 0.01]]

这是两个随机变量相乘后得到的分布：

        BarChart[BinCounts[Table[RandomReal[{0, 1}, 50000] * 
                                 RandomReal[{0, 1}, 50000], {50000}], 0.01]]

所以，两者都是“随机”的，但它们的分布是非常不同的。

另一个例子

当2*Random（）均匀分布时：

        BarChart[BinCounts[2 * RandomReal[{0, 1}, 50000], 0.01]]

随机（）+随机（）不是！

        BarChart[BinCounts[Table[RandomReal[{0, 1}, 50000] + 
                                 RandomReal[{0, 1}, 50000], {50000}], 0.01]]

中心极限定理

中心极限定理指出，随着项的增加，Random（）的和趋于正态分布。

只需四个术语即可获得：

BarChart[BinCounts[Table[RandomReal[{0, 1}, 50000] + RandomReal[{0, 1}, 50000] +
                   Table[RandomReal[{0, 1}, 50000] + RandomReal[{0, 1}, 50000],
                   {50000}],
         0.01]]

在这里，通过将1、2、4、6、10和20个均匀分布的随机变量相加，可以看到从均匀分布到正态分布的道路：

Edit

几个学分

感谢Thomas Ahle在评论中指出，最后两张图片中显示的概率分布称为Irwin Hall分布

感谢Heike出色的撕裂功能

2010-10-18 04:03:16

大多数这种分布发生是因为你必须限制或规范随机数。

我们将其标准化为全部为正，符合范围，甚至符合指定变量类型的内存大小限制。

换句话说，因为我们必须将随机调用限制在0和X之间（X是变量的大小限制），所以我们将有一组介于0和X的“随机”数。

现在，当你将随机数与另一个随机数相加时，总和将介于0和2X之间。。。这会使值偏离边缘点（当两个随机数在较大范围内时，将两个小数字相加和将两个大数字相加的概率非常小）。

想象一下这样一个例子，你有一个接近于零的数字，你将它与另一个随机数相加，它肯定会变大，远离0（这对于大数字是正确的，因为随机函数不可能两次返回两个大数字（接近于X的数字）。

现在，如果你用负数和正数设置随机方法（跨越零轴），情况将不再如此。

例如，假设RandomReal（{-x，x}，50000，.01），那么你会得到负数和正数的偶数分布，如果你将随机数相加，它们将保持其“随机性”。

现在我不确定Random（）*Random（（）从负到正的跨度会发生什么。。。这将是一个有趣的图表。。。但我现在得回去写代码了-P

2010-10-18 16:47:48

理解“随机性”

推荐文章

最新文章

标签