您的测试应用程序最基本的问题是,您调用srand一次,然后调用rand一次并退出。
srand函数的全部意义是用一个随机种子初始化伪随机数序列。
这意味着如果您在两个不同的应用程序(具有相同的srand/rand实现)中将相同的值传递给srand,那么您将在两个应用程序中获得完全相同的rand()值序列。
但是在您的示例应用程序中,伪随机序列只包含一个元素——从种子生成的伪随机序列的第一个元素等于当前时间,精度为1秒。那么您希望在输出上看到什么?
显然,当您恰好在同一秒运行应用程序时—您使用相同的种子值—因此您的结果当然是相同的(Martin York已经在对该问题的评论中提到过)。
实际上,您应该调用srand(seed)一次,然后调用rand()多次,并分析该序列-它应该看起来是随机的。
修改1 -示例代码:
好的,我明白了。
显然口头描述是不够的(可能是语言障碍或其他什么……:))。
老式的C代码示例,基于问题中使用的相同srand()/rand()/time()函数:
#include <stdlib.h>
#include <time.h>
#include <stdio.h>
int main(void)
{
unsigned long j;
srand( (unsigned)time(NULL) );
for( j = 0; j < 100500; ++j )
{
int n;
/* skip rand() readings that would make n%6 non-uniformly distributed
(assuming rand() itself is uniformly distributed from 0 to RAND_MAX) */
while( ( n = rand() ) > RAND_MAX - (RAND_MAX-5)%6 )
{ /* bad value retrieved so get next one */ }
printf( "%d,\t%d\n", n, n % 6 + 1 );
}
return 0;
}
^^^程序单次运行的序列看起来应该是随机的。
请注意,我不建议在产品代码中使用rand/srand函数,原因如下所述,我绝对不建议使用函数时间作为随机种子,原因IMO已经很明显了。这些用于教育目的,有时可以用来说明问题,但对于任何严肃的用途,它们大多是无用的。
修订2 -详细说明:
重要的是要明白,到目前为止,没有C或c++标准特性(库函数或类)最终产生实际随机的数据(即由标准保证实际上是随机的)。解决这个问题的唯一标准特性是std::random_device,不幸的是,它仍然不能保证实际的随机性。
根据应用程序的性质,您应该首先决定是否真的需要真正随机(不可预测)的数据。当你确实需要真正的随机性时,值得注意的是信息安全——例如生成对称密钥、非对称私有密钥、盐值、安全令牌等。
实际上,安全级随机数是一个单独的行业,值得另写一篇文章。(在我的回答中,我简要地提到了这一点。)
在大多数情况下伪随机数生成器是足够的-例如科学模拟或游戏。在某些情况下,甚至需要一致定义的伪随机序列——例如,在游戏中,你可以每次在运行时生成相同的地图,以节省安装包的大小。
最初的问题和重复出现的大量相同/相似的问题(甚至是对它们的许多误导的“答案”)表明,首先重要的是区分随机数和伪随机数,首先理解什么是伪随机数序列,并意识到伪随机数生成器的使用方式与使用真随机数生成器的方式不同。
Intuitively when you request random number - the result returned shouldn't depend on previously returned values and shouldn't depend if
anyone requested anything before and shouldn't depend in what moment
and by what process and on what computer and from what generator and
in what galaxy it was requested. That is what word "random" means
after all - being unpredictable and independent of anything -
otherwise it is not random anymore, right? With this intuition it is
only natural to search the web for some magic spells to cast to get
such random number in any possible context.
^^^这种直观的期望在所有涉及伪随机数生成器的情况下都是非常错误和有害的——尽管对真随机数来说是合理的。
虽然“随机数”的有意义的概念存在(某种程度上)-没有“伪随机数”这样的东西。伪随机数发生器实际上产生伪随机数序列。
伪随机序列实际上总是确定的(由它的算法和初始参数预先确定)——也就是说,它实际上没有任何随机的东西。
当专家们谈论PRNG的质量时,他们实际上是在谈论所生成序列(及其显著的子序列)的统计属性。例如,如果你轮流使用两个高质量的prng来组合它们,你可能会产生糟糕的结果序列,尽管它们各自产生了良好的序列(这两个良好的序列可能只是相互关联,因此组合不好)。
具体来说,rand()/srand(s)对函数提供了一个奇异的每进程非线程安全(!)伪随机数序列,由实现定义的算法生成。函数rand()生成范围为[0,RAND_MAX]的值。
引用C11标准(ISO/IEC 9899:2011):
的新序列,srand函数使用参数作为种子
后续调用rand返回的伪随机数。如果
然后用相同的种子值(序列)调用Srand
伪随机数应重复。如果rand在any之前被调用
调用srand后,生成的序列应与
当srand第一次被调用时,种子值为1。
Many people reasonably expect that rand() would produce a sequence of semi-independent uniformly distributed numbers in range 0 to RAND_MAX. Well it most certainly should (otherwise it's useless) but unfortunately not only standard doesn't require that - there is even explicit disclaimer that states "there is no guarantees as to the quality of the random sequence produced".
In some historical cases rand/srand implementation was of very bad quality indeed. Even though in modern implementations it is most likely good enough - but the trust is broken and not easy to recover.
Besides its non-thread-safe nature makes its safe usage in multi-threaded applications tricky and limited (still possible - you may just use them from one dedicated thread).
New class template std::mersenne_twister_engine<> (and its convenience typedefs - std::mt19937/std::mt19937_64 with good template parameters combination) provides per-object pseudo-random number generator defined in C++11 standard. With the same template parameters and the same initialization parameters different objects will generate exactly the same per-object output sequence on any computer in any application built with C++11 compliant standard library. The advantage of this class is its predictably high quality output sequence and full consistency across implementations.
此外,c++ 11标准中还定义了其他(更简单的)PRNG引擎——std::linear_congruential_engine<>(在一些C标准库实现中,历史上被用作公平质量的srand/rand算法)和std::subtract_with_carry_engine<>。它们还生成完全定义的依赖参数的每个对象输出序列。
现代c++ 11例子替换了上面过时的C代码:
#include <iostream>
#include <chrono>
#include <random>
int main()
{
std::random_device rd;
// seed value is designed specifically to make initialization
// parameters of std::mt19937 (instance of std::mersenne_twister_engine<>)
// different across executions of application
std::mt19937::result_type seed = rd() ^ (
(std::mt19937::result_type)
std::chrono::duration_cast<std::chrono::seconds>(
std::chrono::system_clock::now().time_since_epoch()
).count() +
(std::mt19937::result_type)
std::chrono::duration_cast<std::chrono::microseconds>(
std::chrono::high_resolution_clock::now().time_since_epoch()
).count() );
std::mt19937 gen(seed);
for( unsigned long j = 0; j < 100500; ++j )
/* ^^^Yes. Generating single pseudo-random number makes no sense
even if you use std::mersenne_twister_engine instead of rand()
and even when your seed quality is much better than time(NULL) */
{
std::mt19937::result_type n;
// reject readings that would make n%6 non-uniformly distributed
while( ( n = gen() ) > std::mt19937::max() -
( std::mt19937::max() - 5 )%6 )
{ /* bad value retrieved so get next one */ }
std::cout << n << '\t' << n % 6 + 1 << '\n';
}
return 0;
}
使用std::uniform_int_distribution<>的前面代码的版本
#include <iostream>
#include <chrono>
#include <random>
int main()
{
std::random_device rd;
std::mt19937::result_type seed = rd() ^ (
(std::mt19937::result_type)
std::chrono::duration_cast<std::chrono::seconds>(
std::chrono::system_clock::now().time_since_epoch()
).count() +
(std::mt19937::result_type)
std::chrono::duration_cast<std::chrono::microseconds>(
std::chrono::high_resolution_clock::now().time_since_epoch()
).count() );
std::mt19937 gen(seed);
std::uniform_int_distribution<unsigned> distrib(1, 6);
for( unsigned long j = 0; j < 100500; ++j )
{
std::cout << distrib(gen) << ' ';
}
std::cout << '\n';
return 0;
}