GUID不是唯一的简单证明

我想证明一个GUID在一个简单的测试程序中不是唯一的。我原以为下面的代码会运行几个小时，但它不起作用。我该怎么做呢?

BigInteger begin = new BigInteger((long)0);
BigInteger end = new BigInteger("340282366920938463463374607431768211456",10);  //2^128
for(begin; begin<end; begin++)
  Console.WriteLine(System.Guid.NewGuid().ToString());

我用的是c#。

当前回答

假设你有理由相信生成guid的算法并不是生成真正的随机数，而是以周期<< 2^128为周期循环。

例如，RFC4122方法用于派生guid，该guid固定某些位的值。

循环的证明取决于周期的可能大小。

对于小周期，哈希表(GUID) -> GUID与碰撞替换如果guid不匹配(如果匹配则终止)可能是一种方法。也可以考虑只在随机的一小部分时间内进行替换。

最终，如果两次碰撞之间的最大周期足够大(并且事先不知道)，任何方法都只能产生一个概率，即如果碰撞存在的话，就会发现碰撞。

请注意，如果生成guid的方法是基于时钟的(参见RFC)，那么可能无法确定是否存在冲突，因为(a)您无法等待足够长的时间让时钟转一圈，或者(b)您无法在一个时钟滴答内请求足够的guid来强制碰撞。

或者，您可以显示Guid中位之间的统计关系，或者Guid之间位的相关性。这样的关系可能使得算法很有可能是有缺陷的，而不一定能找到实际的碰撞。

当然，如果您只是想证明Guids可以碰撞，那么答案就是数学证明，而不是程序。

2009-11-10 01:33:46

其他回答

任何两个guid都很可能是唯一的(不相等)。

看看这个SO条目，来自维基百科

而每个生成的GUID不是保证是唯一的，总数唯一键数(2^128或 3.4×10^38)是如此之大，以至于相同数字的概率为生成两次是非常小的。为例子,考虑可观测宇宙，其中包含约5×10^22 星星;每颗恒星都有可能 6.8×10^15个通用唯一的guid。

所以你可能还要再等几十亿年，希望在我们所知道的宇宙结束之前，你能击中一个。

2009-11-10 00:57:08

你可以用量子bogosort算法的变体在O(1)时间内证明这一点。

Guid g1 = Guid.NewGuid();
Guid g2 = Guid.NewGuid();
if(g1 != g2) Universe.Current.Destroy();

2009-12-06 07:46:25

在GUID生成代码中出现错误的几率比算法生成冲突的几率要高得多。在测试guid的代码中出现错误的可能性更大。放弃。

2010-06-05 02:51:11

但你必须确保你有一个副本，还是你只关心是否有一个副本。为了确保有两个人生日相同，你需要366个人(不包括闰年)。如果有超过50%的概率有两个人同一天生日，你只需要23个人。这就是生日问题。

如果你有32位，你只需要77163个值就有超过50%的重复几率。试试吧:

Random baseRandom = new Random(0);

int DuplicateIntegerTest(int interations)
{
    Random r = new Random(baseRandom.Next());
    int[] ints = new int[interations];
    for (int i = 0; i < ints.Length; i++)
    {
        ints[i] = r.Next();
    }
    Array.Sort(ints);
    for (int i = 1; i < ints.Length; i++)
    {
        if (ints[i] == ints[i - 1])
            return 1;
    }
    return 0;
}

void DoTest()
{
    baseRandom = new Random(0);
    int count = 0;
    int duplicates = 0;
    for (int i = 0; i < 1000; i++)
    {
        count++;
        duplicates += DuplicateIntegerTest(77163);
    }
    Console.WriteLine("{0} iterations had {1} with duplicates", count, duplicates);
}

1000 iterations had 737 with duplicates

现在128位已经很多了，所以你仍然在谈论大量的物品，但碰撞的几率很低。对于给定的概率，您需要使用近似值获得以下记录数:

碰撞发生的概率是1/1000 217亿亿亿，50%的几率发生碰撞 396亿亿，90%的碰撞概率

每年大约发送1E14封电子邮件，所以在这个水平上大约需要40万年，你才能有90%的机会拥有两个具有相同GUID的电子邮件，但这与说你需要运行宇宙年龄830亿倍的计算机或太阳变冷才能找到副本有很大不同。

2011-03-17 22:18:05

GUID理论上是非唯一的。下面是你的证明:

GUID是一个128位的数字如果不重用旧的guid，就不能生成2^128 + 1或更多的guid

然而，如果太阳的全部能量输出都用于完成这一任务，那么它在完成之前就会变冷。

GUID可以使用许多不同的策略生成，其中一些策略采取特殊措施来确保给定的机器不会两次生成相同的GUID。在特定算法中发现冲突将表明生成guid的特定方法不好，但不能证明关于guid的任何一般情况。

2009-11-10 01:07:30

GUID不是唯一的简单证明

推荐文章

最新文章

标签