什么时候我应该在python中使用uuid.uuid1() vs. uuid.uuid4() ?

我从文件中了解到两者之间的差异。

uuid1 (): 根据主机ID、序列号和当前时间生成UUID

uuid4 (): 生成一个随机UUID。

因此uuid1使用机器/序列/时间信息来生成UUID。使用它们的优缺点是什么?

我知道uuid1()可能存在隐私问题，因为它基于机器信息。我想知道在选择一个或另一个时是否有更微妙的地方。我现在只使用uuid4()，因为它是一个完全随机的UUID。但是我想知道是否应该使用uuid1来降低碰撞的风险。

基本上，我在寻找人们关于使用其中一种与另一种的最佳实践的建议。谢谢!

当前回答

我的团队在使用UUID1进行数据库升级脚本时遇到了麻烦，我们在几分钟内生成了大约120k个uuid。UUID冲突导致违反主键约束。

我们已经升级了100多个服务器，但在我们的Amazon EC2实例中，我们遇到了几次这个问题。我怀疑时钟分辨率差，切换到UUID4为我们解决了这个问题。

2015-12-21 08:51:22

其他回答

也许我们没有提到的是地域性。

MAC地址或基于时间的排序(UUID1)可以提供更高的数据库性能，因为与随机分布的数字(UUID4)相比，更紧密地排序数字的工作量更少(参见这里)。

第二个相关问题是，使用UUID1在调试中很有用，即使原始数据丢失或没有显式存储(这显然与OP提到的隐私问题相冲突)。

2017-04-13 16:46:30

在使用uuid1时需要注意的一件事是，如果使用默认调用(不提供clock_seq参数)，则有可能遇到碰撞:您只有14位随机性(在100ns内生成18个条目，大约有1%的碰撞几率，参见生日悖论/攻击)。这个问题在大多数情况下都不会发生，但是在时钟分辨率较差的虚拟机上，它会让你很难受。

2014-06-17 18:49:50

我的团队在使用UUID1进行数据库升级脚本时遇到了麻烦，我们在几分钟内生成了大约120k个uuid。UUID冲突导致违反主键约束。

我们已经升级了100多个服务器，但在我们的Amazon EC2实例中，我们遇到了几次这个问题。我怀疑时钟分辨率差，切换到UUID4为我们解决了这个问题。

2015-12-21 08:51:22

可能考虑uuid1()而不是uuid4()的一个实例是，在不同的机器上生成uuid，例如，为了扩展目的，多个在线事务在几台机器上处理。

在这种情况下，由于伪随机数生成器初始化方式中的错误选择而产生冲突的风险，以及潜在的更高数量的uuid，使得创建重复id的可能性更大。

uuid1()的另一个兴趣是，在这种情况下，隐式地记录了最初生成每个GUID的机器(在UUID的“节点”部分)。这和时间信息，可能有帮助，如果只是调试。

2009-11-23 20:18:20

除了公认的答案之外，在某些情况下，还有第三种选择可能有用:

v1与随机MAC ("v1mc")

您可以通过故意生成带有随机广播MAC地址的v1 uuid(这是v1规范所允许的)来混合v1和v4。得到的v1 UUID依赖于时间(像普通v1一样)，但缺乏所有特定于主机的信息(像v4一样)。它的抗碰撞性也更接近v4: v1mc = 60位时间+ 61位随机位= 121位唯一位;V4 = 122随机位。

我首先遇到的是Postgres的uuid_generate_v1mc()函数。从那以后，我使用了下面的python等效代码:

from os import urandom
from uuid import uuid1
_int_from_bytes = int.from_bytes  # py3 only

def uuid1mc():
    # NOTE: The constant here is required by the UUIDv1 spec...
    return uuid1(_int_from_bytes(urandom(6), "big") | 0x010000000000)

(注意:我有一个更长的+更快的版本，直接创建UUID对象;可以张贴，如果有人想要)

在每秒大量调用的情况下，这有可能耗尽系统随机性。您可以使用stdlib随机模块(它可能也会更快)。但是要注意:攻击者只需要几百个uuid就可以确定RNG状态，从而部分预测未来的uuid。

import random
from uuid import uuid1

def uuid1mc_insecure():
    return uuid1(random.getrandbits(48) | 0x010000000000)

2017-08-18 18:09:08

什么时候我应该在python中使用uuid.uuid1() vs. uuid.uuid4() ?

推荐文章

最新文章

标签