使用正则表达式在文本中搜索uuid

我正在使用正则表达式在文本块中搜索uuid。目前，我依赖于所有uuid都遵循8-4-4-4-12十六进制数字模式的假设。

有人能想到这样一个用例吗?在这个用例中，这个假设是无效的，并且会导致我错过一些uuid。

当前回答

/^[0-9a-f]{8}-[0-9a-f]{4}-[1-5][0-9a-f]{3}-[89AB][0-9a-f]{3}-[0-9a-f]{12}$/i

Gajus的regexp拒绝UUID V1-3和5，尽管它们是有效的。

2014-06-24 13:19:39

其他回答

如果使用POSIX正则表达式(grep -E, MySQL等)，这可能更容易阅读和记忆:

[[:xdigit:]]{8}(-[[:xdigit:]]{4}){3}-[[:xdigit:]]{12}

Perl和PCRE版本也支持POSIX字符类，因此可以与它们一起工作。对于这些，将(…)更改为非捕获子组(?:…)。

JavaScript(以及其他支持Unicode属性的语法)可以使用类似的易读版本:

/\p{Hex_Digit}{8}(?:-\p{Hex_Digit}{4}){3}-\p{Hex_Digit}{12}/u

2020-04-03 23:57:32

根据定义，UUID是32个十六进制数字，用连字符分隔为5组，正如您所描述的那样。你不应该错过任何正则表达式。

http://en.wikipedia.org/wiki/Uuid#Definition

2008-09-25 22:14:38

概括一个例子，其中下划线也被适当地忽略，只允许字母数字值，模式为8-4-4-4-12。

^ (^ \ W_] {8} (- [^ \ W_] {4}) {4} [^ \ W_] {8} $

^ (^ \ W_] {8} (- [^ \ W_] {4}) {3} - [^ \ W_] {12} $

两者都给出相同的结果，但最后一个更易于阅读。我想推荐一个可以正确学习和测试正则表达式的网站:https://regexr.com/

2022-06-10 02:47:25

所以，我认为Richard Bronosky给出了迄今为止最好的答案，但我认为你可以让它变得更简单(或至少更简洁):

re_uuid = re.compile(r'[0-9a-f]{8}(?:-[0-9a-f]{4}){3}-[0-9a-f]{12}', re.I)

2013-04-15 23:09:10

想要给出我的贡献，因为我的regex涵盖了OP的所有情况，并正确地将组方法上的所有相关数据分组(你不需要post处理字符串来获得uuid的每个部分，这个regex已经为你获得了它)

([\d\w]{8})-?([\d\w]{4})-?([\d\w]{4})-?([\d\w]{4})-?([\d\w]{12})|[{0x]*([\d\w]{8})[0x, ]{4}([\d\w]{4})[0x, ]{4}([\d\w]{4})[0x, {]{5}([\d\w]{2})[0x, ]{4}([\d\w]{2})[0x, ]{4}([\d\w]{2})[0x, ]{4}([\d\w]{2})[0x, ]{4}([\d\w]{2})[0x, ]{4}([\d\w]{2})[0x, ]{4}([\d\w]{2})[0x, ]{4}([\d\w]{2})

2020-12-15 18:55:17

使用正则表达式在文本中搜索uuid

推荐文章

最新文章

标签