使用正则表达式在文本中搜索uuid

我正在使用正则表达式在文本块中搜索uuid。目前，我依赖于所有uuid都遵循8-4-4-4-12十六进制数字模式的假设。

有人能想到这样一个用例吗?在这个用例中，这个假设是无效的，并且会导致我错过一些uuid。

当前回答

$UUID_RE = join '-', map { "[0-9a-f]{$_}" } 8, 4, 4, 4, 12;

顺便说一句，在一个位置上只允许4个只对UUIDv4有效。但是v4并不是唯一存在的UUID版本。我在实践中也遇到过v1。

2016-01-17 17:04:40

其他回答

根据定义，UUID是32个十六进制数字，用连字符分隔为5组，正如您所描述的那样。你不应该错过任何正则表达式。

http://en.wikipedia.org/wiki/Uuid#Definition

2008-09-25 22:14:38

所以，我认为Richard Bronosky给出了迄今为止最好的答案，但我认为你可以让它变得更简单(或至少更简洁):

re_uuid = re.compile(r'[0-9a-f]{8}(?:-[0-9a-f]{4}){3}-[0-9a-f]{12}', re.I)

2013-04-15 23:09:10

c++的变体:

#include <regex>  // Required include

...

// Source string    
std::wstring srcStr = L"String with GIUD: {4d36e96e-e325-11ce-bfc1-08002be10318} any text";

// Regex and match
std::wsmatch match;
std::wregex rx(L"(\\{[A-F0-9]{8}-[A-F0-9]{4}-[A-F0-9]{4}-[A-F0-9]{4}-[A-F0-9]{12}\\})", std::regex_constants::icase);

// Search
std::regex_search(srcStr, match, rx);

// Result
std::wstring strGUID       = match[1];

2014-04-16 18:23:05

我同意根据定义，你的正则表达式不会遗漏任何UUID。然而，如果你特别搜索微软的全球唯一标识符(GUID)，那么GUID有五个等效的字符串表示形式，这可能是有用的:

"ca761232ed4211cebacd00aa0057b223" 

"CA761232-ED42-11CE-BACD-00AA0057B223" 

"{CA761232-ED42-11CE-BACD-00AA0057B223}" 

"(CA761232-ED42-11CE-BACD-00AA0057B223)" 

"{0xCA761232, 0xED42, 0x11CE, {0xBA, 0xCD, 0x00, 0xAA, 0x00, 0x57, 0xB2, 0x23}}"

2008-09-25 22:27:13

$UUID_RE = join '-', map { "[0-9a-f]{$_}" } 8, 4, 4, 4, 12;

顺便说一句，在一个位置上只允许4个只对UUIDv4有效。但是v4并不是唯一存在的UUID版本。我在实践中也遇到过v1。

2016-01-17 17:04:40

使用正则表达式在文本中搜索uuid

推荐文章

最新文章

标签