如何使用正则表达式验证电话号码

我试图把一个全面的正则表达式放在一起来验证电话号码。理想情况下，它可以处理国际格式，但它必须处理美国格式，包括以下内容:

1-234-567-8901 1-234-567-8901 x1234 1-234-567-8901 ext1234 1 (234) 567-8901 1.234.567.8901 1/234/567/8901 12345678901

我会用我目前的尝试来回答，但我希望有人有更好的和/或更优雅的东西。

当前回答

你会很难用一个简单的正则表达式处理国际号码，看看这篇关于国际(甚至北美)电话号码的困难的文章。

您需要解析前几位数字以确定国家代码，然后根据国家采取不同的操作。

除此之外——你给出的列表不包括另一种常见的美国格式——省略了首字母1。在美国，大多数手机都不需要这种功能，这将开始困扰年轻一代，除非他们拨打国际长途电话。

你已经正确地认识到这是一个棘手的问题。

亚当

2008-09-23 20:51:54

其他回答

我在另一个SO问题上回答了这个问题，然后决定把我的答案也包括在这个线程上，因为没有人解决如何要求/不要求项目，只是分发正则表达式: 正则表达式工作错误，匹配意想不到的东西

从我在那个网站上的帖子中，我创建了一个快速指南，帮助任何人为自己想要的电话号码格式制作自己的正则表达式，我要警告(就像我在另一个网站上所做的那样)，如果你限制太多，你可能不会得到想要的结果，并且没有“一宜之计”的解决方案来接受世界上所有可能的电话号码——只有你决定接受的格式作为你选择的格式。使用风险自负。

快速小抄

Start the expression: /^ If you want to require a space, use: [\s] or \s If you want to require parenthesis, use: [(] and [)] . Using $ and $ is ugly and can make things confusing. If you want anything to be optional, put a ? after it If you want a hyphen, just type - or [-] . If you do not put it first or last in a series of other characters, though, you may need to escape it: \- If you want to accept different choices in a slot, put brackets around the options: [-.\s] will require a hyphen, period, or space. A question mark after the last bracket will make all of those optional for that slot. \d{3} : Requires a 3-digit number: 000-999. Shorthand for [0-9][0-9][0-9]. [2-9] : Requires a digit 2-9 for that slot. (\+|1\s)? : Accept a "plus" or a 1 and a space (pipe character, |, is "or"), and make it optional. The "plus" sign must be escaped. If you want specific numbers to match a slot, enter them: [246] will require a 2, 4, or 6. (?:77|78) or [77|78] will require 77 or 78. $/ : End the expression

2014-08-14 02:00:25

我在一家市场研究公司工作，我们必须一直过滤这些类型的输入。你把事情复杂化了。去掉非字母数字字符，看看是否有扩展。

为了进一步分析，你可以订阅众多提供商中的一家，这些提供商会让你访问有效号码数据库，并告诉你他们是座机还是移动电话，断开连接等等。这需要花钱。

2008-09-23 20:41:56

尽管去掉所有空白的答案很简洁，但它并没有真正解决所提出的问题，即找到一个正则表达式。以我的测试脚本为例，它下载一个网页并使用正则表达式提取所有电话号码。因为无论如何都需要正则表达式，所以不妨让正则表达式完成所有工作。我想到了这个:

1?\W*([2-9][0-8][0-9])\W*([2-9][0-9]{2})\W*([0-9]{4})(\se?x?t?(\d*))?

这里有一个perl脚本来测试它。当您匹配时，$1包含区号，$2和$3包含电话号码，$5包含分机。我的测试脚本从互联网上下载一个文件，并打印其中所有的电话号码。

#!/usr/bin/perl

my $us_phone_regex =
        '1?\W*([2-9][0-8][0-9])\W*([2-9][0-9]{2})\W*([0-9]{4})(\se?x?t?(\d*))?';


my @tests =
(
"1-234-567-8901",
"1-234-567-8901 x1234",
"1-234-567-8901 ext1234",
"1 (234) 567-8901",
"1.234.567.8901",
"1/234/567/8901",
"12345678901",
"not a phone number"
);

foreach my $num (@tests)
{
        if( $num =~ m/$us_phone_regex/ )
        {
                print "match [$1-$2-$3]\n" if not defined $4;
                print "match [$1-$2-$3 $5]\n" if defined $4;
        }
        else
        {
                print "no match [$num]\n";
        }
}

#
# Extract all phone numbers from an arbitrary file.
#
my $external_filename =
        'http://web.textfiles.com/ezines/PHREAKSANDGEEKS/PnG-spring05.txt';
my @external_file = `curl $external_filename`;
foreach my $line (@external_file)
{
        if( $line =~ m/$us_phone_regex/ )
        {
                print "match $1 $2 $3\n";
        }
}

编辑:

你可以把\W*改成\s*\W?\s*在正则表达式中来收紧一点。当我编写正则表达式时，我并没有从验证表单上的用户输入的角度考虑它，但是这个更改使正则表达式可以用于此目的。

'1?\s*\W?\s*([2-9][0-8][0-9])\s*\W?\s*([2-9][0-9]{2})\s*\W?\s*([0-9]{4})(\se?x?t?(\d*))?';

2008-09-23 21:58:26

这是我目前为止最好的尝试。它处理上面的格式，但我确信我错过了一些其他可能的格式。

^\d?(?:(?:[\+]?(?:[\d]{1,3}(?:[ ]+|[\-.])))?[(]?(?:[\d]{3})[\-/)]?(?:[ ]+)?)?(?:[a-zA-Z2-9][a-zA-Z0-9 \-.]{6,})(?:(?:[ ]+|[xX]|(i:ext[\.]?)){1,2}(?:[\d]{1,5}))?$

2008-09-23 20:14:20

既然写电话号码有很多选择，我们可以测试其中有足够的数字，不管它们是如何分开的。我发现9到14个数字适合我:

^\D*(\d\D*){9,14}$

正确的:

123456789 1234567890123 +123 (456) 78.90-98.76

错误的:

123 (1234) 1234 9007199254740991 我不会按你说的去做 +123 (456) 78.90-98.76 #543 ext 210>2>5>3 早上打456-7890 18:00后打987 - 54-3210找雪莉

如果你想支持最后两个例子，只需要移除上限:

(\d\D*){9,}

(如果没有上限，则不需要^$)

2020-08-11 08:08:08

如何使用正则表达式验证电话号码

推荐文章

最新文章

标签