我想为一个标准的美国类型的电话号码,支持以下格式写一个正则表达式:
###-###-####
(###) ###-####
### ### ####
###.###.####
其中#表示任意数字。到目前为止,我想出了以下表达方式
^[1-9]\d{2}-\d{3}-\d{4}
^\(\d{3}\)\s\d{3}-\d{4}
^[1-9]\d{2}\s\d{3}\s\d{4}
^[1-9]\d{2}\.\d{3}\.\d{4}
分别。我不太确定最后一条是否正确。我还想知道是否有任何方式,我可以写一个单一的表达式,而不是4个不同的迎合我提到的不同格式。如果是这样,我不知道该怎么做。以及我如何修改表达式/表达式,以便我也可以包括一个条件,以支持区号作为可选组件。类似的
+1 ### ### ####
其中+1是区号,是可选的。
这个问题有很多可能的变化。这是一个正则表达式,类似于我之前放在SO上的答案。
^\s*(?:\+?(\d{1,3}))?[-. (]*(\d{3})[-. )]*(\d{3})[-. ]*(\d{4})(?: *x(\d+))?\s*$
它将匹配以下示例和更多:
18005551234
1 800 555 1234
+1 800 555-1234
+86 800 555 1234
1-800-555-1234
1 (800) 555-1234
(800)555-1234
(800) 555-1234
(800)5551234
800-555-1234
800.555.1234
800 555 1234x5678
8005551234 x5678
1 800 555-1234
1----800----555-1234
无论电话号码的输入方式如何,都可以使用捕获组来分解电话号码,以便在代码中处理它。
第一组:国家代码(例如:1或86)
第二组:地区号码(例如:800)
分组3:Exchange(例如:555)
组四:用户号码(例如:1234)
组5:分机(例如:5678)
如果你感兴趣的话,下面是这个表达的分类:
^\s* #Line start, match any whitespaces at the beginning if any.
(?:\+?(\d{1,3}))? #GROUP 1: The country code. Optional.
[-. (]* #Allow certain non numeric characters that may appear between the Country Code and the Area Code.
(\d{3}) #GROUP 2: The Area Code. Required.
[-. )]* #Allow certain non numeric characters that may appear between the Area Code and the Exchange number.
(\d{3}) #GROUP 3: The Exchange number. Required.
[-. ]* #Allow certain non numeric characters that may appear between the Exchange number and the Subscriber number.
(\d{4}) #Group 4: The Subscriber Number. Required.
(?: *x(\d+))? #Group 5: The Extension number. Optional.
\s*$ #Match any ending whitespaces if any and the end of string.
要使区号可选,只需在区号(\d{3})后面添加一个问号。