正则表达式只匹配字母

我怎么能写一个正则表达式，只匹配字母?

当前回答

所以，我读了很多答案，大部分答案都没有考虑到例外情况，比如有重音的字母或变音(á， à， ä等)。

我在typescript中编写了一个函数，该函数应该几乎可以外推到任何可以使用RegExp的语言。这是我个人用TypeScript实现的用例。我所做的基本上是为我想添加的每种符号添加字母范围。在应用RegExp之前，我还将字符转换为大写，这为我节省了一些工作。

function isLetter(char: string): boolean {
  return char.toUpperCase().match('[A-ZÀ-ÚÄ-Ü]+') !== null;
}

如果您想添加具有另一种重音的另一个字母范围，只需将其添加到正则表达式。特殊符号也是如此。

我用TDD实现了这个功能，我可以确认这至少适用于以下情况:

    character | isLetter
    ${'A'}    | ${true}
    ${'e'}    | ${true}
    ${'Á'}    | ${true}
    ${'ü'}    | ${true}
    ${'ù'}    | ${true}
    ${'û'}    | ${true}
    ${'('}    | ${false}
    ${'^'}    | ${false}
    ${"'"}    | ${false}
    ${'`'}    | ${false}
    ${' '}    | ${false}

2020-08-21 13:19:54

其他回答

你可以试试这个正则表达式:[^\W\d_]或[a-zA-Z]。

2014-07-25 13:27:11

Pattern pattern = Pattern.compile("^[a-zA-Z]+$");

if (pattern.matcher("a").find()) {

   ...do something ......
}

2016-05-23 23:26:23

只需使用\w或[:alpha:]即可。它是一个转义序列，只匹配可能出现在单词中的符号。

2014-05-28 13:33:23

在python中，我发现了以下工作:

[^\W\d_]

这是因为我们正在创建一个新的字符类([])，它从类\W中排除(^)任何字符(所有不在[a- za - z0 -9_]中的字符)，也排除任何数字(\d)，也排除下划线(_)。

也就是说，我们已经取了字符类[a-zA-Z0-9_]，并删除了0-9和_位。你可能会问，这样写[a-zA-Z]不是比[^\W\d_]更简单吗?如果只处理ASCII文本，您将是正确的，但当处理unicode文本时:

\ W 匹配任何非单词字符的字符。这是\w的反义词。>如果使用了ASCII标志，它就相当于[^a-zA-Z0-9_]。

^来自python re模块文档

也就是说，我们取unicode中所有被认为是单词字符的字符，删除unicode中所有被认为是数字字符的字符，并删除下划线。

例如，下面的代码片段

import re
regex = "[^\W\d_]"
test_string = "A;,./>>?()*)&^*&^%&^#Bsfa1 203974"
re.findall(regex, test_string)

['A', 'B', 's', 'f', 'a']

2020-08-20 20:27:50

\p{L}匹配任何Unicode字母，如果您对拉丁字母以外的字母感兴趣

2010-09-01 12:10:31

正则表达式只匹配字母

推荐文章

最新文章

标签