我试过用这个,但没有用

return value.replaceAll("/[^A-Za-z0-9 ]/", "");

使用[^ A-Za-z0-9]。

注意:删除了空格,因为它通常不被认为是字母数字。


return value.replaceAll("[^A-Za-z0-9 ]", "");

这将使空间完好无损。我猜这就是你想要的。否则,从正则表达式中删除空格。


Try

return value.replaceAll("[^A-Za-z0-9]", "");

or

return value.replaceAll("[\\W]|_", "");

Java的正则表达式不需要在正则表达式周围加上正斜杠(/)或任何其他分隔符,这与Perl等其他语言不同。


我创建了这个方法来创建文件名:

public static String safeChar(String input)
{
    char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
    char[] charArray = input.toString().toCharArray();
    StringBuilder result = new StringBuilder();
    for (char c : charArray)
    {
        for (char a : allowed)
        {
            if(c==a) result.append(a);
        }
    }
    return result.toString();
}

你也可以试试这个更简单的正则表达式:

 str = str.replaceAll("\\P{Alnum}", "");

您应该知道[^a-zA-Z]将替换字符本身不是在字符范围A-Z/ A-Z中的字符。这意味着像é, ß等特殊字符或西里尔字符等将被删除。

如果不需要替换这些字符,可以使用预定义的字符类:

 str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");

PS: \p{Alnum}不能达到这种效果,它的作用与[A-Za-z0-9]相同。


简单的方法:

public boolean isBlank(String value) {
    return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}

public String normalizeOnlyLettersNumbers(String str) {
    if (!isBlank(str)) {
        return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
    } else {
        return "";
    }
}

public static void main(String[] args) {
    String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";

    System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));

}

输出: 衣原体 IgGIgMIgAAbs8006

Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java


如果你也想允许不属于ascii字符集的字母数字字符,比如德国变音,你可以考虑使用以下解决方案:

 String value = "your value";

 // this could be placed as a static final constant, so the compiling is only done once
 Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);

 value = pattern.matcher(value).replaceAll("");

请注意,UNICODE_CHARACTER_CLASS标志的使用可能会导致性能损失(参见该标志的javadoc)。


使用番石榴,您可以轻松地组合不同类型的标准。对于您的具体解决方案,您可以使用:

value = CharMatcher.inRange('0', '9')
        .or(CharMatcher.inRange('a', 'z')
        .or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)

解决方案:

价值。replaceAll(“[^ A-Za-z0-9] ", " ")

解释:

(^ abc) 当插入符号^作为方括号内的第一个字符出现时,将取消该模式。此模式匹配除a或b或c之外的任何字符。

将关键字看作两个函数:

[(图案)]= match(图案) [^(图案)]= notMatch(图案)

此外,关于一种模式:

A-Z =从A到Z的所有字符 a-z =从a到z的所有字符 0=9 =从0到9的所有字符

因此,它将替换模式中包含的所有字符NOT


Guava的CharMatcher提供了一个简洁的解决方案:

output = CharMatcher.javaLetterOrDigit().retainFrom(input);

Dart

如果你试过了,但没有成功…

价值。replaceAll(“[^ A-Za-z0-9] ", " ");

就像这样使用RegExp:

价值replaceAll (RegExp(“[^ A-Za-z0-9]”),“”);