我有一个Java字符串对象。我只需要从中提取数字。我举个例子:

123456-789我要123456789

是否存在只提取数字的库函数?

谢谢你的回答。在我尝试这些之前,我需要知道我是否必须安装任何额外的llibraries?


当前回答

我已经确定了电话号码+9(987)124124的代码。

Unicode字符占用4个字节。

public static String stripNonDigitsV2( CharSequence input ) {
    if (input == null)
        return null;
    if ( input.length() == 0 )
        return "";

    char[] result = new char[input.length()];
    int cursor = 0;
    CharBuffer buffer = CharBuffer.wrap( input );
    int i=0;
    while ( i< buffer.length()  ) { //buffer.hasRemaining()
        char chr = buffer.get(i);
        if (chr=='u'){
            i=i+5;
            chr=buffer.get(i);
        }

        if ( chr > 39 && chr < 58 )
            result[cursor++] = chr;
        i=i+1;
    }

    return new String( result, 0, cursor );
}

其他回答

使用谷歌番石榴:

CharMatcher.DIGIT.retainFrom("123-456-789");

CharMatcher是可插拔的,使用起来非常有趣,例如,你可以做以下事情:

String input = "My phone number is 123-456-789!";
String output = CharMatcher.is('-').or(CharMatcher.DIGIT).retainFrom(input);

输出== 123-456-789

我受到代码肖恩·帕特里克·弗洛伊德的启发,为了获得最大的性能,我重写了它。

public static String stripNonDigitsV2( CharSequence input ) {
    if (input == null)
        return null;
    if ( input.length() == 0 )
        return "";

    char[] result = new char[input.length()];
    int cursor = 0;
    CharBuffer buffer = CharBuffer.wrap( input );

    while ( buffer.hasRemaining() ) {
        char chr = buffer.get();
        if ( chr > 47 && chr < 58 )
            result[cursor++] = chr;
    }

    return new String( result, 0, cursor );
}

我做性能测试非常长的字符串与最小的数字和结果是:

原始代码慢了255% 番石榴法要慢2.5-3倍 使用D+的正则表达式要慢3-3.5倍 只有D的正则表达式要慢25倍以上

顺便说一下,这取决于字符串的长度。字符串只包含6个数字是番石榴慢50%和regexp慢1倍

这里有一个更详细的解决方案。不那么优雅,但可能更快:

public static String stripNonDigits(
            final CharSequence input /* inspired by seh's comment */){
    final StringBuilder sb = new StringBuilder(
            input.length() /* also inspired by seh's comment */);
    for(int i = 0; i < input.length(); i++){
        final char c = input.charAt(i);
        if(c > 47 && c < 58){
            sb.append(c);
        }
    }
    return sb.toString();
}

测试代码:

public static void main(final String[] args){
    final String input = "0-123-abc-456-xyz-789";
    final String result = stripNonDigits(input);
    System.out.println(result);
}

输出:

0123456789

顺便说一句:我没有使用Character.isDigit(ch),因为它接受许多其他字符,除了0 - 9。

input.replaceAll("[^0-9?!\\.]","")

这将忽略小数点。

例如:如果你有一个445.3公斤的输入,输出将是445.3公斤。

使用谷歌番石榴:

CharMatcher.inRange('0','9').retainFrom("123-456-789")

更新:

使用Precomputed CharMatcher可以进一步提高性能

CharMatcher ASCII_DIGITS=CharMatcher.inRange('0','9').precomputed();  
ASCII_DIGITS.retainFrom("123-456-789");