我需要传递给java.lang.String.split()以使用所有空白字符(' ','\t', '\n'等)作为分隔符将字符串分割为子字符串数组的正则表达式模式是什么?


当前回答

Apache Commons Lang有一个方法可以用空白字符作为分隔符分割字符串:

StringUtils.split("abc def")

http://commons.apache.org/proper/commons-lang/apidocs/org/apache/commons/lang3/StringUtils.html分裂(以)

这可能比正则表达式模式更容易使用。

其他回答

你所需要的是使用Java Ragex引擎的一个特殊字符来分割,

那就是- WhiteSpace Character

\d表示数字:[0-9] \D表示非数字:[^0-9] \s表示一个空白字符,包括[\t\n\x0B\f\r] \S表示非空格字符,如[^\ S] \v表示垂直空格字符[\n\x0B\f\r\x85\u2028\u2029] \V表示一个非垂直空格字符,如[^\ V] \w表示单词字符[a- za - z_0 -9] \W表示非单词字符,如[^\ W]

在这里,要记住的关键点是,小字母字符\s表示所有类型的空白,包括单个空格[]、制表符[]或任何类似的空格。

所以,如果你尝试一下会像这样

String theString = "Java<a space><a tab>Programming"
String []allParts = theString.split("\\s+");

您将得到所需的输出。


一些非常有用的链接:

Split()方法 Regexr split-Java 11 RegularExpInfo PatternClass


希望,这可能会帮助你最好!!

为了让它在Javascript中工作,我必须做以下工作:

myString.split(/\s+/g)

你也可以有一个UniCode不间断空格xA0…

String[] elements = s.split("[\\s\\xA0]+"); //include uniCode non-breaking

学习代码..祝你好运

    import java.util.*;
class Demo{
    public static void main(String args[]){
        Scanner input = new Scanner(System.in);
        System.out.print("Input String : ");
        String s1 = input.nextLine();   
        String[] tokens = s1.split("[\\s\\xA0]+");      
        System.out.println(tokens.length);      
        for(String s : tokens){
            System.out.println(s);

        } 
    }
}

要使用Unicode空白分隔字符串,需要使用

s.split("(?U)\\s+")
         ^^^^

(?U)内联嵌入标志选项相当于Pattern。UNICODE_CHARACTER_CLASS使\s的简写字符类匹配空白Unicode类别中的任何字符。

如果要使用空白分隔并将空白保留在结果数组中,请使用

s.split("(?U)(?<=\\s)(?=\\S)|(?<=\\S)(?=\\s)")

参见正则表达式演示。参见Java演示:

String s = "Hello\t World\u00A0»";
System.out.println(Arrays.toString(s.split("(?U)\\s+"))); // => [Hello, World, »]
System.out.println(Arrays.toString(s.split("(?U)(?<=\\s)(?=\\S)|(?<=\\S)(?=\\s)")));
// => [Hello,    , World,  , »]