我需要传递给java.lang.String.split()以使用所有空白字符(' ','\t', '\n'等)作为分隔符将字符串分割为子字符串数组的正则表达式模式是什么?


当前回答

因为它是一个正则表达式,我假设你也不会想要非字母数字字符,如逗号,点,等,可以被空格包围(例如。“one, two”应该给出[one][two]),它应该是:

myString.split(/[\s\W]+/)

其他回答

“\\s+”应该可以

在大多数正则表达式方言中,都有一组方便的字符摘要可以用于这种事情——这些都是需要记住的:

\w -匹配任何单词字符。

\W -匹配任何非单词字符。

\s -匹配任何空白字符。

只匹配空白字符。

\d -匹配任何数字。

D -除数字以外的任何东西都可以匹配。

搜索“Regex Cheatsheets”,你会得到很多有用的摘要。

要使用Unicode空白分隔字符串,需要使用

s.split("(?U)\\s+")
         ^^^^

(?U)内联嵌入标志选项相当于Pattern。UNICODE_CHARACTER_CLASS使\s的简写字符类匹配空白Unicode类别中的任何字符。

如果要使用空白分隔并将空白保留在结果数组中,请使用

s.split("(?U)(?<=\\s)(?=\\S)|(?<=\\S)(?=\\s)")

参见正则表达式演示。参见Java演示:

String s = "Hello\t World\u00A0»";
System.out.println(Arrays.toString(s.split("(?U)\\s+"))); // => [Hello, World, »]
System.out.println(Arrays.toString(s.split("(?U)(?<=\\s)(?=\\S)|(?<=\\S)(?=\\s)")));
// => [Hello,    , World,  , »]

Apache Commons Lang有一个方法可以用空白字符作为分隔符分割字符串:

StringUtils.split("abc def")

http://commons.apache.org/proper/commons-lang/apidocs/org/apache/commons/lang3/StringUtils.html分裂(以)

这可能比正则表达式模式更容易使用。

你可以使用下面的语句用换行符分割字符串:

 String textStr[] = yourString.split("\\r?\\n");

你可以使用下面的语句用空格分割字符串:

String textStr[] = yourString.split("\\s+");