我需要传递给java.lang.String.split()以使用所有空白字符(' ','\t', '\n'等)作为分隔符将字符串分割为子字符串数组的正则表达式模式是什么?


当前回答

因为它是一个正则表达式,我假设你也不会想要非字母数字字符,如逗号,点,等,可以被空格包围(例如。“one, two”应该给出[one][two]),它应该是:

myString.split(/[\s\W]+/)

其他回答

因为它是一个正则表达式,我假设你也不会想要非字母数字字符,如逗号,点,等,可以被空格包围(例如。“one, two”应该给出[one][two]),它应该是:

myString.split(/[\s\W]+/)

之类的东西

myString.split("\\s+");

这将所有空格分组为分隔符。

如果我有一个字符串:

"Hello[space character][tab character]World"

这将产生字符串“Hello”和“World”,并省略[空格]和[制表符]之间的空白。

正如VonC指出的,反斜杠应该转义,因为Java首先会尝试将字符串转义为一个特殊字符,并将其发送给解析。你想要的是字面上的“\s”,这意味着你需要传递“\\s”。这可能会让人有点困惑。

s相当于[\\t\\n\\x0B\\f\ r]。

你可以使用下面的语句用换行符分割字符串:

 String textStr[] = yourString.split("\\r?\\n");

你可以使用下面的语句用空格分割字符串:

String textStr[] = yourString.split("\\s+");

Apache Commons Lang有一个方法可以用空白字符作为分隔符分割字符串:

StringUtils.split("abc def")

http://commons.apache.org/proper/commons-lang/apidocs/org/apache/commons/lang3/StringUtils.html分裂(以)

这可能比正则表达式模式更容易使用。

你也可以有一个UniCode不间断空格xA0…

String[] elements = s.split("[\\s\\xA0]+"); //include uniCode non-breaking