我试图在JTextArea中使用正则表达式分割文本,通过\n分割字符串,然而,这并不奏效,我也尝试了\r\n|\r|n和许多其他正则表达式组合。 代码:

public void insertUpdate(DocumentEvent e) {
    String split[], docStr = null;
    Document textAreaDoc = (Document)e.getDocument();

    try {
        docStr = textAreaDoc.getText(textAreaDoc.getStartPosition().getOffset(), textAreaDoc.getEndPosition().getOffset());
    } catch (BadLocationException e1) {
        // TODO Auto-generated catch block
        e1.printStackTrace();
    }

    split = docStr.split("\\n");
}

当前回答

遗憾的是,Java缺少一种既简单又有效的方法来用固定的字符串分割字符串。String::split和stream API都很复杂,而且相对较慢。此外,它们可以产生不同的结果。

split检查它的输入,然后每次都编译为java.util.regex.Pattern(除非输入只包含一个安全的字符)。

然而,一旦它被编译,Pattern是非常快的。所以最好的解决方案是预编译模式:

private static final Pattern LINE_SEP_PATTERN = Pattern.compile("\\R");

然后这样使用它:

String[] lines = LINE_SEP_PATTERN.split(input);

从Java 8开始,\R匹配Unicode指定的任何换行符。在Java 8之前,你可以使用这样的代码:

Pattern.compile(Pattern.quote(System.lineSeparator()))

其他回答

如果你不想要空行:

String.split("[\\r\\n]+")

作为前面答案的替代方案,如果要对结果行应用其他操作,如修剪行或过滤空行,可以使用guava的Splitter API:

import com.google.common.base.Splitter;

Iterable<String> split = Splitter.onPattern("\r?\n").trimResults().omitEmptyStrings().split(docStr);

注意,结果是Iterable而不是数组。

城里新来了一个男孩,所以你不需要处理所有这些复杂的事情。 从JDK 11开始,只需要编写一行代码,它会分割行并返回字符串流。

public class MyClass {
public static void main(String args[]) {
   Stream<String> lines="foo \n bar \n baz".lines();
   //Do whatever you want to do with lines
}}

一些参考。 https://docs.oracle.com/en/java/javase/11/docs/api/java.base/java/lang/String.html(行) https://www.azul.com/90-new-features-and-apis-in-jdk-11/

我希望这对一些人有所帮助。快乐的编码。

在JDK11中,String类有一个lines()方法:

返回从此字符串中提取的行流,以 行结束符。

此外,文件继续说:

行结束符是以下之一:换行字符"\n" (U+000A),一个回车字符“\r”(U+000D),或者一个回车 返回后跟换行“\r\n”(U+000D U+000A)。一个 行是0个或多个字符的序列,后跟一个 行结束符,或者它是一个或多个字符的序列 后面跟着字符串的末尾。行不包括行 终结者。

这一个可以简单地做:

Stream<String> stream = str.lines();

然后如果你想要一个数组:

String[] array = str.lines().toArray(String[]::new);

鉴于此方法返回一个流,它为您提供了许多选项,因为它使您能够编写简洁和声明性的可能并行操作的表达式。

java-11中的String类引入了一个新的方法lines,它返回Stream<String>

返回从已分区的字符串中提取的子字符串流 通过行终止符。 识别的行终止符为换行符“\n”(U+000A)、回车 返回"\r" (U+000D)和后面紧跟a的回车 换行“\r\n”(U+000D U+000A)。

下面是一些例子:

jshell> "lorem \n ipusm \n sit".lines().forEach(System.out::println)
lorem
 ipusm
 sit

jshell> "lorem \n ipusm \r  sit".lines().forEach(System.out::println)
lorem
 ipusm
  sit

jshell> "lorem \n ipusm \r\n  sit".lines().forEach(System.out::println)
lorem
 ipusm
  sit

字符串#行()