在Scala中读取整个文件?

在Scala中，将整个文件读入内存的简单而规范的方法是什么?(理想情况下，可以控制字符编码。)

我能想到的最好的是:

scala.io.Source.fromPath("file.txt").getLines.reduceLeft(_+_)

或者我应该使用Java的一个可怕的习语，其中最好的(不使用外部库)似乎是:

import java.util.Scanner
import java.io.File
new Scanner(new File("file.txt")).useDelimiter("\\Z").next()

通过阅读邮件列表讨论，我甚至不清楚scala.io.Source是否应该是规范的I/O库。我不明白它的目的到底是什么。

．.．我想要一些简单易记的东西。例如，在这些语言中，很难忘记成语……

Ruby    open("file.txt").read
Ruby    File.read("file.txt")
Python  open("file.txt").read()

当前回答

为了扩展Daniel的解决方案，你可以通过在任何需要文件操作的文件中插入下面的导入来大大缩短时间:

import scala.io.Source._

有了这个，你现在可以做:

val lines = fromFile("file.txt").getLines

我会谨慎地将整个文件读入单个String。这是一个非常坏的习惯，它会比你想象的更快更严重地伤害你。getLines方法返回一个Iterator[String]类型的值。它实际上是文件中的惰性光标，允许您只检查所需的数据，而不会有内存过剩的风险。

哦，为了回答你隐含的关于Source的问题:是的，它是规范的I/O库。大多数代码最终都使用java。由于其较低级的接口和与现有框架的更好的兼容性，但是任何有选择的代码都应该使用Source，特别是对于简单的文件操作。

2009-08-17 04:25:42

其他回答

你可以使用

Source.fromFile(fileName).getLines().mkString

但是应该注意的是，getLines()删除了所有新的行字符。如果你想保存格式，你应该使用

Source.fromFile(fileName).iter.mkString

2021-01-12 21:55:00

有人告诉我Source.fromFile有问题。就我个人而言，我在使用Source.fromFile打开大文件时遇到过问题，不得不求助于Java InputStreams。

另一个有趣的解决方案是使用scalax。下面是一些注释良好的代码示例，它使用ManagedResource打开日志文件，使用scalax helper打开文件:http://pastie.org/pastes/420714

2009-08-20 19:23:26

打印每一行，就像使用Java BufferedReader读取每一行，然后打印它:

scala.io.Source.fromFile("test.txt" ).foreach{  print  }

相当于:

scala.io.Source.fromFile("test.txt" ).foreach( x => print(x))

2013-08-30 01:30:19

Java 8 +

import java.nio.charset.StandardCharsets
import java.nio.file.{Files, Paths}

val path = Paths.get("file.txt")
new String(Files.readAllBytes(path), StandardCharsets.UTF_8)

Java 11 +

import java.nio.charset.StandardCharsets
import java.nio.file.{Files, Path}

val path = Path.of("file.txt")
Files.readString(path, StandardCharsets.UTF_8)

它们提供了对字符编码的控制，并且不需要清理资源。由于更高效的分配模式，它也比其他模式(例如getLines(). mkstring ("\n"))更快。

2016-09-15 06:29:17

// for file with utf-8 encoding
val lines = scala.io.Source.fromFile("file.txt", "utf-8").getLines.mkString

2009-08-16 15:47:22

在Scala中读取整个文件?

推荐文章

最新文章

标签