在Scala中读取整个文件?

在Scala中，将整个文件读入内存的简单而规范的方法是什么?(理想情况下，可以控制字符编码。)

我能想到的最好的是:

scala.io.Source.fromPath("file.txt").getLines.reduceLeft(_+_)

或者我应该使用Java的一个可怕的习语，其中最好的(不使用外部库)似乎是:

import java.util.Scanner
import java.io.File
new Scanner(new File("file.txt")).useDelimiter("\\Z").next()

通过阅读邮件列表讨论，我甚至不清楚scala.io.Source是否应该是规范的I/O库。我不明白它的目的到底是什么。

．.．我想要一些简单易记的东西。例如，在这些语言中，很难忘记成语……

Ruby    open("file.txt").read
Ruby    File.read("file.txt")
Python  open("file.txt").read()

当前回答

还有一个:https://github.com/pathikrit/better-files#streams-and-codecs

有多种方法可以在不将内容加载到内存的情况下获取文件:

val bytes  : Iterator[Byte]            = file.bytes
val chars  : Iterator[Char]            = file.chars
val lines  : Iterator[String]          = file.lines
val source : scala.io.BufferedSource   = file.content

你也可以为任何执行读/写操作的东西提供你自己的编解码器(如果你没有提供，它会假设scala.io.Codec.default):

val content: String = file.contentAsString  // default codec
// custom codec:
import scala.io.Codec
file.contentAsString(Codec.ISO8859)
//or
import scala.io.Codec.string2codec
file.write("hello world")(codec = "US-ASCII")

2015-09-18 08:43:19

其他回答

正如一些人提到的，scala.io.Source最好避免使用，因为它会导致连接泄漏。

也许scalax和像commons-io这样的纯java库是最好的选择，直到新的孵化器项目(即scala-io)被合并。

2010-01-28 20:30:48

(编辑:这在scala 2.9中不起作用，也许在2.8中也不起作用)

使用干:

scala> io.File("/etc/passwd").slurp
res0: String = 
##
# User Database
# 
... etc

2009-08-25 20:33:03

Java 8 +

import java.nio.charset.StandardCharsets
import java.nio.file.{Files, Paths}

val path = Paths.get("file.txt")
new String(Files.readAllBytes(path), StandardCharsets.UTF_8)

Java 11 +

import java.nio.charset.StandardCharsets
import java.nio.file.{Files, Path}

val path = Path.of("file.txt")
Files.readString(path, StandardCharsets.UTF_8)

它们提供了对字符编码的控制，并且不需要清理资源。由于更高效的分配模式，它也比其他模式(例如getLines(). mkstring ("\n"))更快。

2016-09-15 06:29:17

你可以使用

Source.fromFile(fileName).getLines().mkString

但是应该注意的是，getLines()删除了所有新的行字符。如果你想保存格式，你应该使用

Source.fromFile(fileName).iter.mkString

2021-01-12 21:55:00

val lines = scala.io.Source.fromFile("file.txt").mkString

顺便说一下，“scala.”并不是真正必要的，因为它总是在作用域中，当然，您可以完全或部分地导入io的内容，而不必在前面加上“io.”。

但是，上面的操作使文件保持打开状态。为了避免问题，你应该像这样关闭它:

val source = scala.io.Source.fromFile("file.txt")
val lines = try source.mkString finally source.close()

上面代码的另一个问题是，由于它的实现，它非常慢。对于较大的文件，应该使用:

source.getLines mkString "\n"

2009-08-16 14:41:54

在Scala中读取整个文件?

推荐文章

最新文章

标签