在Scala中,将整个文件读入内存的简单而规范的方法是什么?(理想情况下,可以控制字符编码。)

我能想到的最好的是:

scala.io.Source.fromPath("file.txt").getLines.reduceLeft(_+_)

或者我应该使用Java的一个可怕的习语,其中最好的(不使用外部库)似乎是:

import java.util.Scanner
import java.io.File
new Scanner(new File("file.txt")).useDelimiter("\\Z").next()

通过阅读邮件列表讨论,我甚至不清楚scala.io.Source是否应该是规范的I/O库。我不明白它的目的到底是什么。

... 我想要一些简单易记的东西。例如,在这些语言中,很难忘记成语……

Ruby    open("file.txt").read
Ruby    File.read("file.txt")
Python  open("file.txt").read()

当前回答

为了扩展Daniel的解决方案,你可以通过在任何需要文件操作的文件中插入下面的导入来大大缩短时间:

import scala.io.Source._

有了这个,你现在可以做:

val lines = fromFile("file.txt").getLines

我会谨慎地将整个文件读入单个String。这是一个非常坏的习惯,它会比你想象的更快更严重地伤害你。getLines方法返回一个Iterator[String]类型的值。它实际上是文件中的惰性光标,允许您只检查所需的数据,而不会有内存过剩的风险。

哦,为了回答你隐含的关于Source的问题:是的,它是规范的I/O库。大多数代码最终都使用java。由于其较低级的接口和与现有框架的更好的兼容性,但是任何有选择的代码都应该使用Source,特别是对于简单的文件操作。

其他回答

为了扩展Daniel的解决方案,你可以通过在任何需要文件操作的文件中插入下面的导入来大大缩短时间:

import scala.io.Source._

有了这个,你现在可以做:

val lines = fromFile("file.txt").getLines

我会谨慎地将整个文件读入单个String。这是一个非常坏的习惯,它会比你想象的更快更严重地伤害你。getLines方法返回一个Iterator[String]类型的值。它实际上是文件中的惰性光标,允许您只检查所需的数据,而不会有内存过剩的风险。

哦,为了回答你隐含的关于Source的问题:是的,它是规范的I/O库。大多数代码最终都使用java。由于其较低级的接口和与现有框架的更好的兼容性,但是任何有选择的代码都应该使用Source,特别是对于简单的文件操作。

(编辑:这在scala 2.9中不起作用,也许在2.8中也不起作用)

使用干:

scala> io.File("/etc/passwd").slurp
res0: String = 
##
# User Database
# 
... etc

最明显的问题是“为什么要读取整个文件?”如果您的文件非常大,这显然不是一个可伸缩的解决方案。source从getLines方法返回一个Iterator[String],这非常有用和简洁。

使用底层java IO实用程序将File、Reader或InputStream转换为String并不是什么大工作。我认为缺乏可伸缩性意味着他们没有将其添加到标准API中是正确的。

// for file with utf-8 encoding
val lines = scala.io.Source.fromFile("file.txt", "utf-8").getLines.mkString
import scala.io.source
object ReadLine{
def main(args:Array[String]){
if (args.length>0){
for (line <- Source.fromLine(args(0)).getLine())
println(line)
}
}

在参数中,你可以给出文件路径,它会返回所有行