在Scala中,将整个文件读入内存的简单而规范的方法是什么?(理想情况下,可以控制字符编码。)
我能想到的最好的是:
scala.io.Source.fromPath("file.txt").getLines.reduceLeft(_+_)
或者我应该使用Java的一个可怕的习语,其中最好的(不使用外部库)似乎是:
import java.util.Scanner
import java.io.File
new Scanner(new File("file.txt")).useDelimiter("\\Z").next()
通过阅读邮件列表讨论,我甚至不清楚scala.io.Source是否应该是规范的I/O库。我不明白它的目的到底是什么。
... 我想要一些简单易记的东西。例如,在这些语言中,很难忘记成语……
Ruby open("file.txt").read
Ruby File.read("file.txt")
Python open("file.txt").read()
Java 8 +
import java.nio.charset.StandardCharsets
import java.nio.file.{Files, Paths}
val path = Paths.get("file.txt")
new String(Files.readAllBytes(path), StandardCharsets.UTF_8)
Java 11 +
import java.nio.charset.StandardCharsets
import java.nio.file.{Files, Path}
val path = Path.of("file.txt")
Files.readString(path, StandardCharsets.UTF_8)
它们提供了对字符编码的控制,并且不需要清理资源。由于更高效的分配模式,它也比其他模式(例如getLines(). mkstring ("\n"))更快。
为了扩展Daniel的解决方案,你可以通过在任何需要文件操作的文件中插入下面的导入来大大缩短时间:
import scala.io.Source._
有了这个,你现在可以做:
val lines = fromFile("file.txt").getLines
我会谨慎地将整个文件读入单个String。这是一个非常坏的习惯,它会比你想象的更快更严重地伤害你。getLines方法返回一个Iterator[String]类型的值。它实际上是文件中的惰性光标,允许您只检查所需的数据,而不会有内存过剩的风险。
哦,为了回答你隐含的关于Source的问题:是的,它是规范的I/O库。大多数代码最终都使用java。由于其较低级的接口和与现有框架的更好的兼容性,但是任何有选择的代码都应该使用Source,特别是对于简单的文件操作。
如果您不介意第三方依赖,您应该考虑使用我的OS-Lib库。这使得读取/写入文件和使用文件系统非常方便:
// Make sure working directory exists and is empty
val wd = os.pwd/"out"/"splash"
os.remove.all(wd)
os.makeDir.all(wd)
// Read/write files
os.write(wd/"file.txt", "hello")
os.read(wd/"file.txt") ==> "hello"
// Perform filesystem operations
os.copy(wd/"file.txt", wd/"copied.txt")
os.list(wd) ==> Seq(wd/"copied.txt", wd/"file.txt")
使用单行帮助程序,用于读取字节、读取块、读取行和许多其他有用/常见操作