如何将文件逐行读入列表？

如何在Python中读取文件的每一行，并将每一行存储为列表中的元素？

我想逐行读取文件，并将每一行附加到列表的末尾。

当前回答

如果要包含以下内容：

with open(fname) as f:
    content = f.readlines()

如果不希望包含：

with open(fname) as f:
    content = f.read().splitlines()

2014-03-02 04:22:39

其他回答

最简单的方法是：

lines = list(open('filename'))

lines = tuple(open('filename'))

lines = set(open('filename'))

在set的情况下，我们必须记住，我们没有保留行顺序，并删除重复的行。

下面我添加了@MarkAmery的一个重要补充：

由于您既没有在文件对象上调用.close，也没有使用with语句，因此在某些Python实现中，文件在读取后可能不会关闭，您的进程将泄漏打开的文件句柄。在CPython（大多数人使用的普通Python实现）中，这不是问题，因为文件对象将立即被垃圾收集，这将关闭文件，但通常认为最好的做法是：

with open('filename') as f: lines = list(f)

以确保无论您使用的是什么Python实现，文件都会被关闭。

2019-03-14 14:28:53

使用此项：

import pandas as pd
data = pd.read_csv(filename) # You can also add parameters such as header, sep, etc.
array = data.values

data是一种数据帧类型，使用值获取ndarray。您还可以使用array.tolist（）获取列表。

2016-03-30 15:50:32

要将文件读取到列表中，需要执行以下三项操作：

打开文件读取文件将内容存储为列表

幸运的是，Python非常容易做到这些，所以将文件读入列表的最短方法是：

lst = list(open(filename))

不过，我会补充一些解释。

打开文件

我假设您想打开一个特定的文件，而不直接处理文件句柄（或类似文件的句柄）。Python中最常用的打开文件的函数是open，在Python 2.7中它需要一个强制参数和两个可选参数：

文件名模式缓冲（我将忽略这个答案中的这个参数）

文件名应该是表示文件路径的字符串。例如：

open('afile')   # opens the file named afile in the current working directory
open('adir/afile')            # relative path (relative to the current working directory)
open('C:/users/aname/afile')  # absolute path (windows)
open('/usr/local/afile')      # absolute path (linux)

请注意，需要指定文件扩展名。这对于Windows用户尤其重要，因为在浏览器中查看时，默认情况下，.txt或.doc等文件扩展名是隐藏的。

第二个参数是mode，默认为r，表示“只读”。这正是你需要的。

但如果你真的想要创建一个文件和/或写入一个文件，你需要一个不同的参数。如果你想要一个概览，有一个很好的答案。

对于读取文件，可以省略模式或显式传入：

open(filename)
open(filename, 'r')

两者都将以只读模式打开文件。如果您想在Windows上读取二进制文件，则需要使用模式rb：

open(filename, 'rb')

在其他平台上，“b”（二进制模式）被简单地忽略。

既然我已经演示了如何打开该文件，那么让我们来谈谈您总是需要再次关闭它的事实。否则，它将保持文件的打开文件句柄，直到进程退出（或Python破坏文件句柄）。

虽然您可以使用：

f = open(filename)
# ... do stuff with f
f.close()

当打开和关闭之间发生异常时，将无法关闭文件。您可以通过尝试并最终：

f = open(filename)
# nothing in between!
try:
    # do stuff with f
finally:
    f.close()

然而，Python提供的上下文管理器具有更漂亮的语法（但对于open，它几乎与上面的try和finally相同）：

with open(filename) as f:
    # do stuff with f
# The file is always closed after the with-scope ends.

最后一种方法是用Python打开文件的推荐方法！

正在读取文件

好的，你已经打开了文件，现在如何阅读？

open函数返回一个文件对象，它支持Pythons迭代协议。每次迭代都会给你一行：

with open(filename) as f:
    for line in f:
        print(line)

这将打印文件的每一行。但是，请注意，每一行结尾都将包含一个换行符（您可能需要检查Python是否具有通用换行符支持，否则您也可以在Windows或Mac上使用换行符）。如果您不想这样做，可以简单地删除最后一个字符（或Windows上的最后两个字符）：

with open(filename) as f:
    for line in f:
        print(line[:-1])

但最后一行不一定有换行符，所以不应该使用它。可以检查它是否以尾随换行符结尾，如果是，请将其删除：

with open(filename) as f:
    for line in f:
        if line.endswith('\n'):
            line = line[:-1]
        print(line)

但是您可以简单地删除字符串末尾的所有空格（包括字符），这也会删除所有其他尾随空格，因此如果这些空格很重要，您必须小心：

with open(filename) as f:
    for line in f:
        print(f.rstrip())

但是，如果行以\r\n（Windows“newlines”）结尾，.rstrip（）也会处理\r！

将内容存储为列表

既然您知道了如何打开文件并读取它，现在是将内容存储在列表中的时候了。最简单的选择是使用list函数：

with open(filename) as f:
    lst = list(f)

如果你想去掉后面的换行符，你可以使用列表理解：

with open(filename) as f:
    lst = [line.rstrip() for line in f]

或者更简单：默认情况下，file对象的.readlines（）方法返回一个行列表：

with open(filename) as f:
    lst = f.readlines()

这还将包括后面的换行符，如果你不想要它们，我建议使用[line.rstrip（）for line-in-f]方法，因为它避免了在内存中保留包含所有行的两个列表。

有一个额外的选项可以获得所需的输出，但它相当“次优”：读取字符串中的完整文件，然后在换行符上拆分：

with open(filename) as f:
    lst = f.read().split('\n')

or:

with open(filename) as f:
    lst = f.read().splitlines()

因为不包含拆分字符，所以它们会自动处理尾随换行符。然而，它们并不理想，因为您将文件保存为字符串和内存中的行列表！

总结

在打开文件时使用with open（…）作为f，因为您不需要自己关闭文件，即使发生异常，它也会关闭文件。文件对象支持迭代协议，因此逐行读取文件与file_object:中的行一样简单。始终浏览文档以查找可用的函数/类。大多数时候，这项任务有一个完美的匹配，或者至少有一两个好的匹配。在这种情况下，明显的选择是readlines（），但如果您想在将行存储在列表中之前处理它们，我建议您进行简单的列表理解。

2018-01-16 22:33:57

f = open("your_file.txt",'r')
out = f.readlines() # will append in the list out

现在，变量out是您想要的列表（数组）。您可以选择：

for line in out:
    print (line)

Or:

for line in f:
    print (line)

你会得到同样的结果。

2014-01-12 10:58:04

这将从文件中生成一个“数组”。

lines = tuple(open(filename, 'r'))

open返回一个可以迭代的文件。当您遍历一个文件时，您会从该文件中获取行。tuple可以使用迭代器，并从您给它的迭代器中为您实例化一个tuple实例。

2010-07-18 22:27:24

如何将文件逐行读入列表？

推荐文章

最新文章

标签