如何将文件逐行读入列表？

如何在Python中读取文件的每一行，并将每一行存储为列表中的元素？

我想逐行读取文件，并将每一行附加到列表的末尾。

当前回答

参见输入和输出：

with open('filename') as f:
    lines = f.readlines()

或者去掉换行符：

with open('filename') as f:
    lines = [line.rstrip('\n') for line in f]

2010-07-18 22:28:10

其他回答

这段代码将把整个文件读入内存，并删除每行末尾的所有空白字符（换行符和空格）：

with open(filename) as file:
    lines = [line.rstrip() for line in file]

如果您正在处理一个大文件，那么您应该逐行读取并处理它：

with open(filename) as file:
    for line in file:
        print(line.rstrip())

在Python 3.8及以上版本中，可以使用while循环和walrus运算符，如下所示：

with open(filename) as file:
    while (line := file.readline().rstrip()):
        print(line)

根据您计划对文件执行的操作以及文件的编码方式，您可能还需要手动设置访问模式和字符编码：

with open(filename, 'r', encoding='UTF-8') as file:
    while (line := file.readline().rstrip()):
        print(line)

2010-07-18 22:28:32

这比必要的更明确，但可以做到你想要的。

with open("file.txt") as file_in:
    lines = []
    for line in file_in:
        lines.append(line)

2010-07-18 22:27:26

您可以按照建议简单地执行以下操作：

with open('/your/path/file') as f:
    my_lines = f.readlines()

请注意，这种方法有两个缺点：

1）你把所有的行都存储在内存中。在一般情况下，这是一个非常糟糕的主意。文件可能非常大，内存可能会用完。即使它不大，也只是在浪费内存。

2）这不允许在读取每行时对其进行处理。因此，如果在这之后处理行，则效率不高（需要两次而不是一次）。

对于一般情况，更好的方法如下：

with open('/your/path/file') as f:
    for line in f:
        process(line)

您可以任意定义流程函数。例如：

def process(line):
    if 'save the world' in line.lower():
         superman.save_the_world()

（超人类的实现留给您作为练习）。

这对于任何文件大小都很有效，您只需一次就可以完成文件。这就是一般解析器的工作原理。

2016-02-25 09:13:38

大纲和摘要

使用文件名，从Path（filename）对象处理文件，或直接将open（filename）作为f，执行以下操作之一：

列表（fileinput.input（文件名））使用path.open（）作为f，调用f.readlines（）列表（f）path.read_text（）.splitline（）path.read_text（）.splitlines（keepends=True）迭代fileinput.input或f和list.append每行一次将f传递给绑定的list.extend方法在列表理解中使用f

我将在下面解释每一个的用例。

在Python中，如何逐行读取文件？

这是一个很好的问题。首先，让我们创建一些示例数据：

from pathlib import Path
Path('filename').write_text('foo\nbar\nbaz')

文件对象是惰性迭代器，所以只需对其进行迭代。

filename = 'filename'
with open(filename) as f:
    for line in f:
        line # do something with the line

或者，如果您有多个文件，请使用另一个惰性迭代器fileinput.input。只有一个文件：

import fileinput

for line in fileinput.input(filename): 
    line # process the line

或者对于多个文件，向其传递文件名列表：

for line in fileinput.input([filename]*2): 
    line # process the line

同样，上面的f和fileinput.input都是/return惰性迭代器。您只能使用一次迭代器，因此为了在提供函数代码的同时避免冗长，我将在此处使用稍微简洁的fileinput.input（文件名）。

在Python中，如何将文件逐行读入列表？

啊，但出于某种原因，你想把它列在列表中？如果可能的话，我会避免。但如果你坚持。。。只需将fileinput.input（文件名）的结果传递给列表：

list(fileinput.input(filename))

另一个直接的答案是调用f.readlines，它返回文件的内容（最多为可选的提示字符数，因此您可以这样将其分解为多个列表）。

您可以通过两种方式访问此文件对象。一种方法是将文件名传递给打开的内置程序：

filename = 'filename'

with open(filename) as f:
    f.readlines()

或者使用pathlib模块中的新Path对象（我已经非常喜欢它，并将从这里开始使用）：

from pathlib import Path

path = Path(filename)

with path.open() as f:
    f.readlines()

list还将使用文件迭代器并返回一个列表-这也是一个非常直接的方法：

with path.open() as f:
    list(f)

如果您不介意在拆分之前将整个文本作为一个字符串读入内存，那么可以使用Path对象和splitlines（）字符串方法将其作为一行代码。默认情况下，拆分线会删除换行符：

path.read_text().splitlines()

如果要保留换行符，请传递keepends=True：

path.read_text().splitlines(keepends=True)

我想逐行读取文件，并将每一行附加到列表的末尾。

现在，考虑到我们已经用几种方法轻松地演示了最终结果，这一要求有点愚蠢。但在列出列表时，您可能需要对行进行筛选或操作，所以让我们来幽默一下这个请求。

使用list.append可以在附加每一行之前对其进行筛选或操作：

line_list = []
for line in fileinput.input(filename):
    line_list.append(line)

line_list

使用list.extend会更直接一些，如果您有一个预先存在的列表，可能会有用：

line_list = []
line_list.extend(fileinput.input(filename))
line_list

或者更惯用地说，我们可以使用列表理解，并根据需要在其中进行映射和过滤：

[line for line in fileinput.input(filename)]

或者更直接地，要关闭圆，只需将其传递到列表即可直接创建新列表，而无需对行进行操作：

list(fileinput.input(filename))

结论

您已经看到了许多将文件中的行放入列表的方法，但我建议您避免将大量数据具体化到列表中，而是尽可能使用Python的惰性迭代来处理数据。

也就是说，首选fileinput.input或path.open（）作为f。

2018-05-16 20:17:51

如果文档中也有空行，我希望读取内容并将其通过过滤器以防止空字符串元素

with open(myFile, "r") as f:
    excludeFileContent = list(filter(None, f.read().splitlines()))

2019-01-16 21:30:43

如何将文件逐行读入列表？

推荐文章

最新文章

标签