如何将文件逐行读入列表？

如何在Python中读取文件的每一行，并将每一行存储为列表中的元素？

我想逐行读取文件，并将每一行附加到列表的末尾。

当前回答

您可以按照建议简单地执行以下操作：

with open('/your/path/file') as f:
    my_lines = f.readlines()

请注意，这种方法有两个缺点：

1）你把所有的行都存储在内存中。在一般情况下，这是一个非常糟糕的主意。文件可能非常大，内存可能会用完。即使它不大，也只是在浪费内存。

2）这不允许在读取每行时对其进行处理。因此，如果在这之后处理行，则效率不高（需要两次而不是一次）。

对于一般情况，更好的方法如下：

with open('/your/path/file') as f:
    for line in f:
        process(line)

您可以任意定义流程函数。例如：

def process(line):
    if 'save the world' in line.lower():
         superman.save_the_world()

（超人类的实现留给您作为练习）。

这对于任何文件大小都很有效，您只需一次就可以完成文件。这就是一般解析器的工作原理。

2016-02-25 09:13:38

其他回答

如果要包含以下内容：

with open(fname) as f:
    content = f.readlines()

如果不希望包含：

with open(fname) as f:
    content = f.read().splitlines()

2014-03-02 04:22:39

这将从文件中生成一个“数组”。

lines = tuple(open(filename, 'r'))

open返回一个可以迭代的文件。当您遍历一个文件时，您会从该文件中获取行。tuple可以使用迭代器，并从您给它的迭代器中为您实例化一个tuple实例。

2010-07-18 22:27:24

我会尝试下面提到的方法之一。我使用的示例文件名为dummy.txt。您可以在此处找到该文件。我假设该文件与代码位于同一目录中（您可以更改fpath以包含正确的文件名和文件夹路径）。

在下面提到的两个示例中，lst给出了您想要的列表。

1.第一种方法

fpath = 'dummy.txt'
with open(fpath, "r") as f: lst = [line.rstrip('\n \t') for line in f]

print lst
>>>['THIS IS LINE1.', 'THIS IS LINE2.', 'THIS IS LINE3.', 'THIS IS LINE4.']

2.在第二种方法中，可以使用Python标准库中的csv.reader模块：

import csv
fpath = 'dummy.txt'
with open(fpath) as csv_file:
    csv_reader = csv.reader(csv_file, delimiter='   ')
    lst = [row[0] for row in csv_reader] 

print lst
>>>['THIS IS LINE1.', 'THIS IS LINE2.', 'THIS IS LINE3.', 'THIS IS LINE4.']

您可以使用这两种方法之一。两种方法创建lst所需的时间几乎相等。

2018-12-19 01:47:12

最简单的方法是：

lines = list(open('filename'))

lines = tuple(open('filename'))

lines = set(open('filename'))

在set的情况下，我们必须记住，我们没有保留行顺序，并删除重复的行。

下面我添加了@MarkAmery的一个重要补充：

由于您既没有在文件对象上调用.close，也没有使用with语句，因此在某些Python实现中，文件在读取后可能不会关闭，您的进程将泄漏打开的文件句柄。在CPython（大多数人使用的普通Python实现）中，这不是问题，因为文件对象将立即被垃圾收集，这将关闭文件，但通常认为最好的做法是：

with open('filename') as f: lines = list(f)

以确保无论您使用的是什么Python实现，文件都会被关闭。

2019-03-14 14:28:53

下面是我用来简化文件I/O的Python（3）助手库类：

import os

# handle files using a callback method, prevents repetition
def _FileIO__file_handler(file_path, mode, callback = lambda f: None):
  f = open(file_path, mode)
  try:
    return callback(f)
  except Exception as e:
    raise IOError("Failed to %s file" % ["write to", "read from"][mode.lower() in "r rb r+".split(" ")])
  finally:
    f.close()


class FileIO:
  # return the contents of a file
  def read(file_path, mode = "r"):
    return __file_handler(file_path, mode, lambda rf: rf.read())

  # get the lines of a file
  def lines(file_path, mode = "r", filter_fn = lambda line: len(line) > 0):
    return [line for line in FileIO.read(file_path, mode).strip().split("\n") if filter_fn(line)]

  # create or update a file (NOTE: can also be used to replace a file's original content)
  def write(file_path, new_content, mode = "w"):
    return __file_handler(file_path, mode, lambda wf: wf.write(new_content))

  # delete a file (if it exists)
  def delete(file_path):
    return os.remove() if os.path.isfile(file_path) else None

然后使用FileIO.lines函数，如下所示：

file_ext_lines = FileIO.lines("./path/to/file.ext"):
for i, line in enumerate(file_ext_lines):
  print("Line {}: {}".format(i + 1, line))

请记住，mode（默认为“r”）和filter_fn（默认为检查空行）参数是可选的。

您甚至可以删除read、write和delete方法，只保留FileIO.line，甚至将其转换为一个单独的方法read_lines。

2019-04-20 14:44:31

如何将文件逐行读入列表？

推荐文章

最新文章

标签