如何将文件逐行读入列表？

如何在Python中读取文件的每一行，并将每一行存储为列表中的元素？

我想逐行读取文件，并将每一行附加到列表的末尾。

当前回答

使用Python 2和Python 3读写文本文件；它适用于Unicode

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

# Define data
lines = ['     A first string  ',
         'A Unicode sample: €',
         'German: äöüß']

# Write text file
with open('file.txt', 'w') as fp:
    fp.write('\n'.join(lines))

# Read text file
with open('file.txt', 'r') as fp:
    read_lines = fp.readlines()
    read_lines = [line.rstrip('\n') for line in read_lines]

print(lines == read_lines)

注意事项：

with是所谓的上下文管理器。它确保打开的文件再次关闭。这里的所有解决方案，只要简单地生成.strip（）或.rstrip（），就无法再现线条，因为它们也会剥离空白。

常用文件结尾

.txt

更高级的文件写入/读取

CSV：超简单格式（读写）JSON：适合编写人类可读数据；非常常用（读写）YAML:YAML是JSON的超集，但更易于阅读（读写，JSON和YAML的比较）pickle：Python序列化格式（读写）MessagePack（Python包）：更紧凑的表示（读写）HDF5（Python包）：适合矩阵（读写）XML:也存在*叹息*（读写）

对于您的应用程序，以下内容可能很重要：

其他编程语言的支持读/写性能紧凑性（文件大小）

另请参阅：数据序列化格式的比较

如果您正在寻找创建配置文件的方法，您可能需要阅读我的Python配置文件短文。

2018-01-16 19:42:10

其他回答

具有文本文件内容：

line 1
line 2
line 3

我们可以在上面txt的同一目录中使用此Python脚本

>>> with open("myfile.txt", encoding="utf-8") as file:
...     x = [l.rstrip("\n") for l in file]
>>> x
['line 1','line 2','line 3']

使用追加：

x = []
with open("myfile.txt") as file:
    for l in file:
        x.append(l.strip())

Or:

>>> x = open("myfile.txt").read().splitlines()
>>> x
['line 1', 'line 2', 'line 3']

Or:

>>> x = open("myfile.txt").readlines()
>>> x
['linea 1\n', 'line 2\n', 'line 3\n']

Or:

def print_output(lines_in_textfile):
    print("lines_in_textfile =", lines_in_textfile)

y = [x.rstrip() for x in open("001.txt")]
print_output(y)

with open('001.txt', 'r', encoding='utf-8') as file:
    file = file.read().splitlines()
    print_output(file)

with open('001.txt', 'r', encoding='utf-8') as file:
    file = [x.rstrip("\n") for x in file]
    print_output(file)

输出：

lines_in_textfile = ['line 1', 'line 2', 'line 3']
lines_in_textfile = ['line 1', 'line 2', 'line 3']
lines_in_textfile = ['line 1', 'line 2', 'line 3']

2017-04-26 04:57:33

您可以按照建议简单地执行以下操作：

with open('/your/path/file') as f:
    my_lines = f.readlines()

请注意，这种方法有两个缺点：

1）你把所有的行都存储在内存中。在一般情况下，这是一个非常糟糕的主意。文件可能非常大，内存可能会用完。即使它不大，也只是在浪费内存。

2）这不允许在读取每行时对其进行处理。因此，如果在这之后处理行，则效率不高（需要两次而不是一次）。

对于一般情况，更好的方法如下：

with open('/your/path/file') as f:
    for line in f:
        process(line)

您可以任意定义流程函数。例如：

def process(line):
    if 'save the world' in line.lower():
         superman.save_the_world()

（超人类的实现留给您作为练习）。

这对于任何文件大小都很有效，您只需一次就可以完成文件。这就是一般解析器的工作原理。

2016-02-25 09:13:38

我会尝试下面提到的方法之一。我使用的示例文件名为dummy.txt。您可以在此处找到该文件。我假设该文件与代码位于同一目录中（您可以更改fpath以包含正确的文件名和文件夹路径）。

在下面提到的两个示例中，lst给出了您想要的列表。

1.第一种方法

fpath = 'dummy.txt'
with open(fpath, "r") as f: lst = [line.rstrip('\n \t') for line in f]

print lst
>>>['THIS IS LINE1.', 'THIS IS LINE2.', 'THIS IS LINE3.', 'THIS IS LINE4.']

2.在第二种方法中，可以使用Python标准库中的csv.reader模块：

import csv
fpath = 'dummy.txt'
with open(fpath) as csv_file:
    csv_reader = csv.reader(csv_file, delimiter='   ')
    lst = [row[0] for row in csv_reader] 

print lst
>>>['THIS IS LINE1.', 'THIS IS LINE2.', 'THIS IS LINE3.', 'THIS IS LINE4.']

您可以使用这两种方法之一。两种方法创建lst所需的时间几乎相等。

2018-12-19 01:47:12

您也可以在NumPy中使用loadtxt命令。这比genfromttxt检查的条件更少，因此可能更快。

import numpy
data = numpy.loadtxt(filename, delimiter="\n")

2015-07-20 17:33:03

最简单的方法

一个简单的方法是：

将整个文件作为字符串读取逐行拆分字符串

在一行中，这将给出：

lines = open('C:/path/file.txt').read().splitlines()

然而，这是一种非常低效的方式，因为这将在内存中存储两个版本的内容（对于小文件来说可能不是大问题，但仍然如此）。[谢谢Mark Amery]。

有两种更简单的方法：

将文件用作迭代器

lines = list(open('C:/path/file.txt'))
# ... or if you want to have a list without EOL characters
lines = [l.rstrip() for l in open('C:/path/file.txt')]

如果您使用的是Python 3.4或更高版本，最好使用pathlib为文件创建一个路径，该路径可以用于程序中的其他操作：

from pathlib import Path
file_path = Path("C:/path/file.txt") 
lines = file_path.read_text().split_lines()
# ... or ... 
lines = [l.rstrip() for l in file_path.open()]

2015-02-06 03:34:48

如何将文件逐行读入列表？

推荐文章

最新文章

标签