如何读一个文本文件到一个列表或数组与Python

我试图将文本文件的行读入python中的列表或数组。我只需要能够单独访问列表或数组中的任何项目后，它被创建。

文本文件的格式如下:

0,0,200,0,53,1,0,255,...,0.

哪里…在上面，有实际的文本文件有数百或数千个项目。

我正在使用下面的代码来尝试将文件读入一个列表:

text_file = open("filename.dat", "r")
lines = text_file.readlines()
print lines
print len(lines)
text_file.close()

我得到的输出是:

['0,0,200,0,53,1,0,255,...,0.']
1

显然，它是将整个文件读入一个只有一个项的列表，而不是一个包含单个项的列表。我做错了什么?

当前回答

你也可以像loadtxt一样使用numpy

from numpy import loadtxt
lines = loadtxt("filename.dat", comments="#", delimiter=",", unpack=False)

2013-02-04 10:46:55

其他回答

你必须使用split()将你的字符串分割成一个值列表

So,

lines = text_file.read().split(',')

编辑: 我没有意识到它会有这么大的吸引力。这里有一个更习惯的方法。

import csv
with open('filename.csv', 'r') as fd:
    reader = csv.reader(fd)
    for row in reader:
        # do something

2013-02-03 19:29:10

你也可以像loadtxt一样使用numpy

from numpy import loadtxt
lines = loadtxt("filename.dat", comments="#", delimiter=",", unpack=False)

2013-02-04 10:46:55

所以你想创建一个列表的列表…我们需要从一个空列表开始

list_of_lists = []

接下来，我们逐行读取文件内容

with open('data') as f:
    for line in f:
        inner_list = [elt.strip() for elt in line.split(',')]
        # in alternative, if you need to use the file content as numbers
        # inner_list = [int(elt.strip()) for elt in line.split(',')]
        list_of_lists.append(inner_list)

一个常见的用例是柱状数据，但是我们的存储单位是文件的行，我们已经逐行读取，所以你可能想要转置你的列表中的列表。这可以用下面的习语来实现

by_cols = zip(*list_of_lists)

另一种常见的用法是为每一列命名

col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue')
by_names = {}
for i, col_name in enumerate(col_names):
    by_names[col_name] = by_cols[i]

这样你就可以对同构数据项进行操作

 mean_apple_prices = [money/fruits for money, fruits in
                     zip(by_names['apples revenue'], by_names['apples_sold'])]

我所写的大部分内容都可以使用标准库中的csv模块来加速。另一个第三方模块是pandas，它允许您自动化典型数据分析的大部分方面(但有许多依赖项)。

在Python 2中，zip(*list_of_lists)返回一个不同的(转置的)列表列表，在Python 3中，情况发生了变化，zip(*list_of_lists)返回一个不可下标的zip对象。

如果您需要索引访问，您可以使用

by_cols = list(zip(*list_of_lists))

在两个版本的Python中都提供了列表的列表。

另一方面，如果你不需要索引访问，你想要的只是构建一个按列名索引的字典，zip对象就可以了…

file = open('some_data.csv')
names = get_names(next(file))
columns = zip(*((x.strip() for x in line.split(',')) for line in file)))
d = {}
for name, column in zip(names, columns): d[name] = column

2014-11-20 17:47:24

这个问题问的是如何将逗号分隔的值内容从文件读入可迭代列表:

0,0,200,0,53,1,0,255,... , 0.

最简单的方法是使用csv模块，如下所示:

import csv
with open('filename.dat', newline='') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=',')

现在，你可以像这样轻松地遍历垃圾邮件阅读器:

for row in spamreader:
    print(', '.join(row))

更多示例请参见文档。

2018-03-14 05:36:30

我有点晚了，但你也可以把文本文件读入一个数据框架，然后将相应的列转换为一个列表。

lista=pd.read_csv('path_to_textfile.txt', sep=",", header=None)[0].tolist()

的例子。

lista=pd.read_csv('data/holdout.txt',sep=',',header=None)[0].tolist()

注意:对应的数据帧的列名将以整数的形式，我选择0，因为我只提取第一列

2021-09-24 13:27:06

如何读一个文本文件到一个列表或数组与Python

推荐文章

最新文章

标签