如何在Python中廉价地获得一个大文件的行数?

如何以最有效的内存和时间方式获取大文件的行数?

def file_len(filename):
    with open(filename) as f:
        for i, _ in enumerate(f):
            pass
    return i + 1

当前回答

我发现你可以。

f = open("data.txt")
linecout = len(f.readlines())

会给你答案吗

2021-08-23 04:58:52

其他回答

这个呢?

import sys
sys.stdin=open('fname','r')
data=sys.stdin.readlines()
print "counted",len(data),"lines"

2010-06-25 15:17:32

一行，可能很快:

num_lines = sum(1 for line in open('myfile.txt'))

2009-06-19 19:07:06

对我来说，这个变体是最快的:

#!/usr/bin/env python

def main():
    f = open('filename')                  
    lines = 0
    buf_size = 1024 * 1024
    read_f = f.read # loop optimization

    buf = read_f(buf_size)
    while buf:
        lines += buf.count('\n')
        buf = read_f(buf_size)

    print lines

if __name__ == '__main__':
    main()

原因:缓冲比逐行和逐字符串读取快。计数也非常快

2009-05-10 11:29:12

print open('file.txt', 'r').read().count("\n") + 1

2014-03-21 06:10:30

打开一个文件的结果是一个迭代器，它可以转换为一个序列，它有一个长度:

with open(filename) as f:
   return len(list(f))

这比显式循环更简洁，并避免了枚举。

2009-05-10 11:35:26

如何在Python中廉价地获得一个大文件的行数?

推荐文章

最新文章

标签