我有一个文本文件。我如何检查它是否为空?


当前回答

>>> import os
>>> os.stat("file").st_size == 0
True

其他回答

如果文件不存在,getsize()和stat()都会抛出异常。这个函数将返回True/False而不抛出(更简单但不那么健壮):

import os
def is_non_zero_file(fpath):  
    return os.path.isfile(fpath) and os.path.getsize(fpath) > 0
>>> import os
>>> os.stat("file").st_size == 0
True

如果要检查CSV文件是否为空或 不,试试这个:

with open('file.csv', 'a', newline='') as f:
    csv_writer = DictWriter(f, fieldnames = ['user_name', 'user_age', 'user_email', 'user_gender', 'user_type', 'user_check'])
    if os.stat('file.csv').st_size > 0:
        pass
    else:
        csv_writer.writeheader()

一个重要的问题:当使用getsize()或stat()函数测试时,压缩的空文件将显示为非零:

$ python
>>> import os
>>> os.path.getsize('empty-file.txt.gz')
35
>>> os.stat("empty-file.txt.gz").st_size == 0
False

$ gzip -cd empty-file.txt.gz | wc
0 0 0

所以你应该检查要测试的文件是否被压缩(例如检查文件名后缀),如果是,要么保释或解压缩到一个临时位置,测试未压缩的文件,然后在完成时删除它。

测试压缩文件大小的更好方法:直接使用适当的压缩模块读取它。例如,您只需要读取文件的第一行。

由于您还没有定义空文件是什么:有些人也可能认为只有空行的文件是空文件。因此,如果你想检查你的文件是否只包含空行(任何空白字符,'\r', '\n', '\t'),你可以按照下面的例子:

Python 3

import re

def whitespace_only(file):
    content = open(file, 'r').read()
    if re.search(r'^\s*$', content):
        return True

解释:上面的例子使用正则表达式(regex)来匹配文件的内容(content)。

具体来说:^\s*$作为一个整体意味着如果文件只包含空行和/或空格。

^在一行的开始处断言位置 s匹配任何空白字符(等于[\r\n\t\f\v]) *量词-在0和无限次之间匹配,尽可能多的次数,根据需要反馈(贪婪) $在一行的末尾断言位置