使用Python计算目录的大小?

在我重新发明这个特殊的轮子之前，有没有人有一个很好的用Python计算目录大小的例程?如果该例程能以Mb/Gb等格式格式化大小，那就太好了。

当前回答

使用库sh: du模块执行:

pip install sh

import sh
print( sh.du("-s", ".") )
91154728        .

如果您想传递asterix，请使用此处描述的glob。

要转换human readable中的值，请使用humanize:

pip install humanize

import humanize
print( humanize.naturalsize( 91157384 ) )
91.2 MB

2017-04-20 15:22:17

其他回答

def recursive_dir_size(path):
    size = 0

    for x in os.listdir(path):
        if not os.path.isdir(os.path.join(path,x)):
            size += os.stat(os.path.join(path,x)).st_size
        else:
            size += recursive_dir_size(os.path.join(path,x))

    return size

我写了这个函数，它给了我一个目录的准确总体大小，我尝试了其他for循环解决方案与os。行走，但我不知道为什么最终结果总是小于实际大小(在ubuntu 18 env)。我一定是做错了什么，但谁在乎写这个工作完美无缺。

2019-07-30 12:04:37

你说一句俏皮话… 这里有一句话:

sum([sum(map(lambda fname: os.path.getsize(os.path.join(directory, fname)), files)) for directory, folders, files in os.walk(path)])

尽管我可能会把它分开，它不执行检查。

要转换为kb，请参阅可重用库以获得人类可读版本的文件大小?然后算进去

2015-04-13 17:53:19

不管怎样……树命令免费完成所有这些工作:

tree -h --du /path/to/dir  # files and dirs
tree -h -d --du /path/to/dir  # dirs only

我喜欢Python，但到目前为止，这个问题最简单的解决方案不需要新的代码。

2017-07-25 18:01:25

我在这里有点晚(和新)，但我选择使用subprocess模块和Linux中的'du'命令行来检索文件夹大小的准确值，单位为MB。我必须使用if和elif用于根文件夹，否则子进程会由于返回的非零值而引发错误。

import subprocess
import os

#
# get folder size
#
def get_size(self, path):
    if os.path.exists(path) and path != '/':
        cmd = str(subprocess.check_output(['sudo', 'du', '-s', path])).\
            replace('b\'', '').replace('\'', '').split('\\t')[0]
        return float(cmd) / 1000000
    elif os.path.exists(path) and path == '/':
        cmd = str(subprocess.getoutput(['sudo du -s /'])). \
            replace('b\'', '').replace('\'', '').split('\n')
        val = cmd[len(cmd) - 1].replace('/', '').replace(' ', '')
        return float(val) / 1000000
    else: raise ValueError

2018-03-20 02:24:54

接受的答案不考虑硬链接或软链接，并将这些文件计算两次。您可能希望跟踪已看到的inode，而不是为这些文件添加大小。

import os
def get_size(start_path='.'):
    total_size = 0
    seen = {}
    for dirpath, dirnames, filenames in os.walk(start_path):
        for f in filenames:
            fp = os.path.join(dirpath, f)
            try:
                stat = os.stat(fp)
            except OSError:
                continue

            try:
                seen[stat.st_ino]
            except KeyError:
                seen[stat.st_ino] = True
            else:
                continue

            total_size += stat.st_size

    return total_size

print get_size()

2012-10-20 02:18:48

使用Python计算目录的大小?

推荐文章

最新文章

标签