如何使用glob()递归地查找文件?

这是我所拥有的:

glob(os.path.join('src','*.c'))

但是我想搜索src的子文件夹。这样做是可行的:

glob(os.path.join('src','*.c'))
glob(os.path.join('src','*','*.c'))
glob(os.path.join('src','*','*','*.c'))
glob(os.path.join('src','*','*','*','*.c'))

但这显然是有限和笨拙的。

当前回答

类似于其他解决方案，但使用fnmatch。Fnmatch而不是glob，因为os。Walk已经列出了文件名:

import os, fnmatch


def find_files(directory, pattern):
    for root, dirs, files in os.walk(directory):
        for basename in files:
            if fnmatch.fnmatch(basename, pattern):
                filename = os.path.join(root, basename)
                yield filename


for filename in find_files('src', '*.c'):
    print 'Found C source:', filename

此外，使用生成器允许您在找到每个文件时处理它，而不是找到所有文件然后处理它们。

2010-02-02 18:44:51

其他回答

除了建议的答案，你还可以用一些惰性生成和列表理解魔法来做到这一点:

import os, glob, itertools

results = itertools.chain.from_iterable(glob.iglob(os.path.join(root,'*.c'))
                                               for root, dirs, files in os.walk('src'))

for f in results: print(f)

除了适合一行并避免内存中不必要的列表之外，这还有一个很好的副作用，你可以以类似于**操作符的方式使用它，例如，你可以使用os.path。Join (root， 'some/path/*.c')以获取SRC所有子目录下具有此结构的所有。c文件。

2015-12-05 17:42:56

根据其他答案，这是我目前的工作实现，检索根目录中的嵌套XML文件:

files = []
for root, dirnames, filenames in os.walk(myDir):
    files.extend(glob.glob(root + "/*.xml"))

我真的很喜欢python:)

2012-07-28 22:09:23

pathlib.Path.rglob

使用pathlib模块中的pathlib. path .rglob，该模块是在Python 3.5中引入的。

from pathlib import Path

for path in Path('src').rglob('*.c'):
    print(path.name)

如果你不想使用pathlib, use可以使用glob.glob('**/*.c')，但不要忘记传入递归关键字参数，这会在大目录上花费过多的时间。

对于以点(.)开头的匹配文件的情况;如当前目录下的文件或基于Unix系统的隐藏文件，请使用操作系统。步行解决方案如下。

os.walk

对于较旧的Python版本，请使用os。递归遍历目录和fnmatch。过滤器匹配一个简单的表达式:

import fnmatch
import os

matches = []
for root, dirnames, filenames in os.walk('src'):
    for filename in fnmatch.filter(filenames, '*.c'):
        matches.append(os.path.join(root, filename))

2010-02-02 18:26:54

简化版的Johan Dahlin的回答，没有fnmatch。

import os

matches = []
for root, dirnames, filenames in os.walk('src'):
  matches += [os.path.join(root, f) for f in filenames if f[-2:] == '.c']

2013-06-03 01:29:07

类似于其他解决方案，但使用fnmatch。Fnmatch而不是glob，因为os。Walk已经列出了文件名:

import os, fnmatch


def find_files(directory, pattern):
    for root, dirs, files in os.walk(directory):
        for basename in files:
            if fnmatch.fnmatch(basename, pattern):
                filename = os.path.join(root, basename)
                yield filename


for filename in find_files('src', '*.c'):
    print 'Found C source:', filename

此外，使用生成器允许您在找到每个文件时处理它，而不是找到所有文件然后处理它们。

2010-02-02 18:44:51

如何使用glob()递归地查找文件?

推荐文章

最新文章

标签