如何使用glob()递归地查找文件?

这是我所拥有的:

glob(os.path.join('src','*.c'))

但是我想搜索src的子文件夹。这样做是可行的:

glob(os.path.join('src','*.c'))
glob(os.path.join('src','*','*.c'))
glob(os.path.join('src','*','*','*.c'))
glob(os.path.join('src','*','*','*','*.c'))

但这显然是有限和笨拙的。

当前回答

Johan和Bruno就上述最低要求提供了出色的解决方案。我刚刚发布了Formic，它实现了Ant FileSet和glob，可以处理这种情况和更复杂的场景。您的需求的实现是:

import formic
fileset = formic.FileSet(include="/src/**/*.c")
for file_name in fileset.qualified_files():
    print file_name

2012-05-15 08:53:18

其他回答

我修改了glob模块，以支持**的递归配色，例如:

>>> import glob2
>>> all_header_files = glob2.glob('src/**/*.c')

https://github.com/miracle2k/python-glob2/

当你想为你的用户提供使用**语法的能力时很有用，因此os.walk()本身不够好。

2011-06-26 14:14:22

Johan和Bruno就上述最低要求提供了出色的解决方案。我刚刚发布了Formic，它实现了Ant FileSet和glob，可以处理这种情况和更复杂的场景。您的需求的实现是:

import formic
fileset = formic.FileSet(include="/src/**/*.c")
for file_name in fileset.qualified_files():
    print file_name

2012-05-15 08:53:18

下面是一种解决方案，它将根据完整路径匹配模式，而不仅仅是基本文件名。

它使用fnmatch。Translate将全局样式的模式转换为正则表达式，然后在遍历目录时与找到的每个文件的完整路径进行匹配。

re.IGNORECASE是可选的，但在Windows上是可取的，因为文件系统本身不区分大小写。(我没有费心编译正则表达式，因为文档表明它应该在内部缓存。)

import fnmatch
import os
import re

def findfiles(dir, pattern):
    patternregex = fnmatch.translate(pattern)
    for root, dirs, files in os.walk(dir):
        for basename in files:
            filename = os.path.join(root, basename)
            if re.search(patternregex, filename, re.IGNORECASE):
                yield filename

2015-06-30 15:39:36

另一种方法是只使用glob模块。只需给rglob方法添加一个起始基本目录和一个要匹配的模式，它就会返回一个匹配文件名的列表。

import glob
import os

def _getDirs(base):
    return [x for x in glob.iglob(os.path.join( base, '*')) if os.path.isdir(x) ]

def rglob(base, pattern):
    list = []
    list.extend(glob.glob(os.path.join(base,pattern)))
    dirs = _getDirs(base)
    if len(dirs):
        for d in dirs:
            list.extend(rglob(os.path.join(base,d), pattern))
    return list

2011-09-13 22:59:25

我修改了这篇文章最上面的答案。最近创建了这个脚本，它将循环遍历给定目录(searchdir)中的所有文件和它下面的子目录…并打印文件名、根目录、修改/创建日期和大小。

希望这能帮助到某人…他们可以遍历目录，得到fileinfo。

import time
import fnmatch
import os

def fileinfo(file):
    filename = os.path.basename(file)
    rootdir = os.path.dirname(file)
    lastmod = time.ctime(os.path.getmtime(file))
    creation = time.ctime(os.path.getctime(file))
    filesize = os.path.getsize(file)

    print "%s**\t%s\t%s\t%s\t%s" % (rootdir, filename, lastmod, creation, filesize)

searchdir = r'D:\Your\Directory\Root'
matches = []

for root, dirnames, filenames in os.walk(searchdir):
    ##  for filename in fnmatch.filter(filenames, '*.c'):
    for filename in filenames:
        ##      matches.append(os.path.join(root, filename))
        ##print matches
        fileinfo(os.path.join(root, filename))

2014-11-15 13:39:49

如何使用glob()递归地查找文件?

推荐文章

最新文章

标签