如何使用glob()递归地查找文件?

这是我所拥有的:

glob(os.path.join('src','*.c'))

但是我想搜索src的子文件夹。这样做是可行的:

glob(os.path.join('src','*.c'))
glob(os.path.join('src','*','*.c'))
glob(os.path.join('src','*','*','*.c'))
glob(os.path.join('src','*','*','*','*.c'))

但这显然是有限和笨拙的。

当前回答

最近我不得不恢复我的图片扩展。jpg。我运行photorec，恢复了4579个目录，其中有220万个文件，扩展名种类繁多。使用下面的脚本，我能够在几分钟内选择50133个扩展名为。jpg的文件:

#!/usr/binenv python2.7

import glob
import shutil
import os

src_dir = "/home/mustafa/Masaüstü/yedek"
dst_dir = "/home/mustafa/Genel/media"
for mediafile in glob.iglob(os.path.join(src_dir, "*", "*.jpg")): #"*" is for subdirectory
    shutil.copy(mediafile, dst_dir)

2013-01-05 10:36:43

其他回答

下面是一种解决方案，它将根据完整路径匹配模式，而不仅仅是基本文件名。

它使用fnmatch。Translate将全局样式的模式转换为正则表达式，然后在遍历目录时与找到的每个文件的完整路径进行匹配。

re.IGNORECASE是可选的，但在Windows上是可取的，因为文件系统本身不区分大小写。(我没有费心编译正则表达式，因为文档表明它应该在内部缓存。)

import fnmatch
import os
import re

def findfiles(dir, pattern):
    patternregex = fnmatch.translate(pattern)
    for root, dirs, files in os.walk(dir):
        for basename in files:
            filename = os.path.join(root, basename)
            if re.search(patternregex, filename, re.IGNORECASE):
                yield filename

2015-06-30 15:39:36

如果文件位于远程文件系统上或归档文件中，则可以使用fspecabstractfilesystem类的实现。例如，要列出一个zipfile中的所有文件:

from fsspec.implementations.zip import ZipFileSystem
fs = ZipFileSystem("/tmp/test.zip")
fs.glob("/**")  # equivalent: fs.find("/")

或者列出公共S3桶中的所有文件:

from s3fs import S3FileSystem
fs_s3 = S3FileSystem(anon=True)
fs_s3.glob("noaa-goes16/ABI-L1b-RadF/2020/045/**")  # or use fs_s3.find

你也可以将它用于本地文件系统，如果你的实现应该是文件系统不可知的，这可能会很有趣:

from fsspec.implementations.local import LocalFileSystem
fs = LocalFileSystem()
fs.glob("/tmp/test/**")

其他实现包括谷歌云，Github, SFTP/SSH, Dropbox和Azure。具体操作请参见fspec API文档。

2020-10-08 13:49:14

我修改了glob模块，以支持**的递归配色，例如:

>>> import glob2
>>> all_header_files = glob2.glob('src/**/*.c')

https://github.com/miracle2k/python-glob2/

当你想为你的用户提供使用**语法的能力时很有用，因此os.walk()本身不够好。

2011-06-26 14:14:22

你需要使用操作系统。行走以收集符合条件的文件名。例如:

import os
cfiles = []
for root, dirs, files in os.walk('src'):
  for file in files:
    if file.endswith('.c'):
      cfiles.append(os.path.join(root, file))

2010-02-02 18:24:48

我需要一个python 2的解决方案。在大目录上快速工作的X。我得出了这个结论:

import subprocess
foundfiles= subprocess.check_output("ls src/*.c src/**/*.c", shell=True)
for foundfile in foundfiles.splitlines():
    print foundfile

注意，您可能需要一些异常处理，以防ls找不到任何匹配的文件。

2017-06-23 10:20:37

如何使用glob()递归地查找文件?

推荐文章

最新文章

标签