如何做一个递归子文件夹搜索和返回文件在一个列表?

我正在编写一个脚本，以递归地遍历主文件夹中的子文件夹，并构建一个特定文件类型的列表。我对剧本有点意见。目前设置如下:

for root, subFolder, files in os.walk(PATH):
    for item in files:
        if item.endswith(".txt") :
            fileNamePath = str(os.path.join(root,subFolder,item))

问题是subFolder变量拉入的是子文件夹列表，而不是ITEM文件所在的文件夹。我在考虑之前运行子文件夹的for循环，并加入路径的第一部分，但我想我会仔细检查，看看是否有人有任何建议之前。

当前回答

新的pathlib库将其简化为一行:

from pathlib import Path
result = list(Path(PATH).glob('**/*.txt'))

你也可以使用生成器版本:

from pathlib import Path
for file in Path(PATH).glob('**/*.txt'):
    pass

这将返回Path对象，您可以将其用于几乎任何事情，或者通过file.name获取文件名作为字符串。

2018-05-22 19:03:47

其他回答

这不是最python的答案，但我把它放在这里是为了好玩，因为这是递归的一课

def find_files( files, dirs=[], extensions=[]):
    new_dirs = []
    for d in dirs:
        try:
            new_dirs += [ os.path.join(d, f) for f in os.listdir(d) ]
        except OSError:
            if os.path.splitext(d)[1] in extensions:
                files.append(d)

    if new_dirs:
        find_files(files, new_dirs, extensions )
    else:
        return

在我的机器上有两个文件夹，root和root2

mender@multivax ]ls -R root root2
root:
temp1 temp2

root/temp1:
temp1.1 temp1.2

root/temp1/temp1.1:
f1.mid

root/temp1/temp1.2:
f.mi  f.mid

root/temp2:
tmp.mid

root2:
dummie.txt temp3

root2/temp3:
song.mid

假设我想在这两个目录中找到所有。txt和。mid文件，然后我就可以

files = []
find_files( files, dirs=['root','root2'], extensions=['.mid','.txt'] )
print(files)

#['root2/dummie.txt',
# 'root/temp2/tmp.mid',
# 'root2/temp3/song.mid',
# 'root/temp1/temp1.1/f1.mid',
# 'root/temp1/temp1.2/f.mid']

2017-08-12 03:59:51

新的pathlib库将其简化为一行:

from pathlib import Path
result = list(Path(PATH).glob('**/*.txt'))

你也可以使用生成器版本:

from pathlib import Path
for file in Path(PATH).glob('**/*.txt'):
    pass

这将返回Path对象，您可以将其用于几乎任何事情，或者通过file.name获取文件名作为字符串。

2018-05-22 19:03:47

我将把John La Rooy的列表理解转换为嵌套for，以防其他人理解它有困难。

result = [y for x in os.walk(PATH) for y in glob(os.path.join(x[0], '*.txt'))]

应该相当于:

import glob
import os

result = []

for x in os.walk(PATH):
    for y in glob.glob(os.path.join(x[0], '*.txt')):
        result.append(y)

下面是列表理解和函数os的文档。走着走着。

2018-05-10 20:06:43

递归是Python 3.5中的新功能，所以它在Python 2.7中不起作用。下面是一个使用r个字符串的例子，你只需要提供路径，就像Win, Lin，…

import glob

mypath=r"C:\Users\dj\Desktop\nba"

files = glob.glob(mypath + r'\**\*.py', recursive=True)
# print(files) # as list
for f in files:
    print(f) # nice looking single line per file

注意:它将列出所有文件，无论它应该有多深。

2019-05-30 16:09:38

在Python 3.5更改:支持使用" ** "的递归glob。

Glob.glob()有一个新的递归参数。

如果你想获取my_path下的每个.txt文件(递归地包括subdirs):

import glob

files = glob.glob(my_path + '/**/*.txt', recursive=True)

# my_path/     the dir
# **/       every file and dir under my_path
# *.txt     every file that ends with '.txt'

如果你需要一个迭代器，你可以使用iglob作为替代:

for file in glob.iglob(my_path, recursive=True):
    # ...

2016-11-23 04:00:47

如何做一个递归子文件夹搜索和返回文件在一个列表?

推荐文章

最新文章

标签