我想更改下面的代码

for directory, dirs, files in os.walk(directory_1):
    do_something()

for directory, dirs, files in os.walk(directory_2):
    do_something()

到此代码:

for directory, dirs, files in os.walk(directory_1) + os.walk(directory_2):
    do_something()

我得到了错误:

不支持+:'generator'和'generator'的操作数类型

如何在Python中连接两个生成器?


当前回答

代码示例:

from itertools import chain

def generator1():
    for item in 'abcdef':
        yield item

def generator2():
    for item in '123456':
        yield item

generator3 = chain(generator1(), generator2())
for item in generator3:
    print item

其他回答

在Python(3.5或更高版本)中,您可以执行以下操作:

def concat(a, b):
    yield from a
    yield from b

Itertools.chain()应该做到这一点。它接受多个可迭代对象,并逐个产生结果,大致相当于:

def chain(*iterables):
    for it in iterables:
        for element in it:
            yield element

使用的例子:

from itertools import chain

g = (c for c in 'ABC')  # Dummy generator, just for example
c = chain(g, 'DEF')  # Chain the generator and a string
for item in c:
    print(item)

输出:

A
B
C
D
E
F

你也可以使用解包操作符*:

concat = (*gen1(), *gen2())

注意:对于“非惰性”迭代对象最有效。也可以用于不同类型的推导式。生成器concat的首选方式将来自@Uduse的答案

(免责声明:仅限Python 3 !)

与你想要的语法相似的是使用splat操作符展开两个生成器:

for directory, dirs, files in (*os.walk(directory_1), *os.walk(directory_2)):
    do_something()

解释:

这有效地执行了将两个生成器的单层扁平化为3元组的n元组(来自os.walk),如下所示:

((directory1, dirs1, files1), (directory2, dirs2, files2), ...)

然后for循环遍历这个n元组。

当然,通过简单地用括号替换外括号,你可以得到一个3元组的列表,而不是3元组的n元组:

for directory, dirs, files in [*os.walk(directory_1), *os.walk(directory_2)]:
    do_something()

结果如下:

[(directory1, dirs1, files1), (directory2, dirs2, files2), ...]

Pro:

这种方法的优点是不需要导入任何东西,也不需要大量代码。

Con:

缺点是将两个生成器转储到一个集合中,然后遍历该集合,有效地进行了两次传递,可能会使用大量内存。

您可以将任何生成器放入列表中。虽然不能组合生成器,但可以组合列表。这样做的缺点是实际上在内存中创建了3个列表,但优点是可读性非常好,不需要导入,并且是单行习惯用法。

OP解决方案。

for directory, dirs, files in list(os.walk(directory_1)) + list(os.walk(directory_2)):
    do_something()
a = range(20)
b = range(10,99,3)
for v in list(a) + list(b):
    print(v)