如何在Python中连接两个生成器(或其他可迭代对象)?

我想更改下面的代码

for directory, dirs, files in os.walk(directory_1):
    do_something()

for directory, dirs, files in os.walk(directory_2):
    do_something()

到此代码:

for directory, dirs, files in os.walk(directory_1) + os.walk(directory_2):
    do_something()

我得到了错误:

不支持+:'generator'和'generator'的操作数类型

如何在Python中连接两个生成器?

当前回答

你也可以使用解包操作符*:

concat = (*gen1(), *gen2())

注意:对于“非惰性”迭代对象最有效。也可以用于不同类型的推导式。生成器concat的首选方式将来自@Uduse的答案

2019-09-19 14:12:59

其他回答

2020年更新:在Python 3和Python 2中都可以工作

import itertools

iterA = range(10,15)
iterB = range(15,20)
iterC = range(20,25)

第一个选项

for i in itertools.chain(iterA, iterB, iterC):
    print(i)

# 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

可选选项，在python 2.6中引入

for i in itertools.chain.from_iterable( [iterA, iterB, iterC] ):
    print(i)

# 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Itertools.chain()是基本的。

Itertools.chain.from_iterable()很方便，如果你有一个包含可迭代对象的可迭代对象。例如，每个子目录的文件列表，如[["src/server.py"， "src/readme.txt"]， ["test/test.py"]]]。

2020-09-27 16:11:56

Itertools.chain()应该做到这一点。它接受多个可迭代对象，并逐个产生结果，大致相当于:

def chain(*iterables):
    for it in iterables:
        for element in it:
            yield element

使用的例子:

from itertools import chain

g = (c for c in 'ABC')  # Dummy generator, just for example
c = chain(g, 'DEF')  # Chain the generator and a string
for item in c:
    print(item)

输出:

A
B
C
D
E
F

2010-07-09 08:30:28

这里使用了一个带有嵌套for的生成器表达式:

range_a = range(3)
range_b = range(5)
result = (item
    for one_range in (range_a, range_b)
    for item in one_range)
assert list(result) == [0, 1, 2, 0, 1, 2, 3, 4]

for…在…从左到右求值。for之后的标识符建立一个新变量。而one_range在下面用于…在…，来自第二个的项用于“final”赋值表达式，该表达式只有一个(在最开始)。

2018-04-30 15:29:27

如果你只需要做一次，不希望再导入一个模块，有一个简单的解决方案…

只做:

for dir in directory_1, directory_2:
    for directory, dirs, files in os.walk(dir):
        do_something()

如果你真的想“联接”两个生成器，那么做:

for directory, dirs, files in (
        x for osw in [os.walk(directory_1), os.walk(directory_2)] 
               for x in osw
        ):
    do_something()

2019-02-04 22:29:37

(免责声明:仅限Python 3 !)

与你想要的语法相似的是使用splat操作符展开两个生成器:

for directory, dirs, files in (*os.walk(directory_1), *os.walk(directory_2)):
    do_something()

解释:

这有效地执行了将两个生成器的单层扁平化为3元组的n元组(来自os.walk)，如下所示:

((directory1, dirs1, files1), (directory2, dirs2, files2), ...)

然后for循环遍历这个n元组。

当然，通过简单地用括号替换外括号，你可以得到一个3元组的列表，而不是3元组的n元组:

for directory, dirs, files in [*os.walk(directory_1), *os.walk(directory_2)]:
    do_something()

结果如下:

[(directory1, dirs1, files1), (directory2, dirs2, files2), ...]

Pro:

这种方法的优点是不需要导入任何东西，也不需要大量代码。

Con:

缺点是将两个生成器转储到一个集合中，然后遍历该集合，有效地进行了两次传递，可能会使用大量内存。

2021-04-07 05:33:59

如何在Python中连接两个生成器(或其他可迭代对象)?

推荐文章

最新文章

标签