我很难理解PEP 380。
在什么情况下yield from是有用的? 经典用例是什么? 为什么将其与微线程进行比较?
到目前为止,我使用过生成器,但从未真正使用过协程(由PEP-342引入)。尽管有一些相似之处,生成器和协程基本上是两个不同的概念。理解协程(不仅仅是生成器)是理解新语法的关键。
以我之见,协程是Python中最晦涩的特性,大多数书籍都让它看起来毫无用处和无趣。
感谢这些精彩的回答,但特别感谢agf和他的评论链接到David Beazley的演讲。
我很难理解PEP 380。
在什么情况下yield from是有用的? 经典用例是什么? 为什么将其与微线程进行比较?
到目前为止,我使用过生成器,但从未真正使用过协程(由PEP-342引入)。尽管有一些相似之处,生成器和协程基本上是两个不同的概念。理解协程(不仅仅是生成器)是理解新语法的关键。
以我之见,协程是Python中最晦涩的特性,大多数书籍都让它看起来毫无用处和无趣。
感谢这些精彩的回答,但特别感谢agf和他的评论链接到David Beazley的演讲。
当前回答
Yield从基本链迭代器以有效的方式:
# chain from itertools:
def chain(*iters):
for it in iters:
for item in it:
yield item
# with the new keyword
def chain(*iters):
for it in iters:
yield from it
正如您所看到的,它删除了一个纯Python循环。这几乎就是它所做的一切,但是链接迭代器是Python中非常常见的模式。
线程基本上是一种特性,它允许您在完全随机的点跳出函数,并跳回另一个函数的状态。线程管理器经常这样做,因此程序似乎同时运行所有这些函数。问题是这些点是随机的,所以您需要使用锁定来防止管理器在有问题的点上停止函数。
在这个意义上,生成器与线程非常相似:它们允许您指定特定的点(当它们屈服时),您可以在那里插入和退出。当以这种方式使用时,生成器称为协程。
阅读这篇关于Python协程的优秀教程,了解更多细节
其他回答
Yield从基本链迭代器以有效的方式:
# chain from itertools:
def chain(*iters):
for it in iters:
for item in it:
yield item
# with the new keyword
def chain(*iters):
for it in iters:
yield from it
正如您所看到的,它删除了一个纯Python循环。这几乎就是它所做的一切,但是链接迭代器是Python中非常常见的模式。
线程基本上是一种特性,它允许您在完全随机的点跳出函数,并跳回另一个函数的状态。线程管理器经常这样做,因此程序似乎同时运行所有这些函数。问题是这些点是随机的,所以您需要使用锁定来防止管理器在有问题的点上停止函数。
在这个意义上,生成器与线程非常相似:它们允许您指定特定的点(当它们屈服时),您可以在那里插入和退出。当以这种方式使用时,生成器称为协程。
阅读这篇关于Python协程的优秀教程,了解更多细节
Wherever you invoke a generator from within a generator you need a "pump" to re-yield the values: for v in inner_generator: yield v. As the PEP points out there are subtle complexities to this which most people ignore. Non-local flow-control like throw() is one example given in the PEP. The new syntax yield from inner_generator is used wherever you would have written the explicit for loop before. It's not merely syntactic sugar, though: It handles all of the corner cases that are ignored by the for loop. Being "sugary" encourages people to use it and thus get the right behaviors.
这条讨论线程中的消息讨论了这些复杂性:
对于PEP 342引入的附加生成器特性,这是不可能的 更长的情况:正如Greg的PEP中所描述的,简单的迭代不会 正确支持send()和throw()。体操需要支持 当您破坏Send()和throw()时,它们实际上并不复杂 向下,但它们也不是微不足道的。
我不能与微线程进行比较,只能观察到生成器是一种并行。您可以将挂起生成器视为一个线程,它通过yield将值发送给消费线程。实际的实现可能不是这样的(Python开发人员显然对实际的实现非常感兴趣),但这与用户无关。
语法带来的新成果并没有在线程方面为语言增加任何额外的功能,它只是使正确使用现有功能变得更容易。或者更准确地说,它使专家编写的复杂内部生成器的新手更容易通过该生成器,而不会破坏其任何复杂特性。
在什么情况下“yield from”是有用的?
你有这样一个循环的每一种情况:
for x in subgenerator:
yield x
正如PEP所描述的,这是使用子生成器的一种相当幼稚的尝试,它缺少几个方面,特别是PEP 342引入的.throw()/.send()/.close()机制的正确处理。要正确地做到这一点,需要相当复杂的代码。
经典用例是什么?
假设您想从递归数据结构中提取信息。假设我们想获取树中的所有叶节点:
def traverse_tree(node):
if not node.children:
yield node
for child in node.children:
yield from traverse_tree(child)
更重要的是,在生成from之前,没有重构生成器代码的简单方法。假设你有一个这样的(无意义的)生成器:
def get_list_values(lst):
for item in lst:
yield int(item)
for item in lst:
yield str(item)
for item in lst:
yield float(item)
现在您决定将这些循环分解到单独的生成器中。没有yield from,这是丑陋的,直到你会再三考虑是否真的想要这样做。对于yield from,实际上看起来很不错:
def get_list_values(lst):
for sub in [get_list_values_as_int,
get_list_values_as_str,
get_list_values_as_float]:
yield from sub(lst)
为什么将其与微线程进行比较?
我认为PEP中的这一节讨论的是每个生成器都有自己的独立执行上下文。再加上分别使用yield和__next__()在生成器-迭代器和调用者之间切换执行,这类似于线程,其中操作系统不时切换执行线程,以及执行上下文(堆栈,寄存器,…)。
这样做的效果也是类似的:生成器-迭代器和调用者都在执行状态下同时进行,它们的执行是交错的。例如,如果生成器执行某种计算,而调用者打印出结果,那么只要结果可用,您就会看到结果。这是并发的一种形式。
不过,这个类比并不是什么特别的东西,而是Python中生成器的一般属性。
一个简短的例子将帮助您理解yield from的用例之一:从另一个生成器获取价值
def flatten(sequence):
"""flatten a multi level list or something
>>> list(flatten([1, [2], 3]))
[1, 2, 3]
>>> list(flatten([1, [2], [3, [4]]]))
[1, 2, 3, 4]
"""
for element in sequence:
if hasattr(element, '__iter__'):
yield from flatten(element)
else:
yield element
print(list(flatten([1, [2], [3, [4]]])))
Yield from生成一个生成器,直到生成器为空,然后继续执行以下代码行。
e.g.
def gen(sequence):
for i in sequence:
yield i
def merge_batch(sub_seq):
yield {"data": sub_seq}
def modified_gen(g, batch_size):
stream = []
for i in g:
stream.append(i)
stream_len = len(stream)
if stream_len == batch_size:
yield from merge_batch(stream)
print("batch ends")
stream = []
stream_len = 0
运行这个程序会得到:
In [17]: g = gen([1,2,3,4,5,6,7,8,9,10])
In [18]: mg = modified_gen(g, 2)
In [19]: next(mg)
Out[19]: {'data': [1, 2]}
In [20]: next(mg)
batch ends
Out[20]: {'data': [3, 4]}
In [21]: next(mg)
batch ends
Out[21]: {'data': [5, 6]}
In [22]: next(mg)
batch ends
Out[22]: {'data': [7, 8]}
In [23]: next(mg)
batch ends
Out[23]: {'data': [9, 10]}
In [24]: next(mg)
batch ends
---------------------------------------------------------------------------
StopIteration Traceback (most recent call last)
Input In [24], in <cell line: 1>()
----> 1 next(mg)
StopIteration:
因此,yield from可以从另一个生成器获取输出,做一些修改,然后将自己的输出作为生成器本身提供给其他生成器。
在我看来,这是yield from的主要用例之一