“ ield” 关键字是做什么的?

Python 中产出关键字的用法是什么? 它能做什么?

例如,我试图理解这个代码1:

def _get_child_candidates(self, distance, min_dist, max_dist):
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild

这就是打电话的人:

result, candidates = [], [self]
while candidates:
    node = candidates.pop()
    distance = node._get_dist(obj)
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)
    candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))
return result

当方法 _get_child_camedates 被调用时会怎样? 列表是否返回? 单一个元素吗? 是否再次调用? 以后的电话何时停止?

1. 本代码由Jochen Schulz(jrschulz)编写,他为公制空间制作了一个伟大的Python图书馆,与完整的源:模块mspace链接。

当前回答

关键要点

Python 的语法库使用输出关键字的存在来设定返回生成器的函数。生成器是一种迭代器, 这是一种在 Python 中循环的主要方式。生成器本质上是一个可回收的函数。与返回返回值和结束函数不同的是, 生成关键字返回一个值和中止函数。当下一个( g) 被调用到生成器时, 函数会恢复它所剩的功能。只有当函数遇到一个明示或暗示返回时, 它才会实际结束。

书写和理解发电机技术

一个理解和思考发电机的简单方法就是用印刷品()而不是产量来撰写一个常规函数:

def f(n):
    for x in range(n):
        print(x)
        print(x * 10)

注意它的产出:

>>> f(3)
0
0
1
10
2
2

3⁄4 ̄ ̧漯B

def f(n):
    for x in range(n):
        yield x
        yield x * 10

给 :

>>> list(f(3))
[0, 0, 1, 10, 2, 20]

迭代程序协议

答案“什么产量能做什么”可以是简短和简单的, 但是它是更大的世界的一部分, 所谓的“标准协议”。

在迭代协议的发送方,有两种相关的对象。可循环的物体是您可以绕过的东西。迭代器是跟踪环状状态的物体。

在迭代协议的消费方方面,我们调用可迭代对象的迭代者获得一个迭代者。然后我们调用下一个迭代者从迭代器中获取值。当没有更多数据时,会提出一个停止使用例外 :

>>> s = [10, 20, 30]    # The list is the "iterable"
>>> it = iter(s)        # This is the "iterator"
>>> next(it)            # Gets values out of an iterator
10
>>> next(it)
20
>>> next(it)
30
>>> next(it)
Traceback (most recent call last):
 ...
StopIteration

为了让这一切变得更容易, 对于卢布人来说,叫它, 下一个代表我们:

>>> for x in s:
...     print(x)
...   
10
20
30

一个人可以写一本关于这一切的书, 但这些都是关键点。当我教授 Python 课程时, 我发现这是一个最起码的足够解释来建立理解, 并马上开始使用它。特别是, 用打印写一个函数, 测试它, 然后转换成收益的技巧, 似乎对 Python 各级程序员都有效。

1970-01-20 03:12:32

其他回答

虽然很多答案都表明你为什么用一个产量来创建发电机, 但对于产量来说却有更多的用途。做一个共同的习惯很容易, 这样可以让信息在两个代码区块之间传递。我不再重复任何已经给出的关于使用产量来创建发电机的好例子。

为了帮助理解下一个代码中的产值, 您可以用手指通过任何有产值的代码来追踪循环。每次你的手指碰到产量的代码时, 您必须等待下一个或发送输入。调用下一个代码时, 您可以跟踪代码, 直到你到达产量... 产值右侧的代码被评估并返回到调用者... 然后您等待。当调用下一个代码时, 您会通过代码执行另一个循环。但是, 您会注意到, 产值也可以用一个发送方式来使用。发送时, 将会将一个调用器的值发送到产值中。如果发送了, 则会收到发送的值, 然后将其从左侧吐出... , 然后通过代码的跟踪直到您再次到达产量( 返回最后的值, 如下一个调用 ) 。

例如:

>>> def coroutine():
...     i = -1
...     while True:
...         i += 1
...         val = (yield i)
...         print("Received %s" % val)
...
>>> sequence = coroutine()
>>> sequence.next()
0
>>> sequence.next()
Received None
1
>>> sequence.send('hello')
Received hello
2
>>> sequence.close()

1970-01-17 02:30:52

失败给了你一台发电机

def get_odd_numbers(i):
    return range(1, i, 2)
def yield_odd_numbers(i):
    for x in range(1, i, 2):
       yield x
foo = get_odd_numbers(10)
bar = yield_odd_numbers(10)
foo
[1, 3, 5, 7, 9]
bar
<generator object yield_odd_numbers at 0x1029c6f50>
bar.next()
1
bar.next()
3
bar.next()
5

正如你可以看到的那样,在第一种情况下,Foo同时持有完整的记忆列表。对于包含5个元素的清单来说,这不是什么大不了的事,但是如果你想列出500万个元素的清单,那又会怎样?这不仅仅是一个巨大的记忆食用器,在函数被调用的时候,它还要花费很多时间来构建这个功能。

在第二种情况下, 酒吧只给您一台发电机。发电机是一个可循环的, 意思是您可以在循环中使用它, 等等, 但每个值只能存取一次。所有值也并非同时存储在记忆中; 生成器的“ 成员” 对象, 上次您称之为“ 成员” 时, 它在循环中。这样, 如果您使用一个可( 说) 的转号, 计数为500亿, 你不必一次数到500亿, 然后存储500亿的数值来进行计算。

再者,这是一个相当巧妙的例子,如果你真想数到500亿,你可能会使用滑板。 () :

这是发电机中最简单的使用实例。正如您所说, 它可以用来写高效的变换, 使用产量将东西推到调用堆叠上, 而不是使用某种堆叠变量。发电机也可以用于专门的树道, 以及各种其它方式。

1970-01-16 17:18:09

这是关于产量的心理形象。

我想把一条线视为有堆叠(即使它不是用这种方式执行的)。

当调用一个普通函数时, 它会将其本地变量放入堆栈, 进行一些计算, 然后清除堆栈和返回。其本地变量的值再也不会被看到。

当它的代码开始运行时( 即函数被调用后, 返回一个生成对象, 其下一个( ) 方法随后被引用) , 它同样将其本地变量放在堆叠上, 并进行一段时间的计算。但是, 当它点击收益语句时, 在清理堆叠中的一部分并返回之前, 它会对其本地变量进行截图, 并将其存储在生成对象中。它还写下它目前位于代码中的位置( 即特定收益语句 ) 。

所以这是一种冷冻功能发电机挂在了上面

当下一个 () 后被调用时, 它会从堆栈上取回函数的物品, 并重新激活它。函数继续从剩余部分进行计算, 无视它刚刚在冷藏室里度过了一个永恒的时间。

比较以下实例:

def normalFunction():
    return
    if False:
        pass

def yielderFunction():
    return
    if False:
        yield 12

当我们称第二个函数为第二个函数时, 它的行为与第一个函数非常不同。收益声明可能无法达到, 但是如果它存在任何地方, 它会改变我们正在处理的东西的性质。

>>> yielderFunction()
<generator object yielderFunction at 0x07742D28>

调用 powerFunction () 不运行它的代码, 而是让一个生成器出自代码。 (也许用 powerFunction () 的前缀命名这种东西作为可读性是一个好主意。)

>>> gen = yielderFunction()
>>> dir(gen)
['__class__',
 ...
 '__iter__',    #Returns gen itself, to make it work uniformly with containers
 ...            #when given to a for loop. (Containers return an iterator instead.)
 'close',
 'gi_code',
 'gi_frame',
 'gi_running',
 'next',        #The method that runs the function's body.
 'send',
 'throw']

gi_ code 和 gi_ frame 字段是存放冻结状态的地方。使用 dir (.) 来探索它们, 我们可以确认上面的心理模型是可信的。

1970-01-16 20:53:19

想象一下, 你创造了一个非凡的机器, 能够每天生成成千上万个灯泡。机器用一个独特的序列号的盒子生成这些灯泡。您没有足够的空间同时存储所有这些灯泡, 所以您想要调整它来生成点燃灯泡。

Python 生成器与这个概念没有多大区别。想象一下, 您有一个叫做条形码_ 生成器的函数, 可以为框生成独特的序列号。显然, 您可以在硬件( RAM) 的限制下, 由函数返回大量这样的条形码。一个更明智和空间效率更高的选项是按需生成这些序列号。

机器代码 :

def barcode_generator():
    serial_number = 10000  # Initial barcode
    while True:
        yield serial_number
        serial_number += 1


barcode = barcode_generator()
while True:
    number_of_lightbulbs_to_generate = int(input("How many lightbulbs to generate? "))
    barcodes = [next(barcode) for _ in range(number_of_lightbulbs_to_generate)]
    print(barcodes)

    # function_to_create_the_next_batch_of_lightbulbs(barcodes)

    produce_more = input("Produce more? [Y/n]: ")
    if produce_more == "n":
        break

注意下个( 条码) 位。

如你所见, 我们有一个自足的“ 功能” , 每次生成下一个独特的序列号。此函数返回一个生成器。正如您所看到的, 我们并不是每次我们需要一个新的序列号时都会调用该功能, 而是使用下一个( ) , 给生成器来获取下一个序列号。

低拉隔热器

更精确地说, 这个生成器是一个懒惰的循环器。循环器是一个帮助我们绕过一个天体序列的物体。它被称为懒惰, 因为它在需要之前不会在内存中装入序列中的所有项目。上一个示例中的下一个是从循环器获取下一个项目的清晰方式。隐含方式用于循环 :

for barcode in barcode_generator():
    print(barcode)

这将无穷尽地打印条形码, 但你不会失去内存。

换句话说,一个发电机看起来像一个函数,但行为却像一个迭代器。

现实世界应用?

最后, 真实世界应用程序。当您在大序列中工作时, 它们通常是有用的。想象一下从有数十亿记录的磁盘上读取一个巨大的文件。在您能够处理其内容之前, 在记忆中读取整个文件, 很可能是行不通的( 也就是说, 您将失去记忆 ) 。

1970-01-18 23:28:40

(我下面的回答只是从使用Python发电机的角度,而不是从发电机机制的基本实施角度,后者涉及一些堆叠和堆积操纵的伎俩。 )

当在 python 函数中使用 quot 而不是返回时, 该函数将被转换为特殊的名称。此函数将返回生成器类型的对象。产量关键字是提醒 python 编译器专门处理此函数的旗帜。正常函数一旦从中返回某些值就会终止。但是, 在编译器的帮助下, 生成器的函数可以被视为可恢复。也就是说, 执行环境将会恢复, 执行会从上次运行时继续。直到您明确调回, 这会引起一个停止引力例外( 也是循环协议的一部分) , 或者到达函数的终点。我发现许多关于生成器的引用, 但从功能编程角度来说, 这是一种最可消化的引用。

(现在我想谈谈产生者背后的理由, 以及基于我自己的理解的循环器。我希望这能帮助你掌握循环器和生成者的基本动机。这一概念以其他语言出现, 如 C# 。 )

据我所知,当我们想要处理一大批数据时,我们通常先在某处储存数据,然后逐个处理。但这种天真的方法有问题。如果数据量很大,那么事先将数据全部储存起来费用很高。因此,与其直接储存数据本身,不如间接储存某种元数据,即数据计算逻辑。

有两种方法可以包扎这类元数据。

OO 方法, 我们把元数据包成一个类。这是执行循环协议( 即 __ next_ () 和 __ ter_ () 方法) 的所谓迭代器。这也是常见的迭代器设计模式。功能方法, 我们将元数据包成函数。这是所谓的生成功能。但是在引擎盖下, 返回的生成对象仍然是 IS - A 迭代器, 因为它也执行循环程序。

无论哪种方式, 都会创建一个迭代器, 即某个可以提供您想要的数据的对象。 OO 处理方式可能有点复杂。总之, 由您决定使用哪一种。

1970-01-17 21:14:15

“ ield” 关键字是做什么的?

推荐文章

最新文章

标签