如何在python中创建迭代函数(或迭代器对象)?


当前回答

本页上的所有答案对于复杂对象来说都非常棒。但是对于那些包含内置可迭代类型作为属性的,如str, list, set或dict,或任何集合的实现。Iterable,你可以省略类中的某些东西。

class Test(object):
    def __init__(self, string):
        self.string = string

    def __iter__(self):
        # since your string is already iterable
        return (ch for ch in self.string)
        # or simply
        return self.string.__iter__()
        # also
        return iter(self.string)

它可以这样使用:

for x in Test("abcde"):
    print(x)

# prints
# a
# b
# c
# d
# e

其他回答

python中的迭代器对象遵循迭代器协议,这基本上意味着它们提供了两个方法:__iter__()和__next__()。

__iter__返回迭代器对象,并被隐式调用 在循环开始的时候。 __next__()方法返回下一个值,并在每次循环递增时隐式调用。当没有更多值要返回时,此方法会引发StopIteration异常,该异常由循环构造隐式捕获以停止迭代。

下面是一个计数器的简单例子:

class Counter:
    def __init__(self, low, high):
        self.current = low - 1
        self.high = high

    def __iter__(self):
        return self

    def __next__(self): # Python 2: def next(self)
        self.current += 1
        if self.current < self.high:
            return self.current
        raise StopIteration


for c in Counter(3, 9):
    print(c)

这将打印:

3
4
5
6
7
8

这更容易使用生成器编写,如前面的回答所述:

def counter(low, high):
    current = low
    while current < high:
        yield current
        current += 1

for c in counter(3, 9):
    print(c)

打印输出将是相同的。在底层,生成器对象支持迭代器协议,并做一些与类Counter大致相似的事情。

David Mertz的文章《迭代器和简单生成器》是一个很好的介绍。

本页上的所有答案对于复杂对象来说都非常棒。但是对于那些包含内置可迭代类型作为属性的,如str, list, set或dict,或任何集合的实现。Iterable,你可以省略类中的某些东西。

class Test(object):
    def __init__(self, string):
        self.string = string

    def __iter__(self):
        # since your string is already iterable
        return (ch for ch in self.string)
        # or simply
        return self.string.__iter__()
        # also
        return iter(self.string)

它可以这样使用:

for x in Test("abcde"):
    print(x)

# prints
# a
# b
# c
# d
# e

这是一个没有yield的可迭代函数。它使用了iter函数和一个闭包,该闭包将它的状态保存在python 2的封闭作用域中的一个可变(列表)中。

def count(low, high):
    counter = [0]
    def tmp():
        val = low + counter[0]
        if val < high:
            counter[0] += 1
            return val
        return None
    return iter(tmp, None)

对于Python 3,闭包状态在封闭作用域中保持为不可变,而在局部作用域中使用nonlocal来更新状态变量。

def count(low, high):
    counter = 0
    def tmp():
        nonlocal counter
        val = low + counter
        if val < high:
            counter += 1
            return val
        return None
    return iter(tmp, None)  

测试;

for i in count(1,10):
    print(i)
1
2
3
4
5
6
7
8
9

类uc_iter (): def __init__(自我): 自我。值= 0 def __iter__(自我): 回归自我 def __next__(自我): Next_value = self.value 自我。值+= 2 返回next_value

改进之前的回答,使用class的优点之一是你可以添加__call__来返回self。Value或next_value。

class uc_iter():
    def __init__(self):
        self.value = 0
    def __iter__(self):
        return self
    def __next__(self):
        next_value = self.value
        self.value += 2
        return next_value
    def __call__(self):
        next_value = self.value
        self.value += 2
        return next_value
c = uc_iter()
print([c() for _ in range(10)])
print([next(c) for _ in range(5)])
# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
# [20, 22, 24, 26, 28]

其他基于Python Random的类的例子可以在我的实现中看到,它既可以被调用,也可以被迭代

我看到你们中的一些人在__iter__中返回self。我只是想指出__iter__本身可以是一个生成器(因此不需要__next__并引发StopIteration异常)

class range:
  def __init__(self,a,b):
    self.a = a
    self.b = b
  def __iter__(self):
    i = self.a
    while i < self.b:
      yield i
      i+=1

当然,这里也可以直接创建生成器,但对于更复杂的类,它可能会很有用。