如何在python中创建迭代函数(或迭代器对象)?


当前回答

这是一个没有yield的可迭代函数。它使用了iter函数和一个闭包,该闭包将它的状态保存在python 2的封闭作用域中的一个可变(列表)中。

def count(low, high):
    counter = [0]
    def tmp():
        val = low + counter[0]
        if val < high:
            counter[0] += 1
            return val
        return None
    return iter(tmp, None)

对于Python 3,闭包状态在封闭作用域中保持为不可变,而在局部作用域中使用nonlocal来更新状态变量。

def count(low, high):
    counter = 0
    def tmp():
        nonlocal counter
        val = low + counter
        if val < high:
            counter += 1
            return val
        return None
    return iter(tmp, None)  

测试;

for i in count(1,10):
    print(i)
1
2
3
4
5
6
7
8
9

其他回答

这个问题是关于可迭代对象的,而不是迭代器的。在Python中,序列也是可迭代的,所以创建可迭代类的一种方法是让它的行为像序列一样,即给它__getitem__和__len__方法。我已经在Python 2和3上测试了这个。

class CustomRange:

    def __init__(self, low, high):
        self.low = low
        self.high = high

    def __getitem__(self, item):
        if item >= len(self):
            raise IndexError("CustomRange index out of range")
        return self.low + item

    def __len__(self):
        return self.high - self.low


cr = CustomRange(0, 10)
for i in cr:
    print(i)

我看到你们中的一些人在__iter__中返回self。我只是想指出__iter__本身可以是一个生成器(因此不需要__next__并引发StopIteration异常)

class range:
  def __init__(self,a,b):
    self.a = a
    self.b = b
  def __iter__(self):
    i = self.a
    while i < self.b:
      yield i
      i+=1

当然,这里也可以直接创建生成器,但对于更复杂的类,它可能会很有用。

构建迭代函数有四种方法:

创建一个生成器(使用yield关键字) 使用生成器表达式(genexp) 创建迭代器(定义__iter__和__next__(或Python 2.x中的next)) 创建一个Python可以自己迭代的类(定义__getitem__)

例子:

# generator
def uc_gen(text):
    for char in text.upper():
        yield char

# generator expression
def uc_genexp(text):
    return (char for char in text.upper())

# iterator protocol
class uc_iter():
    def __init__(self, text):
        self.text = text.upper()
        self.index = 0
    def __iter__(self):
        return self
    def __next__(self):
        try:
            result = self.text[self.index]
        except IndexError:
            raise StopIteration
        self.index += 1
        return result

# getitem method
class uc_getitem():
    def __init__(self, text):
        self.text = text.upper()
    def __getitem__(self, index):
        return self.text[index]

要查看所有四种方法的运行情况:

for iterator in uc_gen, uc_genexp, uc_iter, uc_getitem:
    for ch in iterator('abcde'):
        print(ch, end=' ')
    print()

结果是:

A B C D E
A B C D E
A B C D E
A B C D E

注意:

两个生成器类型(uc_gen和uc_genexp)不能被反转();普通迭代器(uc_iter)将需要__reversed__魔术方法(根据文档,它必须返回一个新的迭代器,但返回self也可以(至少在CPython中));而可迭代对象getitem (uc_getitem)必须具有__len__ magic方法:

    # for uc_iter we add __reversed__ and update __next__
    def __reversed__(self):
        self.index = -1
        return self
    def __next__(self):
        try:
            result = self.text[self.index]
        except IndexError:
            raise StopIteration
        self.index += -1 if self.index < 0 else +1
        return result

    # for uc_getitem
    def __len__(self)
        return len(self.text)

为了回答Colonel Panic关于无限惰性求值迭代器的第二个问题,下面是使用上述四种方法中的每一种的示例:

# generator
def even_gen():
    result = 0
    while True:
        yield result
        result += 2


# generator expression
def even_genexp():
    return (num for num in even_gen())  # or even_iter or even_getitem
                                        # not much value under these circumstances

# iterator protocol
class even_iter():
    def __init__(self):
        self.value = 0
    def __iter__(self):
        return self
    def __next__(self):
        next_value = self.value
        self.value += 2
        return next_value

# getitem method
class even_getitem():
    def __getitem__(self, index):
        return index * 2

import random
for iterator in even_gen, even_genexp, even_iter, even_getitem:
    limit = random.randint(15, 30)
    count = 0
    for even in iterator():
        print even,
        count += 1
        if count >= limit:
            break
    print

结果是(至少在我的示例运行中):

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32

如何选择使用哪一个?这主要是一个品味问题。我最常看到的两个方法是生成器和迭代器协议,以及混合方法(__iter__返回生成器)。

生成器表达式对于替换列表推导式非常有用(它们是惰性的,因此可以节省资源)。

如果需要兼容早期的Python 2。X版本使用__getitem__。

python中的迭代器对象遵循迭代器协议,这基本上意味着它们提供了两个方法:__iter__()和__next__()。

__iter__返回迭代器对象,并被隐式调用 在循环开始的时候。 __next__()方法返回下一个值,并在每次循环递增时隐式调用。当没有更多值要返回时,此方法会引发StopIteration异常,该异常由循环构造隐式捕获以停止迭代。

下面是一个计数器的简单例子:

class Counter:
    def __init__(self, low, high):
        self.current = low - 1
        self.high = high

    def __iter__(self):
        return self

    def __next__(self): # Python 2: def next(self)
        self.current += 1
        if self.current < self.high:
            return self.current
        raise StopIteration


for c in Counter(3, 9):
    print(c)

这将打印:

3
4
5
6
7
8

这更容易使用生成器编写,如前面的回答所述:

def counter(low, high):
    current = low
    while current < high:
        yield current
        current += 1

for c in counter(3, 9):
    print(c)

打印输出将是相同的。在底层,生成器对象支持迭代器协议,并做一些与类Counter大致相似的事情。

David Mertz的文章《迭代器和简单生成器》是一个很好的介绍。

如果你正在寻找一些简短而简单的东西,也许它对你来说已经足够了:

class A(object):
    def __init__(self, l):
        self.data = l

    def __iter__(self):
        return iter(self.data)

用法示例:

In [3]: a = A([2,3,4])

In [4]: [i for i in a]
Out[4]: [2, 3, 4]