生成器表达式与列表推导式

在Python中什么时候应该使用生成器表达式，什么时候应该使用列表推导式?

# Generator expression
(x*2 for x in range(256))

# List comprehension
[x*2 for x in range(256)]

当前回答

当结果需要多次迭代时，或者在速度非常重要的情况下，使用列表推导式。在范围较大或无穷大的地方使用生成器表达式。

有关更多信息，请参阅生成器表达式和列表推导式。

2008-09-06 20:10:59

其他回答

当结果需要多次迭代时，或者在速度非常重要的情况下，使用列表推导式。在范围较大或无穷大的地方使用生成器表达式。

有关更多信息，请参阅生成器表达式和列表推导式。

2008-09-06 20:10:59

Python 3.7:

列表推导更快。

生成器的内存效率更高。

正如其他人所说，如果你想要扩展无限的数据，你最终还是需要一个生成器。对于相对静态的、需要快速处理的中小型工作，最好是对清单进行理解。

2020-07-03 06:37:33

关于内置Python函数的一些注意事项:

如果需要利用任何或全部的短路行为，请使用生成器表达式。这些函数被设计为在已知答案时停止迭代，但是列表推导式必须在调用函数之前计算每个元素。

例如，如果我们有

from time import sleep
def long_calculation(value):
    sleep(1) # for simulation purposes
    return value == 1

然后any([long_calculation(x) for x in range(10)])大约需要10秒，因为long_calculation将为每个x调用，any(long_calculation(x) for x in range(10))只需要大约2秒，因为long_calculation只会在0和1输入时被调用。

当any和all遍历列表理解时，一旦已知答案，它们仍然会停止检查元素的真实性(只要any发现一个真结果，或者all发现一个假结果);然而，与理解所做的实际工作相比，这通常是微不足道的。

生成器表达式当然更节省内存，如果可能的话。使用非短路的min, max和sum (max的计时如图所示)，列表推导会稍微快一些:

$ python -m timeit "max(_ for _ in range(1))"
500000 loops, best of 5: 476 nsec per loop
$ python -m timeit "max([_ for _ in range(1)])"
500000 loops, best of 5: 425 nsec per loop
$ python -m timeit "max(_ for _ in range(100))"
50000 loops, best of 5: 4.42 usec per loop
$ python -m timeit "max([_ for _ in range(100)])"
100000 loops, best of 5: 3.79 usec per loop
$ python -m timeit "max(_ for _ in range(10000))"
500 loops, best of 5: 468 usec per loop
$ python -m timeit "max([_ for _ in range(10000)])"
500 loops, best of 5: 442 usec per loop

2022-08-02 23:24:59

对于函数式编程，我们希望使用尽可能少的索引。因此，如果我们想在获取元素的第一个切片后继续使用元素，islice()是一个更好的选择，因为迭代器状态会被保存。

from itertools import islice

def slice_and_continue(sequence):
    ret = []
    seq_i = iter(sequence) #create an iterator from the list

    seq_slice = islice(seq_i,3) #take first 3 elements and print
    for x in seq_slice: print(x),

    for x in seq_i: print(x**2), #square the rest of the numbers

slice_and_continue([1,2,3,4,5])

输出:1 2 3 16 25

2022-01-17 01:39:00

列表推导式是热切的，但生成器是懒惰的。

在列表推导式中，所有对象都是立即创建的，它需要更长的时间来创建和返回列表。在生成器表达式中，对象创建被延迟到next()请求。在next()生成器对象创建并立即返回时。

在列表推导中迭代更快，因为已经创建了对象。

如果迭代列表解析和生成器表达式中的所有元素，时间性能大致相同。即使生成器表达式立即返回生成器对象，它也不会创建所有元素。每次迭代一个新元素时，它都会创建并返回它。

But if you do not iterate through all the elements generator are more efficient. Let's say you need to create a list comprehensions that contains millions of items but you are using only 10 of them. You still have to create millions of items. You are just wasting time for making millions of calculations to create millions of items to use only 10. Or if you are making millions of api requests but end up using only 10 of them. Since generator expressions are lazy, it does not make all the calculations or api calls unless it is requested. In this case using generator expressions will be more efficient.

在列表推导式中，整个集合被加载到内存中。但是生成器表达式，一旦它在下一次()调用时返回一个值给你，它就完成了，不需要再将它存储在内存中。只有一个项目被载入内存。如果你在磁盘上迭代一个巨大的文件，如果文件太大，你可能会遇到内存问题。在这种情况下，使用生成器表达式更有效。

2021-01-14 18:23:57

生成器表达式与列表推导式

推荐文章

最新文章

标签