生成器表达式与列表推导式

在Python中什么时候应该使用生成器表达式，什么时候应该使用列表推导式?

# Generator expression
(x*2 for x in range(256))

# List comprehension
[x*2 for x in range(256)]

当前回答

当从一个可变对象(比如一个列表)创建一个生成器时，请注意生成器将在使用生成器时根据列表的状态进行计算，而不是在创建生成器时:

>>> mylist = ["a", "b", "c"]
>>> gen = (elem + "1" for elem in mylist)
>>> mylist.clear()
>>> for x in gen: print (x)
# nothing

如果你的列表有可能被修改(或者列表中的一个可变对象)，但你需要生成器创建时的状态，你需要使用列表理解。

2016-03-12 22:21:00

其他回答

John的回答很好(当您想要多次迭代某个内容时，列表推导式更好)。然而，同样值得注意的是，如果您想使用任何列表方法，则应该使用列表。例如，下面的代码将无法工作:

def gen():
    return (something for something in get_some_stuff())

print gen()[:2]     # generators don't support indexing or slicing
print [5,6] + gen() # generators can't be added to lists

基本上，如果你所做的只是迭代一次，就使用生成器表达式。如果希望存储和使用生成的结果，那么最好使用列表推导式。

由于性能是最常见的选择一个而不是另一个的原因，我的建议是不要担心，只选择一个;如果您发现您的程序运行得太慢，那么只有在这时，您才应该返回并考虑调优您的代码。

2008-09-06 20:54:08

对于函数式编程，我们希望使用尽可能少的索引。因此，如果我们想在获取元素的第一个切片后继续使用元素，islice()是一个更好的选择，因为迭代器状态会被保存。

from itertools import islice

def slice_and_continue(sequence):
    ret = []
    seq_i = iter(sequence) #create an iterator from the list

    seq_slice = islice(seq_i,3) #take first 3 elements and print
    for x in seq_slice: print(x),

    for x in seq_i: print(x**2), #square the rest of the numbers

slice_and_continue([1,2,3,4,5])

输出:1 2 3 16 25

2022-01-17 01:39:00

当从一个可变对象(比如一个列表)创建一个生成器时，请注意生成器将在使用生成器时根据列表的状态进行计算，而不是在创建生成器时:

>>> mylist = ["a", "b", "c"]
>>> gen = (elem + "1" for elem in mylist)
>>> mylist.clear()
>>> for x in gen: print (x)
# nothing

如果你的列表有可能被修改(或者列表中的一个可变对象)，但你需要生成器创建时的状态，你需要使用列表理解。

2016-03-12 22:21:00

重要的一点是，列表推导式创建了一个新列表。生成器创建一个可迭代对象，该对象将在您使用比特时实时“过滤”源材料。

假设您有一个名为“hugefile.txt”的2TB日志文件，您需要以单词“ENTRY”开头的所有行的内容和长度。

所以你可以试着从写一个列表理解开始:

logfile = open("hugefile.txt","r")
entry_lines = [(line,len(line)) for line in logfile if line.startswith("ENTRY")]

这将获取整个文件，处理每一行，并将匹配的行存储在数组中。因此，这个数组最多可以包含2TB的内容。这是一个很大的RAM，可能不适合您的目的。

因此，我们可以使用生成器对内容应用“过滤器”。直到我们开始对结果进行迭代，才实际读取数据。

logfile = open("hugefile.txt","r")
entry_lines = ((line,len(line)) for line in logfile if line.startswith("ENTRY"))

我们的文件连一行都没读过。事实上，假设我们想进一步过滤结果:

long_entries = ((line,length) for (line,length) in entry_lines if length > 80)

仍然没有读取任何数据，但是现在我们已经指定了两个生成器，它们将按照我们的意愿处理数据。

让我们把过滤后的行写入另一个文件:

outfile = open("filtered.txt","a")
for entry,length in long_entries:
    outfile.write(entry)

现在我们读取输入文件。当我们的for循环继续请求额外的行时，long_entries生成器要求来自entry_lines生成器的行，只返回长度大于80个字符的行。然后，entry_lines生成器从logfile迭代器请求行(按指示过滤)，然后logfile迭代器读取文件。

因此，您不是以完全填充的列表的形式将数据“推”到输出函数中，而是为输出函数提供了一种仅在需要时“拉”数据的方法。在我们的例子中，这更有效，但不那么灵活。生成器是单向的，一遍;我们读取的日志文件中的数据立即被丢弃，因此我们不能返回到前一行。另一方面，一旦我们处理完数据，我们就不必担心如何保存数据。

2014-04-04 09:14:57

Python 3.7:

列表推导更快。

生成器的内存效率更高。

正如其他人所说，如果你想要扩展无限的数据，你最终还是需要一个生成器。对于相对静态的、需要快速处理的中小型工作，最好是对清单进行理解。

2020-07-03 06:37:33

生成器表达式与列表推导式

推荐文章

最新文章

标签