列表推导式vs. lambda +过滤器

我有一个列表，我想通过项目的属性进行筛选。

以下哪个是首选(可读性，性能，其他原因)?

xs = [x for x in xs if x.attribute == value]

xs = filter(lambda x: x.attribute == value, xs)

当前回答

奇怪的是，不同的人的美相差如此之大。我发现列表理解比filter+lambda清晰得多，但使用您认为更容易的。

有两件事可能会减慢你使用滤镜的速度。

首先是函数调用开销:一旦使用Python函数(无论是由def还是lambda创建的)，过滤器很可能会比列表理解慢。几乎可以肯定，这并不重要，在对代码进行计时并发现它是一个瓶颈之前，您不应该过多地考虑性能，但区别是存在的。

可能应用的另一个开销是lambda被强制访问一个有作用域的变量(值)。这比在python2中访问局部变量要慢。X，列表推导式只访问局部变量。如果你使用的是Python 3。X，列表综合在一个单独的函数中运行，因此它也将通过闭包访问值，这种差异将不适用。

另一个可以考虑的选项是使用生成器而不是列表推导式:

def filterbyvalue(seq, value):
   for el in seq:
       if el.attribute==value: yield el

然后在你的主代码中(这是可读性真正重要的地方)，你用一个有意义的函数名替换了列表理解和过滤器。

2010-06-10 10:52:49

其他回答

一般过滤器稍快，如果使用内置函数。

在您的情况下，我希望列表理解稍微快一些

2010-06-10 10:17:47

一个重要的区别是，列表推导式将返回一个列表，而过滤器返回一个过滤器，你不能像操作列表一样操作它(即:在它上调用len，它不能与过滤器的返回一起工作)。

我自己的自学也让我遇到了类似的问题。

也就是说，如果有一种方法可以从过滤器获得结果列表，有点像在。net中执行lst时所做的那样。Where(i => i.something()). tolist()，我很想知道它。

编辑:这是Python 3的情况，而不是Python 2(见评论中的讨论)。

2014-10-15 23:50:25

除了公认的答案之外，还有一种极端情况，即您应该使用过滤器而不是列表推导式。如果列表是不可哈希的，则不能使用列表推导式直接处理它。一个真实的例子是使用pyodbc从数据库读取结果。游标的fetchAll()结果是一个不可哈希的列表。在这种情况下，要直接对返回的结果进行操作，应该使用filter:

cursor.execute("SELECT * FROM TABLE1;")
data_from_db = cursor.fetchall()
processed_data = filter(lambda s: 'abc' in s.field1 or s.StartTime >= start_date_time, data_from_db)

如果你在这里使用列表理解，你会得到错误:

TypeError:不可哈希类型:list

2018-02-28 21:16:58

总结其他答案

通过查看答案，我们已经看到了大量的反反复复，是否列表理解或过滤可能更快，或者关心这样的问题是否重要或python。最后，答案和大多数时候一样:视情况而定。

我只是在优化代码时偶然发现了这个问题，这个问题(尽管与in表达式结合在一起，而不是==)非常相关- filter + lambda表达式占用了我三分之一的计算时间(几分钟)。

我的情况

在我的例子中，列表理解要快得多(速度的两倍)。但我怀疑，根据过滤器表达式以及使用的Python解释器，这有很大的不同。

自己测试一下

下面是一个简单的代码片段，应该很容易适应。如果你对它进行剖析(大多数ide都可以很容易地做到这一点)，你就可以很容易地为你的特定情况决定哪个是更好的选择:

whitelist = set(range(0, 100000000, 27))

input_list = list(range(0, 100000000))

proximal_list = list(filter(
        lambda x: x in whitelist,
        input_list
    ))

proximal_list2 = [x for x in input_list if x in whitelist]

print(len(proximal_list))
print(len(proximal_list2))

如果您没有一个IDE可以让您轻松地进行概要分析，那么可以试试这个(从我的代码库中提取，因此稍微复杂一点)。这段代码片段将为您创建一个配置文件，您可以轻松地使用例如snakeviz可视化:

import cProfile
from time import time


class BlockProfile:
    def __init__(self, profile_path):
        self.profile_path = profile_path
        self.profiler = None
        self.start_time = None

    def __enter__(self):
        self.profiler = cProfile.Profile()
        self.start_time = time()
        self.profiler.enable()

    def __exit__(self, *args):
        self.profiler.disable()
        exec_time = int((time() - self.start_time) * 1000)
        self.profiler.dump_stats(self.profile_path)


whitelist = set(range(0, 100000000, 27))
input_list = list(range(0, 100000000))

with BlockProfile("/path/to/create/profile/in/profile.pstat"):
    proximal_list = list(filter(
            lambda x: x in whitelist,
            input_list
        ))

    proximal_list2 = [x for x in input_list if x in whitelist]

print(len(proximal_list))
print(len(proximal_list2))

2021-02-05 07:45:07

我觉得第二种方法更容易读懂。它确切地告诉你目的是什么:过滤列表。注意:不要使用list作为变量名

2010-06-10 10:19:27

列表推导式vs. lambda +过滤器

推荐文章

最新文章

标签