列表推导式vs. lambda +过滤器

我有一个列表，我想通过项目的属性进行筛选。

以下哪个是首选(可读性，性能，其他原因)?

xs = [x for x in xs if x.attribute == value]

xs = filter(lambda x: x.attribute == value, xs)

当前回答

总结其他答案

通过查看答案，我们已经看到了大量的反反复复，是否列表理解或过滤可能更快，或者关心这样的问题是否重要或python。最后，答案和大多数时候一样:视情况而定。

我只是在优化代码时偶然发现了这个问题，这个问题(尽管与in表达式结合在一起，而不是==)非常相关- filter + lambda表达式占用了我三分之一的计算时间(几分钟)。

我的情况

在我的例子中，列表理解要快得多(速度的两倍)。但我怀疑，根据过滤器表达式以及使用的Python解释器，这有很大的不同。

自己测试一下

下面是一个简单的代码片段，应该很容易适应。如果你对它进行剖析(大多数ide都可以很容易地做到这一点)，你就可以很容易地为你的特定情况决定哪个是更好的选择:

whitelist = set(range(0, 100000000, 27))

input_list = list(range(0, 100000000))

proximal_list = list(filter(
        lambda x: x in whitelist,
        input_list
    ))

proximal_list2 = [x for x in input_list if x in whitelist]

print(len(proximal_list))
print(len(proximal_list2))

如果您没有一个IDE可以让您轻松地进行概要分析，那么可以试试这个(从我的代码库中提取，因此稍微复杂一点)。这段代码片段将为您创建一个配置文件，您可以轻松地使用例如snakeviz可视化:

import cProfile
from time import time


class BlockProfile:
    def __init__(self, profile_path):
        self.profile_path = profile_path
        self.profiler = None
        self.start_time = None

    def __enter__(self):
        self.profiler = cProfile.Profile()
        self.start_time = time()
        self.profiler.enable()

    def __exit__(self, *args):
        self.profiler.disable()
        exec_time = int((time() - self.start_time) * 1000)
        self.profiler.dump_stats(self.profile_path)


whitelist = set(range(0, 100000000, 27))
input_list = list(range(0, 100000000))

with BlockProfile("/path/to/create/profile/in/profile.pstat"):
    proximal_list = list(filter(
            lambda x: x in whitelist,
            input_list
        ))

    proximal_list2 = [x for x in input_list if x in whitelist]

print(len(proximal_list))
print(len(proximal_list2))

2021-02-05 07:45:07

其他回答

我会得出结论:使用列表理解而不是过滤器，因为它

更具可读性更多的神谕的更快(对于Python 3.11，参见附带的基准测试，也参见)

请记住，filter返回一个迭代器，而不是一个列表。

python3 -m timeit '[x for x in range(10000000) if x % 2 == 0]'

1个循环，5个最佳:每循环270毫秒

python3 -m timeit 'list(filter(lambda x: x % 2 == 0, range(10000000)))'

1个循环，最好的5:432毫秒每循环

2022-11-14 13:04:23

就性能而言，这要视情况而定。

filter不返回一个列表而是一个迭代器，如果你需要列表“立即”过滤和列表转换，它比非常大的列表(>1M)的列表理解要慢40%左右。到100K的元素几乎没有区别，从600K开始就开始有区别了。

如果不转换为列表，筛选实际上是即时的。

更多信息请访问:https://blog.finxter.com/python-lists-filter-vs-list-comprehension-which-is-faster/

2022-05-27 19:50:28

你的问题既简单又有趣。它只是显示了python作为一种编程语言是多么的灵活。人们可以使用任何逻辑，根据自己的才能和理解来编写程序。只要我们得到答案就好。

在您的情况下，这只是一个简单的过滤方法，可以由两者完成，但我更喜欢第一个my_list = [x for x in my_list if x.attribute == value]，因为它看起来简单，不需要任何特殊的语法。任何人都可以理解这个命令，并在需要时进行更改。 (虽然第二种方法也很简单，但对于初级程序员来说，它仍然比第一种方法更复杂)

2022-03-11 06:22:46

当我需要在列表理解之后过滤一些东西时，我使用了一小段。只是过滤器、lambda和列表的组合(或者称为猫的忠诚度和狗的清洁度)。

在这种情况下，我正在读取一个文件，剥离空行，注释掉行，以及在一行的注释之后的任何内容:

# Throw out blank lines and comments
with open('file.txt', 'r') as lines:        
    # From the inside out:
    #    [s.partition('#')[0].strip() for s in lines]... Throws out comments
    #   filter(lambda x: x!= '', [s.part... Filters out blank lines
    #  y for y in filter... Converts filter object to list
    file_contents = [y for y in filter(lambda x: x != '', [s.partition('#')[0].strip() for s in lines])]

2015-08-28 19:31:41

过滤器就是这样。它过滤掉列表中的元素。你可以看到定义中提到了同样的内容(在我之前提到的官方文档链接中)。然而，列表理解是在对前一个列表上的内容进行操作后产生一个新的列表。(过滤器和列表推导式都创建新列表，而不执行替换旧列表的操作。这里的新列表类似于具有全新数据类型的列表。比如将整数转换为字符串，等等)

在您的示例中，根据定义，使用过滤器比使用列表理解更好。但是，如果您希望，例如列表元素中的other_attribute，在您的示例中是作为一个新列表检索，那么您可以使用列表推导式。

return [item.other_attribute for item in my_list if item.attribute==value]

这就是我对筛选器和列表理解的记忆。删除列表中的一些东西，并保持其他元素完整，使用过滤器。在元素上使用一些自己的逻辑，并创建一个适合某些目的的稀释列表，使用列表理解。

2015-01-29 07:32:12

列表推导式vs. lambda +过滤器

推荐文章

最新文章

标签