列表推导式vs. lambda +过滤器

我有一个列表，我想通过项目的属性进行筛选。

以下哪个是首选(可读性，性能，其他原因)?

xs = [x for x in xs if x.attribute == value]

xs = filter(lambda x: x.attribute == value, xs)

当前回答

就性能而言，这要视情况而定。

filter不返回一个列表而是一个迭代器，如果你需要列表“立即”过滤和列表转换，它比非常大的列表(>1M)的列表理解要慢40%左右。到100K的元素几乎没有区别，从600K开始就开始有区别了。

如果不转换为列表，筛选实际上是即时的。

更多信息请访问:https://blog.finxter.com/python-lists-filter-vs-list-comprehension-which-is-faster/

2022-05-27 19:50:28

其他回答

尽管过滤器可能是“更快的方式”，但“Python方式”是不关心这些事情，除非性能绝对关键(在这种情况下，您不会使用Python!)。

2010-06-10 10:22:36

我想我只是在python 3中添加，filter()实际上是一个迭代器对象，所以你必须将你的filter方法调用传递给list()，以构建过滤后的列表。所以在python 2中:

lst_a = range(25) #arbitrary list
lst_b = [num for num in lst_a if num % 2 == 0]
lst_c = filter(lambda num: num % 2 == 0, lst_a)

列表b和c具有相同的值，并且在filter()等效的时间内完成[x for x in y if z]。然而，在3中，相同的代码将使列表c包含一个筛选器对象，而不是一个筛选过的列表。要在3中产生相同的值:

lst_a = range(25) #arbitrary list
lst_b = [num for num in lst_a if num % 2 == 0]
lst_c = list(filter(lambda num: num %2 == 0, lst_a))

问题是list()接受一个可迭代对象作为参数，并从该参数创建一个新列表。结果是，在python 3中以这种方式使用filter所花费的时间是[x for x in y if z]方法的两倍，因为你必须遍历filter()的输出以及原始列表。

2016-09-06 06:26:35

我花了一些时间来熟悉高阶函数过滤器和映射。所以我习惯了他们，我实际上喜欢过滤器，因为它是明确的，它通过保持任何真实的过滤，我觉得很酷，我知道一些函数编程术语。

然后我读了这篇文章(Fluent Python Book):

映射和筛选函数仍然是内置的在Python 3中，但是自从引入了列表推导式和generator ex‐ 压力没有那么重要。listcomp或genexp完成map和的工作过滤器组合，但更可读。

现在我想，如果您可以使用已经广泛传播的习语(如列表推导)来实现它，那么为什么还要使用过滤器/映射的概念呢?此外，映射和过滤器是一种函数。在这种情况下，我更喜欢使用匿名函数lambdas。

最后，为了进行测试，我对两种方法(map和listComp)都进行了计时，我没有看到任何相关的速度差异，可以证明这是合理的。

from timeit import Timer

timeMap = Timer(lambda: list(map(lambda x: x*x, range(10**7))))
print(timeMap.timeit(number=100))

timeListComp = Timer(lambda:[(lambda x: x*x) for x in range(10**7)])
print(timeListComp.timeit(number=100))

#Map:                 166.95695265199174
#List Comprehension   177.97208347299602

2017-11-28 00:27:01

奇怪的是，在Python 3上，我看到过滤器执行得比列表推导更快。

我一直认为列表推导式的性能会更好。喜欢的东西: [name为brand_names_db中的name，如果name不是None] 生成的字节码稍好一些。

>>> def f1(seq):
...     return list(filter(None, seq))
>>> def f2(seq):
...     return [i for i in seq if i is not None]
>>> disassemble(f1.__code__)
2         0 LOAD_GLOBAL              0 (list)
          2 LOAD_GLOBAL              1 (filter)
          4 LOAD_CONST               0 (None)
          6 LOAD_FAST                0 (seq)
          8 CALL_FUNCTION            2
         10 CALL_FUNCTION            1
         12 RETURN_VALUE
>>> disassemble(f2.__code__)
2           0 LOAD_CONST               1 (<code object <listcomp> at 0x10cfcaa50, file "<stdin>", line 2>)
          2 LOAD_CONST               2 ('f2.<locals>.<listcomp>')
          4 MAKE_FUNCTION            0
          6 LOAD_FAST                0 (seq)
          8 GET_ITER
         10 CALL_FUNCTION            1
         12 RETURN_VALUE

但它们实际上更慢:

   >>> timeit(stmt="f1(range(1000))", setup="from __main__ import f1,f2")
   21.177661532000116
   >>> timeit(stmt="f2(range(1000))", setup="from __main__ import f1,f2")
   42.233950221000214

2018-10-03 19:13:25

我会得出结论:使用列表理解而不是过滤器，因为它

更具可读性更多的神谕的更快(对于Python 3.11，参见附带的基准测试，也参见)

请记住，filter返回一个迭代器，而不是一个列表。

python3 -m timeit '[x for x in range(10000000) if x % 2 == 0]'

1个循环，5个最佳:每循环270毫秒

python3 -m timeit 'list(filter(lambda x: x % 2 == 0, range(10000000)))'

1个循环，最好的5:432毫秒每循环

2022-11-14 13:04:23

列表推导式vs. lambda +过滤器

推荐文章

最新文章

标签