从另一个列表中删除出现在一个列表中的所有元素

假设我有两个表，l1和l2。我想执行l1 - l2，返回l1中不在l2中的所有元素。

我可以想出一个简单的循环方法来做这个，但那真的很低效。python式的高效方法是什么?

举个例子，如果l1 = [1,2,6,8]， l2 = [2,3,5,8]， l1 - l2应该返回[1,6]

当前回答

使用Python set类型。这是最Pythonic的。：）

此外，由于它是原生的，它也应该是最优化的方法。

See:

http://docs.python.org/library/stdtypes.html#set

http://docs.python.org/library/sets.htm(适用于较旧的python)

# Using Python 2.7 set literal format.
# Otherwise, use: l1 = set([1,2,6,8])
#
l1 = {1,2,6,8}
l2 = {2,3,5,8}
l3 = l1 - l2

2010-11-18 02:56:24

其他回答

使用filterfalse而不使用lambda-expression

When using functions like filter or filterfalse and similar from itertools you can usually save performance by avoiding lambda-expressions and using already existing functions. Instances of list and set defines a __contains__-method to use for containment checks. The in-operator calls this method under the hood, so using x in l2 can be replaced by l2.__contains__(x). Usually this replacement is not really prettier but in this specific case it allows us to gain better performance than using a lambda-expression, when used in combination with filterfalse:

>>> from itertools import filterfalse
>>> l1 = [1, 2, 6, 8]
>>> l2 = [2, 3, 5, 8]
>>> list(filterfalse(l2.__contains__, l1))
[1, 6]

Filterfalse创建一个迭代器，该迭代器生成的所有元素在用作12.2 .__contains__的参数时返回false。

Sets有一个更快的__contains__实现，所以更好的是:

>>> from itertools import filterfalse
>>> l1 = [1, 2, 6, 8]
>>> l2 = set([2, 3, 5, 8])
>>> list(filterfalse(l2.__contains__, l1))
[1, 6]

性能

使用列表:

$  python3 -m timeit -s "from itertools import filterfalse; l1 = [1,2,6,8]; l2 = set([2,3,5,8]);" "list(filterfalse(l2.__contains__, l1))"
500000 loops, best of 5: 522 nsec per loop

使用设置:

$ python3 -m timeit -s "from itertools import filterfalse; l1 = [1,2,6,8]; l2 = set([2,3,5,8]);" "list(filterfalse(l2.__contains__, l1))"
1000000 loops, best of 5: 359 nsec per loop

2021-04-09 15:06:48

扩展Donut的答案和这里的其他答案，通过使用生成器推导式而不是列表推导式，以及使用集合数据结构(因为in操作符在列表上是O(n)，而在集合上是O(1))，您可以得到更好的结果。

这里有一个函数适合你:

def filter_list(full_list, excludes):
    s = set(excludes)
    return (x for x in full_list if x not in s)

结果将是一个可迭代对象，它将惰性地获取过滤后的列表。如果你需要一个真正的列表对象(例如，如果你需要对结果执行len())，那么你可以很容易地像这样构建一个列表:

filtered_list = list(filter_list(full_list, excludes))

2010-11-18 03:07:25

试试这个:

l1=[1,2,6,8]
l2=[2,3,5,8]
r=[]
for x in l1:
    if x in l2:
        continue
    r=r+[x]
print(r)

2021-01-24 13:10:53

Python有一个称为列表推导式的语言特性，它非常适合使这类事情变得极其简单。下面的语句完全是你想要的，并将结果存储在l3中:

l3 = [x for x in l1 if x not in l2]

L3将包含[1,6]。

2010-11-18 02:48:31

一种方法是使用集合:

>>> set([1,2,6,8]) - set([2,3,5,8])
set([1, 6])

但是请注意，集合不会保留元素的顺序，并且会删除任何重复的元素。元素也需要是可哈希的。如果这些限制是可以容忍的，那么这通常是最简单和性能最高的选项。

2010-11-18 02:50:51

从另一个列表中删除出现在一个列表中的所有元素

推荐文章

最新文章

标签