从另一个列表中删除出现在一个列表中的所有元素

假设我有两个表，l1和l2。我想执行l1 - l2，返回l1中不在l2中的所有元素。

我可以想出一个简单的循环方法来做这个，但那真的很低效。python式的高效方法是什么?

举个例子，如果l1 = [1,2,6,8]， l2 = [2,3,5,8]， l1 - l2应该返回[1,6]

当前回答

扩展Donut的答案和这里的其他答案，通过使用生成器推导式而不是列表推导式，以及使用集合数据结构(因为in操作符在列表上是O(n)，而在集合上是O(1))，您可以得到更好的结果。

这里有一个函数适合你:

def filter_list(full_list, excludes):
    s = set(excludes)
    return (x for x in full_list if x not in s)

结果将是一个可迭代对象，它将惰性地获取过滤后的列表。如果你需要一个真正的列表对象(例如，如果你需要对结果执行len())，那么你可以很容易地像这样构建一个列表:

filtered_list = list(filter_list(full_list, excludes))

2010-11-18 03:07:25

其他回答

这里有一个函数适合你:

def filter_list(full_list, excludes):
    s = set(excludes)
    return (x for x in full_list if x not in s)

filtered_list = list(filter_list(full_list, excludes))

2010-11-18 03:07:25

Python 3.8上的集合和列表理解基准

(加起来就是Moinuddin Quadri的基准)

tldr:使用Arkku的集合解决方案，相比之下比承诺的还要快!

根据列表检查现有文件

在我的例子中，我发现使用Arkku的集合解决方案要比python的列表理解方法快40倍(!)。

列表理解:

%%time
import glob
existing = [int(os.path.basename(x).split(".")[0]) for x in glob.glob("*.txt")]
wanted = list(range(1, 100000))
[i for i in wanted if i not in existing]

墙壁时间:28.2秒

Sets

%%time
import glob
existing = [int(os.path.basename(x).split(".")[0]) for x in glob.glob("*.txt")]
wanted = list(range(1, 100000))
set(wanted) - set(existing)

壁时间:689毫秒

2021-01-11 20:50:25

通过利用字典的有序属性来维持顺序(Python 3.7+)

注意:Python 3.6中字典的参考实现按照插入顺序维护键，但规范不保证这一点。对于3.7及更高版本，添加了这个保证。

字典的键作为一种集合;重复项被隐式过滤掉，由于散列，查找是高效的。因此，我们可以通过使用l1作为键来构建字典，然后删除出现在l2中的任何键来实现“set difference”。这维持了秩序并使用了一种快速的算法，但会产生相当数量的常量开销。

d = dict.fromkeys(l1)
for i in l2:
    try:
        del d[i]
    except KeyError:
        pass
l3 = list(d.keys())

2022-07-06 06:36:55

如果你想要那种行为，集合方法是最好的。如果您不想删除列表l1中仅在l2中存在过一次的元素的所有实例，那么这些set操作将导致错误的结果。假设你在l1中有重复的元素，甚至在l2中也有重复的元素，并且想要两个列表l1 - l2的实际差值，同时保持其余元素的顺序:

l1 = [1, 2, 3, 4, 5, 5, 6, 5, 5, 2]
l2 = [1, 2, 2, 5]
_ = [l1.remove(item) for item in l2 if item in l1] # discard return value
print(l1) # [3, 4, 5, 6, 5, 5]

注意，这将明显比设置操作慢，只在用例需要时使用它如果你不想修改原来的列表-先创建一个列表的副本

2022-07-06 22:26:49

Python有一个称为列表推导式的语言特性，它非常适合使这类事情变得极其简单。下面的语句完全是你想要的，并将结果存储在l3中:

l3 = [x for x in l1 if x not in l2]

L3将包含[1,6]。

2010-11-18 02:48:31

从另一个列表中删除出现在一个列表中的所有元素

推荐文章

最新文章

标签