我想取列表x和y的差值:
>>> x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> y = [1, 3, 5, 7, 9]
>>> x - y
# should return [0, 2, 4, 6, 8]
我想取列表x和y的差值:
>>> x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> y = [1, 3, 5, 7, 9]
>>> x - y
# should return [0, 2, 4, 6, 8]
当前回答
对于许多用例,您想要的答案是:
ys = set(y)
[item for item in x if item not in ys]
这是aaronasterling的答案和quantumSoup的答案的混合。
Aaronasterling的版本对x中的每个元素进行len(y)项比较,因此需要二次型时间。量子汤的版本使用集合,所以它对x中的每个元素执行一个常量时间集合查找,但是,因为它将x和y都转换为集合,所以它失去了元素的顺序。
通过只将y转换为一个集合,并按顺序迭代x,您可以获得两者的最佳效果——线性时间和有序保存
然而,这仍然存在一个问题:它要求你的元素是可哈希的。这是集合的本质。**如果你试图,例如,从另一个字典列表中减去一个字典列表,但要减去的列表很大,你会怎么做?
如果你能以某种方式装饰你的值使它们是可哈希的,这就解决了问题。例如,对于一个值本身是可哈希的平面字典:
ys = {tuple(item.items()) for item in y}
[item for item in x if tuple(item.items()) not in ys]
如果你的类型有点复杂(例如,你经常处理json兼容的值,它们是可哈希的,或者列表或字典,它们的值递归是相同的类型),你仍然可以使用这个解决方案。但是有些类型就是不能转换成任何可哈希的类型。
如果你的项目不是,也不能是可哈希的,但它们具有可比性,你至少可以通过排序和使用平分得到对数线性时间(O(N*log M),这比列表解的O(N*M)时间好得多,但不如集合解的O(N+M)时间好:
ys = sorted(y)
def bisect_contains(seq, item):
index = bisect.bisect(seq, item)
return index < len(seq) and seq[index] == item
[item for item in x if bisect_contains(ys, item)]
如果你的项目既不是可哈希的也不是可比较的,那么你就只能用二次解了。
*请注意,您也可以通过使用一对OrderedSet对象来实现这一点,您可以为此找到食谱和第三方模块。但我认为这样更简单。
**设置查找是常量时间的原因是,它所要做的就是散列值,并查看是否有该散列的条目。如果它不能散列值,这将不起作用。
其他回答
使用集合差
>>> z = list(set(x) - set(y))
>>> z
[0, 8, 2, 4, 6]
或者你可以让x和y是集合所以你不需要做任何转换。
在set中查找值比在list中查找值更快:
[item for item in x if item not in set(y)]
我相信这将会比:
[item for item in x if item not in y]
两者都保持了列表的顺序。
如果列表允许重复元素,你可以使用Counter from collections:
from collections import Counter
result = list((Counter(x)-Counter(y)).elements())
如果你需要保留x中元素的顺序:
result = [ v for c in [Counter(y)] for v in x if not c[v] or c.subtract([v]) ]
其他解决方案都存在以下几个问题之一:
它们不能维持秩序,或者 它们不删除精确的元素计数,例如,对于x =[1,2,2,2]和y =[2,2],它们将y转换为一个集合,然后删除所有匹配的元素(只留下[1])或删除每个唯一元素中的一个(留下[1,2,2]),当正确的行为是删除2两次,留下[1,2],或者 它们做O(m * n)个功,而最优解做O(m + n)个功
Alain和Counter在解决第2和第3个问题上是正确的,但这个解决方案将失去秩序。保持顺序的解决方案(在要删除的值列表中重复n次,删除每个值的前n个副本)是:
from collections import Counter
x = [1,2,3,4,3,2,1]
y = [1,2,2]
remaining = Counter(y)
out = []
for val in x:
if remaining[val]:
remaining[val] -= 1
else:
out.append(val)
# out is now [3, 4, 3, 1], having removed the first 1 and both 2s.
在网上试试!
要使它删除每个元素的最后副本,只需将for循环改为for val in reversed(x):并在退出for循环后立即添加out.reverse()。
根据y的长度构造Counter为O(n),根据x的长度迭代x为O(n), Counter隶属度测试和突变为O(1),而list。append被平摊为O(1)(一个给定的append可以是O(n),但对于许多追加,整体大O平均为O(1),因为越来越少的追加需要重新分配),所以所做的总体功是O(m + n)。
你还可以通过测试来确定y中是否有任何元素没有从x中移除:
remaining = +remaining # Removes all keys with zero counts from Counter
if remaining:
# remaining contained elements with non-zero counts
这个例子减去了两个列表:
# List of pairs of points
list = []
list.append([(602, 336), (624, 365)])
list.append([(635, 336), (654, 365)])
list.append([(642, 342), (648, 358)])
list.append([(644, 344), (646, 356)])
list.append([(653, 337), (671, 365)])
list.append([(728, 13), (739, 32)])
list.append([(756, 59), (767, 79)])
itens_to_remove = []
itens_to_remove.append([(642, 342), (648, 358)])
itens_to_remove.append([(644, 344), (646, 356)])
print("Initial List Size: ", len(list))
for a in itens_to_remove:
for b in list:
if a == b :
list.remove(b)
print("Final List Size: ", len(list))