我想取列表x和y的差值:

>>> x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> y = [1, 3, 5, 7, 9]  
>>> x - y
# should return [0, 2, 4, 6, 8]

当前回答

我们也可以使用set方法来查找两个列表之间的差异

x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0]
y = [1, 3, 5, 7, 9]
list(set(x).difference(y))
[0, 2, 4, 6, 8]

其他回答

list1 = ['a', 'c', 'a', 'b', 'k'] 
list2 = ['a', 'a', 'a', 'a', 'b', 'c', 'c', 'd', 'e', 'f'] 
for e in list1: 
    try: 
        list2.remove(e) 
    except ValueError: 
        print(f'{e} not in list') 
list2 
# ['a', 'a', 'c', 'd', 'e', 'f']

这将改变list2。如果你想保护list2,只需复制它,并在这段代码中使用list2的副本。

对于许多用例,您想要的答案是:

ys = set(y)
[item for item in x if item not in ys]

这是aaronasterling的答案和quantumSoup的答案的混合。

Aaronasterling的版本对x中的每个元素进行len(y)项比较,因此需要二次型时间。量子汤的版本使用集合,所以它对x中的每个元素执行一个常量时间集合查找,但是,因为它将x和y都转换为集合,所以它失去了元素的顺序。

通过只将y转换为一个集合,并按顺序迭代x,您可以获得两者的最佳效果——线性时间和有序保存


然而,这仍然存在一个问题:它要求你的元素是可哈希的。这是集合的本质。**如果你试图,例如,从另一个字典列表中减去一个字典列表,但要减去的列表很大,你会怎么做?

如果你能以某种方式装饰你的值使它们是可哈希的,这就解决了问题。例如,对于一个值本身是可哈希的平面字典:

ys = {tuple(item.items()) for item in y}
[item for item in x if tuple(item.items()) not in ys]

如果你的类型有点复杂(例如,你经常处理json兼容的值,它们是可哈希的,或者列表或字典,它们的值递归是相同的类型),你仍然可以使用这个解决方案。但是有些类型就是不能转换成任何可哈希的类型。


如果你的项目不是,也不能是可哈希的,但它们具有可比性,你至少可以通过排序和使用平分得到对数线性时间(O(N*log M),这比列表解的O(N*M)时间好得多,但不如集合解的O(N+M)时间好:

ys = sorted(y)
def bisect_contains(seq, item):
    index = bisect.bisect(seq, item)
    return index < len(seq) and seq[index] == item
[item for item in x if bisect_contains(ys, item)]

如果你的项目既不是可哈希的也不是可比较的,那么你就只能用二次解了。


*请注意,您也可以通过使用一对OrderedSet对象来实现这一点,您可以为此找到食谱和第三方模块。但我认为这样更简单。

**设置查找是常量时间的原因是,它所要做的就是散列值,并查看是否有该散列的条目。如果它不能散列值,这将不起作用。

Let:

>>> xs = [1, 2, 3, 4, 3, 2, 1]
>>> ys = [1, 3, 3]  

每一项只保留一次xs - ys == {2,4}

取集合差值:

>>> set(xs) - set(ys)
{2, 4}

删除所有xs - ys == [2,4,2]

>>> [x for x in xs if x not in ys]
[2, 4, 2]

如果ys很大,为了获得更好的性能,只将1个ys转换为一个set:

>>> ys_set = set(ys)
>>> [x for x in xs if x not in ys_set]
[2, 4, 2]

只删除相同数量的出现xs - ys == [2,4,2,1]

from collections import Counter, defaultdict

def diff(xs, ys):
    counter = Counter(ys)
    for x in xs:
        if counter[x] > 0:
            counter[x] -= 1
            continue
        yield x

>>> list(diff(xs, ys))
[2, 4, 2, 1]

1 .将xs转换为set并获取set的差异是不必要的(并且更慢,并且破坏顺序),因为我们只需要在xs上迭代一次。

使用集合差

>>> z = list(set(x) - set(y))
>>> z
[0, 8, 2, 4, 6]

或者你可以让x和y是集合所以你不需要做任何转换。

def listsubtraction(parent,child):
    answer=[]
    for element in parent:
        if element not in child:
            answer.append(element)
    return answer

我认为这应该可行。我是初学者,所以请原谅我的错误