列表方法append()和extend()之间有什么区别?


当前回答

有一个有趣的点已经被暗示,但没有解释,那就是扩展比追加更快。对于任何内部有append的循环,都应该考虑用list.exextend(processed_elements)替换。

记住,附加新元素可能会导致整个列表重新分配到内存中更好的位置。如果因为一次添加一个元素而多次执行此操作,则会影响整体性能。在这个意义上,list.extend类似于“”.jjoin(stringlist)。

其他回答

append附加一个元素。extend附加元素列表。

请注意,如果您传递一个列表进行追加,它仍然会添加一个元素:

>>> a = [1, 2, 3]
>>> a.append([4, 5, 6])
>>> a
[1, 2, 3, [4, 5, 6]]

append将元素添加到列表中。extend将第一个列表与另一个列表/可迭代列表连接起来。

>>> xs = ['A', 'B']
>>> xs
['A', 'B']

>>> xs.append("D")
>>> xs
['A', 'B', 'D']

>>> xs.append(["E", "F"])
>>> xs
['A', 'B', 'D', ['E', 'F']]

>>> xs.insert(2, "C")
>>> xs
['A', 'B', 'C', 'D', ['E', 'F']]

>>> xs.extend(["G", "H"])
>>> xs
['A', 'B', 'C', 'D', ['E', 'F'], 'G', 'H']

append在列表末尾附加指定的对象:

>>> x = [1, 2, 3]
>>> x.append([4, 5])
>>> print(x)
[1, 2, 3, [4, 5]]

extend通过从指定的iterable中附加元素来扩展列表:

>>> x = [1, 2, 3]
>>> x.extend([4, 5])
>>> print(x)
[1, 2, 3, 4, 5]

以下两个片段在语义上是等价的:

for item in iterator:
    a_list.append(item)

and

a_list.extend(iterator)

后者可能更快,因为循环是在C中实现的。

列表方法append和extend之间有什么区别?

append将其参数作为单个元素添加到列表末尾。列表本身的长度将增加1。extend迭代其参数,将每个元素添加到列表中,从而扩展列表。无论可迭代参数中有多少元素,列表的长度都会增加。

追加

list.append方法将对象附加到列表的末尾。

my_list.append(object) 

无论对象是什么,无论是数字、字符串、另一个列表或其他什么,它都会作为列表中的一个条目添加到my_list的末尾。

>>> my_list
['foo', 'bar']
>>> my_list.append('baz')
>>> my_list
['foo', 'bar', 'baz']

所以请记住,列表是一个对象。如果将另一个列表附加到列表上,则第一个列表将是列表末尾的单个对象(这可能不是您想要的):

>>> another_list = [1, 2, 3]
>>> my_list.append(another_list)
>>> my_list
['foo', 'bar', 'baz', [1, 2, 3]]
                     #^^^^^^^^^--- single item at the end of the list.

延伸

list.extend方法通过从可迭代对象中附加元素来扩展列表:

my_list.extend(iterable)

因此,使用extend,可迭代的每个元素都会附加到列表中。例如:

>>> my_list
['foo', 'bar']
>>> another_list = [1, 2, 3]
>>> my_list.extend(another_list)
>>> my_list
['foo', 'bar', 1, 2, 3]

请记住,字符串是可迭代的,因此如果您使用字符串扩展列表,则在遍历字符串时会附加每个字符(这可能不是您想要的):

>>> my_list.extend('baz')
>>> my_list
['foo', 'bar', 1, 2, 3, 'b', 'a', 'z']

操作员过载,__add__(+)和__iadd__(+=)

列表中同时定义了+和+=运算符。它们在语义上与extend相似。

mylist+anotherlist在内存中创建第三个列表,因此您可以返回它的结果,但它要求第二个可迭代列表是一个列表。

mylist+=another_list就地修改列表(它是就地运算符,正如我们所看到的,列表是可变对象),因此它不会创建新列表。它的工作方式与extend类似,因为第二个可迭代对象可以是任何类型的可迭代对象。

不要感到困惑-my_list=my_list+another_list不等同于+=-它为您提供了一个分配给my_list的全新列表。

时间复杂性

追加具有(摊销的)恒定时间复杂度O(1)。

Extend具有时间复杂性O(k)。

通过多次调用进行迭代以追加会增加复杂性,使其与extend的迭代相当,而且由于extend的循环是在C语言中实现的,因此如果您打算将可迭代项中的连续项追加到列表中,则会更快。

关于“摊销”-从列表对象实现来源:

    /* This over-allocates proportional to the list size, making room
     * for additional growth.  The over-allocation is mild, but is
     * enough to give linear-time amortized behavior over a long
     * sequence of appends() in the presence of a poorly-performing
     * system realloc().

这意味着我们可以提前获得比所需内存更大的内存重新分配带来的好处,但我们可能会在下一次边际重新分配时支付更大的费用。所有追加的总时间在O(n)处是线性的,每个追加分配的时间变为O(1)。

表演

您可能想知道什么更具性能,因为append可以用于实现与extend相同的结果。以下函数的作用相同:

def append(alist, iterable):
    for item in iterable:
        alist.append(item)
        
def extend(alist, iterable):
    alist.extend(iterable)

让我们给他们计时:

import timeit

>>> min(timeit.repeat(lambda: append([], "abcdefghijklmnopqrstuvwxyz")))
2.867846965789795
>>> min(timeit.repeat(lambda: extend([], "abcdefghijklmnopqrstuvwxyz")))
0.8060121536254883

发表关于计时的评论

一位评论者说:

完美的答案,我只是错过了比较只添加一个元素的时机

做语义正确的事情。如果要在可迭代的中追加所有元素,请使用extend。如果只是添加一个元素,请使用append。

好的,让我们做一个实验,看看这是如何及时完成的:

def append_one(a_list, element):
    a_list.append(element)

def extend_one(a_list, element):
    """creating a new list is semantically the most direct
    way to create an iterable to give to extend"""
    a_list.extend([element])

import timeit

我们发现,特意创建一个可迭代的just to use extend是(很小的)浪费时间:

>>> min(timeit.repeat(lambda: append_one([], 0)))
0.2082819009956438
>>> min(timeit.repeat(lambda: extend_one([], 0)))
0.2397019260097295

我们从中了解到,当我们只有一个元素要追加时,使用extend没有任何好处。

此外,这些时间安排也不那么重要。我只是告诉他们,在Python中,做语义正确的事情就是以正确的方式做事™.

可以想象,您可能会测试两个可比较操作的计时,并得到一个不明确或相反的结果。只需专注于做语义正确的事情。

结论

我们看到extend在语义上更清晰,并且当您打算将可迭代列表中的每个元素附加到列表中时,它可以比append运行得更快。

如果只有一个元素(不是可迭代的)要添加到列表中,请使用append。