列表方法append()和extend()之间有什么区别?
当前回答
有一个有趣的点已经被暗示,但没有解释,那就是扩展比追加更快。对于任何内部有append的循环,都应该考虑用list.exextend(processed_elements)替换。
记住,附加新元素可能会导致整个列表重新分配到内存中更好的位置。如果因为一次添加一个元素而多次执行此操作,则会影响整体性能。在这个意义上,list.extend类似于“”.jjoin(stringlist)。
其他回答
我希望我能对这个问题做一个有益的补充。如果您的列表存储了一个特定类型的对象,例如Info,这里有一种情况是extend方法不适合的:在for循环中,每次生成一个Info对象并使用extend将其存储到列表中,它将失败。例外情况如下:
TypeError:“Info”对象不可迭代
但如果使用append方法,结果是可以的。因为每次使用extend方法时,它都会将其视为列表或任何其他集合类型,对其进行迭代,并将其放在上一个列表之后。显然,特定的对象无法迭代。
以下两个片段在语义上是等价的:
for item in iterator:
a_list.append(item)
and
a_list.extend(iterator)
后者可能更快,因为循环是在C中实现的。
追加“扩展”列表(在适当位置)仅一个项,传递单个对象(作为参数)。
extend将列表(就地)扩展到传递的对象(作为参数)所包含的项目。
对于str对象,这可能会有点混淆。
如果将字符串作为参数传递:append将在末尾添加一个字符串项,但extend将添加与该字符串长度相同的“单个”str项。如果将字符串列表作为参数传递:append仍将在末尾添加单个“列表”项,并且extend将添加与传递列表长度相同的“列表”项。
def append_o(a_list,元素):a_list.append(元素)打印('append:',end='')对于a_list中的项目:打印(项,结束=',')打印()def extend_o(a_list,元素):a_list.exextend(元素)打印('extend:',end='')对于a_list中的项目:打印(项,结束=',')打印()append_o(['ab'],'cd')扩展_ o([‘ab’],‘d’)append_o(['ab'],['cd','ef'])extend_o(['ab'],['cd','ef'])附加(['ab'],['cd'])扩展_ o([‘ab’],[‘cd’])
生产:
append: ab,cd,
extend: ab,c,d,
append: ab,['cd', 'ef'],
extend: ab,cd,ef,
append: ab,['cd'],
extend: ab,cd,
列表方法append和extend之间有什么区别?
append将其参数作为单个元素添加到列表末尾。列表本身的长度将增加1。extend迭代其参数,将每个元素添加到列表中,从而扩展列表。无论可迭代参数中有多少元素,列表的长度都会增加。
追加
list.append方法将对象附加到列表的末尾。
my_list.append(object)
无论对象是什么,无论是数字、字符串、另一个列表或其他什么,它都会作为列表中的一个条目添加到my_list的末尾。
>>> my_list
['foo', 'bar']
>>> my_list.append('baz')
>>> my_list
['foo', 'bar', 'baz']
所以请记住,列表是一个对象。如果将另一个列表附加到列表上,则第一个列表将是列表末尾的单个对象(这可能不是您想要的):
>>> another_list = [1, 2, 3]
>>> my_list.append(another_list)
>>> my_list
['foo', 'bar', 'baz', [1, 2, 3]]
#^^^^^^^^^--- single item at the end of the list.
延伸
list.extend方法通过从可迭代对象中附加元素来扩展列表:
my_list.extend(iterable)
因此,使用extend,可迭代的每个元素都会附加到列表中。例如:
>>> my_list
['foo', 'bar']
>>> another_list = [1, 2, 3]
>>> my_list.extend(another_list)
>>> my_list
['foo', 'bar', 1, 2, 3]
请记住,字符串是可迭代的,因此如果您使用字符串扩展列表,则在遍历字符串时会附加每个字符(这可能不是您想要的):
>>> my_list.extend('baz')
>>> my_list
['foo', 'bar', 1, 2, 3, 'b', 'a', 'z']
操作员过载,__add__(+)和__iadd__(+=)
列表中同时定义了+和+=运算符。它们在语义上与extend相似。
mylist+anotherlist在内存中创建第三个列表,因此您可以返回它的结果,但它要求第二个可迭代列表是一个列表。
mylist+=another_list就地修改列表(它是就地运算符,正如我们所看到的,列表是可变对象),因此它不会创建新列表。它的工作方式与extend类似,因为第二个可迭代对象可以是任何类型的可迭代对象。
不要感到困惑-my_list=my_list+another_list不等同于+=-它为您提供了一个分配给my_list的全新列表。
时间复杂性
追加具有(摊销的)恒定时间复杂度O(1)。
Extend具有时间复杂性O(k)。
通过多次调用进行迭代以追加会增加复杂性,使其与extend的迭代相当,而且由于extend的循环是在C语言中实现的,因此如果您打算将可迭代项中的连续项追加到列表中,则会更快。
关于“摊销”-从列表对象实现来源:
/* This over-allocates proportional to the list size, making room
* for additional growth. The over-allocation is mild, but is
* enough to give linear-time amortized behavior over a long
* sequence of appends() in the presence of a poorly-performing
* system realloc().
这意味着我们可以提前获得比所需内存更大的内存重新分配带来的好处,但我们可能会在下一次边际重新分配时支付更大的费用。所有追加的总时间在O(n)处是线性的,每个追加分配的时间变为O(1)。
表演
您可能想知道什么更具性能,因为append可以用于实现与extend相同的结果。以下函数的作用相同:
def append(alist, iterable):
for item in iterable:
alist.append(item)
def extend(alist, iterable):
alist.extend(iterable)
让我们给他们计时:
import timeit
>>> min(timeit.repeat(lambda: append([], "abcdefghijklmnopqrstuvwxyz")))
2.867846965789795
>>> min(timeit.repeat(lambda: extend([], "abcdefghijklmnopqrstuvwxyz")))
0.8060121536254883
发表关于计时的评论
一位评论者说:
完美的答案,我只是错过了比较只添加一个元素的时机
做语义正确的事情。如果要在可迭代的中追加所有元素,请使用extend。如果只是添加一个元素,请使用append。
好的,让我们做一个实验,看看这是如何及时完成的:
def append_one(a_list, element):
a_list.append(element)
def extend_one(a_list, element):
"""creating a new list is semantically the most direct
way to create an iterable to give to extend"""
a_list.extend([element])
import timeit
我们发现,特意创建一个可迭代的just to use extend是(很小的)浪费时间:
>>> min(timeit.repeat(lambda: append_one([], 0)))
0.2082819009956438
>>> min(timeit.repeat(lambda: extend_one([], 0)))
0.2397019260097295
我们从中了解到,当我们只有一个元素要追加时,使用extend没有任何好处。
此外,这些时间安排也不那么重要。我只是告诉他们,在Python中,做语义正确的事情就是以正确的方式做事™.
可以想象,您可能会测试两个可比较操作的计时,并得到一个不明确或相反的结果。只需专注于做语义正确的事情。
结论
我们看到extend在语义上更清晰,并且当您打算将可迭代列表中的每个元素附加到列表中时,它可以比append运行得更快。
如果只有一个元素(不是可迭代的)要添加到列表中,请使用append。
追加和扩展是python中的扩展机制之一。
追加:将元素添加到列表末尾。
my_list = [1,2,3,4]
要向列表中添加新元素,我们可以按以下方式使用append方法。
my_list.append(5)
将添加新元素的默认位置始终位于(长度+1)位置。
Insert:Insert方法用于克服append的限制。使用insert,我们可以明确定义新元素插入的确切位置。
insert(索引,对象)的方法描述符。它需要两个参数,第一个是要插入元素的索引,第二个是元素本身。
Example: my_list = [1,2,3,4]
my_list[4, 'a']
my_list
[1,2,3,4,'a']
扩展:当我们想将两个或多个列表合并到一个列表中时,这非常有用。如果不使用extend,如果我们想要连接两个列表,那么生成的对象将包含一个列表列表。
a = [1,2]
b = [3]
a.append(b)
print (a)
[1,2,[3]]
如果我们试图访问位置2的元素,我们会得到一个列表([3]),而不是元素。要连接两个列表,我们必须使用append。
a = [1,2]
b = [3]
a.extend(b)
print (a)
[1,2,3]
加入多个列表
a = [1]
b = [2]
c = [3]
a.extend(b+c)
print (a)
[1,2,3]
推荐文章
- 将Pandas或Numpy Nan替换为None以用于MysqlDB
- 使用pandas对同一列进行多个聚合
- 使用Python解析HTML
- django MultiValueDictKeyError错误,我如何处理它
- 如何在for循环期间修改列表条目?
- 我如何在Django中创建一个鼻涕虫?
- 为什么java.util.Set没有get(int index)?
- 数组与列表的性能
- 没有名为'django.core.urlresolvers'的模块
- 蟒蛇导出环境文件
- Django - makemigrations -未检测到任何更改
- SQLAlchemy:引擎、连接和会话差异
- 在Python Pandas中删除多个列中的所有重复行
- 更改pandas DataFrame中的特定列名
- 将Pandas多索引转换为列