如何在Python中连接两个列表?

例子:

listone = [1, 2, 3]
listtwo = [4, 5, 6]

预期结果:

>>> joinedlist
[1, 2, 3, 4, 5, 6]

当前回答

使用Python 3.3+,您可以从以下位置使用yield:

listone = [1,2,3]
listtwo = [4,5,6]

def merge(l1, l2):
    yield from l1
    yield from l2

>>> list(merge(listone, listtwo))
[1, 2, 3, 4, 5, 6]

或者,如果您希望支持任意数量的迭代器:

def merge(*iters):
    for it in iters:
        yield from it

>>> list(merge(listone, listtwo, 'abcd', [20, 21, 22]))
[1, 2, 3, 4, 5, 6, 'a', 'b', 'c', 'd', 20, 21, 22]

其他回答

你也可以使用sum。

>>> a = [1, 2, 3]
>>> b = [4, 5, 6]
>>> sum([a, b], [])
[1, 2, 3, 4, 5, 6]
>>>

这适用于任何长度和任何元素类型的列表:

>>> a = ['a', 'b', 'c', 'd']
>>> b = [1, 2, 3, 4]
>>> c = [1, 2]
>>> sum([a, b, c], [])
['a', 'b', 'c', 'd', 1, 2, 3, 4, 1, 2]
>>>

我添加[]的原因是,start参数默认设置为0,因此它在列表中循环并添加到start,但0+[1,2,3]会产生错误,因此如果我们将start设置为[]。它将添加到[],并且[]+[1,2,3]将按预期工作。

还可以使用itertools.chain()创建一个生成器,简单地迭代两个列表中的项目。这允许您将列表(或任何可迭代的)链接在一起进行处理,而无需将项目复制到新列表:

import itertools
for item in itertools.chain(listone, listtwo):
    # Do something with each list item

使用+运算符组合列表:

listone = [1, 2, 3]
listtwo = [4, 5, 6]

joinedlist = listone + listtwo

输出:

>>> joinedlist
[1, 2, 3, 4, 5, 6]

如何在Python中连接两个列表?

截至3.9,这些是在Python中连接两个(或更多)列表的最流行的stdlib方法。

Version Restrictions In-Place? Generalize to N lists?
a+b - No sum([a, b, c], [])1
list(chain(a,b))2 >=2.3 No list(chain(a, b, c))
[*a, *b]3 >=3.5 No [*a, *b, *c]
a += b - Yes No
a.extend(b) - Yes No

脚注这是一个巧妙的解决方案,因为它简洁。但sum以成对的方式执行连接,这意味着这是一个必须为每个步骤分配作为存储器的二次运算。做如果您的列表很大,请不要使用。参见链条和链接from_iteable从文档中。您需要首先从itertools导入链。级联在内存中是线性的,因此在性能和版本兼容性。chain.from_iteable在2.6中引入。此方法使用附加解包泛化(PEP 448),但不能归纳为N个列表,除非您自己手动打开每个列表。a+=b和a.extend(b)在所有实际用途中或多或少是等效的。+=当在列表中调用时,将在内部调用列表__iadd_,它将第一个列表扩展第二个列表。


表演

2-列表连接1

这些方法之间没有太大区别,但这是有意义的,因为它们都具有相同的复杂性(线性)。除了风格上的问题外,没有特别的理由更喜欢一个而不是另一个。

N-列表连接

已使用perfplot模块生成绘图。代码,供您参考。

1.iadd(+=)和extend方法在适当的地方运行,因此每次测试前都必须生成一个副本。为了保持公平,所有方法都有左侧列表的预复制步骤,可以忽略。


对其他解决方案的评论

不要使用DUNDER方法列表__以任何方式、形状或形式直接添加__。事实上,请不要使用dunder方法,并像设计的那样使用运算符和运算符函数。Python有精心设计的语义,这些语义比直接调用dunder更复杂。这里有一个例子。综上所述,a.__add__(b)=>BAD;a+b=>良好。这里的一些答案为成对串联提供了reduce(operator.add,[a,b])——这与sum([a,b],[])相同,只是更加冗长。任何使用set的方法都会删除重复项并丢失排序。小心使用。对于b中的i:a.append(i)比a.extend(b)更冗长,也更慢,后者是单函数调用,更惯用。由于为列表分配和增长内存的语义,append速度较慢。有关类似的讨论,请参见此处。heapq.mmerge可以工作,但它的用例是在线性时间内合并排序列表。在任何其他情况下使用它都是一种反模式。从函数中生成列表元素是一种可以接受的方法,但chain可以更快更好地实现这一点(它有一个C语言的代码路径,所以速度很快)。operator.add(a,b)是一个可接受的等价于a+b的函数。它的用例主要用于动态方法调度。否则,在我看来,更喜欢a+b,它更简短,更易读。YMMV。

正如许多人已经指出的那样,如果需要对两个列表应用完全相同的处理方式,itertools.chain()是一种方法。在我的例子中,我有一个标签和一个标志,这两个列表不同,所以我需要一些稍微复杂一些的东西。事实证明,幕后itertools.chain()只执行以下操作:

for it in iterables:
    for element in it:
        yield element

(参见https://docs.python.org/2/library/itertools.html),所以我从这里得到了灵感,并写了一些东西:

for iterable, header, flag in ( (newList, 'New', ''), (modList, 'Modified', '-f')):
    print header + ':'
    for path in iterable:
        [...]
        command = 'cp -r' if os.path.isdir(srcPath) else 'cp'
        print >> SCRIPT , command, flag, srcPath, mergedDirPath
        [...]

这里要理解的要点是,列表只是可迭代的一种特殊情况,它是与任何其他对象一样的对象;这是为了。。。python中的in循环可以与元组变量一起工作,因此同时循环多个变量很简单。