转置/解压缩函数(逆压缩)?

我有一个2项元组的列表，我想将它们转换为2个列表，其中第一个包含每个元组中的第一项，第二个列表包含第二项。

例如:

original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
# and I want to become...
result = (['a', 'b', 'c', 'd'], [1, 2, 3, 4])

有没有内置函数可以做到这一点?

当前回答

下面是一个简单的单行回答，可以产生所需的输出:

original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
list(zip(*original))
# [('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

2022-03-07 18:28:15

其他回答

总结一下:

# data
a = ('a', 'b', 'c', 'd')
b = (1, 2, 3, 4)

# forward
zipped = zip(a, b)  # [('a', 1), ('b', 2), ('c', 3), ('d', 4)]

# reverse
a_, b_ = zip(*zipped)

# verify
assert a == a_
assert b == b_

2023-01-23 11:49:23

考虑使用more_itertools.unzip:

>>> from more_itertools import unzip
>>> original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
>>> [list(x) for x in unzip(original)]
[['a', 'b', 'c', 'd'], [1, 2, 3, 4]]

2019-01-02 21:30:15

虽然zip(*seq)非常有用，但它可能不适合非常长的序列，因为它将创建一个值的元组来传递。例如，我一直在使用一个拥有超过100万个条目的坐标系，并发现直接创建序列要快得多。

一般的方法是这样的:

from collections import deque
seq = ((a1, b1, …), (a2, b2, …), …)
width = len(seq[0])
output = [deque(len(seq))] * width # preallocate memory
for element in seq:
    for s, item in zip(output, element):
        s.append(item)

但是，根据您想要对结果做什么，集合的选择可能会产生很大的不同。在我的实际用例中，使用集合而不使用内部循环明显比所有其他方法都快。

而且，正如其他人所指出的，如果您正在对数据集进行此操作，那么使用Numpy或Pandas集合可能是有意义的。

2018-09-26 14:08:01

我喜欢在我的程序中使用zip(*iterable)(这是你正在寻找的代码段)，如下所示:

def unzip(iterable):
    return zip(*iterable)

我发现unzip更具可读性。

2014-03-01 15:00:15

下面是一个简单的单行回答，可以产生所需的输出:

original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
list(zip(*original))
# [('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

2022-03-07 18:28:15

转置/解压缩函数(逆压缩)?

推荐文章

最新文章

标签