转置/解压缩函数(逆压缩)?

我有一个2项元组的列表，我想将它们转换为2个列表，其中第一个包含每个元组中的第一项，第二个列表包含第二项。

例如:

original = [('a', 1), ('b', 2), ('c', 3), ('d', 4)]
# and I want to become...
result = (['a', 'b', 'c', 'd'], [1, 2, 3, 4])

有没有内置函数可以做到这一点?

当前回答

在2。X, zip是它自己的逆!前提是使用特殊的*操作符。

>>> zip(*[('a', 1), ('b', 2), ('c', 3), ('d', 4)])
[('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

这相当于将列表中的每个元素作为单独的参数调用zip:

zip(('a', 1), ('b', 2), ('c', 3), ('d', 4))

除非参数被直接传递给zip(在被转换为元组之后)，所以没有必要担心参数的数量变得太大。

在3。X, zip返回一个惰性迭代器，但这是简单的转换:

>>> list(zip(*[('a', 1), ('b', 2), ('c', 3), ('d', 4)]))
[('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

2008-08-21 04:36:29

其他回答

在2。X, zip是它自己的逆!前提是使用特殊的*操作符。

>>> zip(*[('a', 1), ('b', 2), ('c', 3), ('d', 4)])
[('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

这相当于将列表中的每个元素作为单独的参数调用zip:

zip(('a', 1), ('b', 2), ('c', 3), ('d', 4))

除非参数被直接传递给zip(在被转换为元组之后)，所以没有必要担心参数的数量变得太大。

在3。X, zip返回一个惰性迭代器，但这是简单的转换:

>>> list(zip(*[('a', 1), ('b', 2), ('c', 3), ('d', 4)]))
[('a', 'b', 'c', 'd'), (1, 2, 3, 4)]

2008-08-21 04:36:29

因为它返回元组(可能会使用大量内存)，所以对我来说，zip(*zipped)技巧似乎更聪明而不是有用。

这是一个函数，它会给出zip的倒数。

def unzip(zipped):
    """Inverse of built-in zip function.
    Args:
        zipped: a list of tuples

    Returns:
        a tuple of lists

    Example:
        a = [1, 2, 3]
        b = [4, 5, 6]
        zipped = list(zip(a, b))

        assert zipped == [(1, 4), (2, 5), (3, 6)]

        unzipped = unzip(zipped)

        assert unzipped == ([1, 2, 3], [4, 5, 6])

    """

    unzipped = ()
    if len(zipped) == 0:
        return unzipped

    dim = len(zipped[0])

    for i in range(dim):
        unzipped = unzipped + ([tup[i] for tup in zipped], )

    return unzipped

2018-06-11 13:35:08

你也可以

result = ([ a for a,b in original ], [ b for a,b in original ])

它的可伸缩性应该更好。特别是如果Python不扩展列表推导式，除非需要的话。

(顺便说一句，它生成一个二元组(对)列表，而不是像zip那样生成一个元组列表。)

如果生成器代替实际的列表是可以的，这将做到:

result = (( a for a,b in original ), ( b for a,b in original ))

在您请求每个元素之前，生成器不会仔细检查列表，但另一方面，它们会保留对原始列表的引用。

2008-08-24 17:07:57

我喜欢在我的程序中使用zip(*iterable)(这是你正在寻找的代码段)，如下所示:

def unzip(iterable):
    return zip(*iterable)

我发现unzip更具可读性。

2014-03-01 15:00:15

虽然zip(*seq)非常有用，但它可能不适合非常长的序列，因为它将创建一个值的元组来传递。例如，我一直在使用一个拥有超过100万个条目的坐标系，并发现直接创建序列要快得多。

一般的方法是这样的:

from collections import deque
seq = ((a1, b1, …), (a2, b2, …), …)
width = len(seq[0])
output = [deque(len(seq))] * width # preallocate memory
for element in seq:
    for s, item in zip(output, element):
        s.append(item)

但是，根据您想要对结果做什么，集合的选择可能会产生很大的不同。在我的实际用例中，使用集合而不使用内部循环明显比所有其他方法都快。

而且，正如其他人所指出的，如果您正在对数据集进行此操作，那么使用Numpy或Pandas集合可能是有意义的。

2018-09-26 14:08:01

转置/解压缩函数(逆压缩)?

推荐文章

最新文章

标签