我们都知道,有列表理解,比如
[i for i in [1, 2, 3, 4]]
还有字典理解,比如
{i:j for i, j in {1: 'a', 2: 'b'}.items()}
but
(i for i in (1, 2, 3))
将在生成器中结束,而不是元组理解。为什么呢?
我的猜测是元组是不可变的,但这似乎不是答案。
我们都知道,有列表理解,比如
[i for i in [1, 2, 3, 4]]
还有字典理解,比如
{i:j for i, j in {1: 'a', 2: 'b'}.items()}
but
(i for i in (1, 2, 3))
将在生成器中结束,而不是元组理解。为什么呢?
我的猜测是元组是不可变的,但这似乎不是答案。
当前回答
正如另一位macm在他的回答中提到的,从生成器创建元组的最快方法是tuple([generator])。
性能比较
List comprehension: $ python3 -m timeit "a = [i for i in range(1000)]" 10000 loops, best of 3: 27.4 usec per loop Tuple from list comprehension: $ python3 -m timeit "a = tuple([i for i in range(1000)])" 10000 loops, best of 3: 30.2 usec per loop Tuple from generator: $ python3 -m timeit "a = tuple(i for i in range(1000))" 10000 loops, best of 3: 50.4 usec per loop Tuple from unpacking: $ python3 -m timeit "a = *(i for i in range(1000))," 10000 loops, best of 3: 52.7 usec per loop
我的python版本:
$ python3 --version
Python 3.6.3
因此,您应该始终从列表推导式创建元组,除非性能不是问题。
其他回答
你可以使用生成器表达式:
tuple(i for i in (1, 2, 3))
但是括号已经被用于生成器表达式。
在我的python(3.5)中,使用带有deque from collections的生成器比使用列表推导式略快:
>>> from collections import deque
>>> timeit.timeit(lambda: tuple([i for i in range(10000000)]),number=10)
9.294099200000005
>>> timeit.timeit(lambda: tuple(deque((i for i in range(10000000)))),number=10)
9.007653800000014
我最好的猜测是他们用完了括号,并且认为它没有足够的用处来保证添加一个“丑陋的”语法…
Raymond Hettinger (Python核心开发人员之一)在最近的一条推文中谈到了元组:
#python提示:通常,列表用于循环;用于结构的元组。列表是同构的;元组异构。可变长度的列表。
这(对我来说)支持了这样一种观点,即如果序列中的项足够相关,可以由生成器生成,那么它应该是一个列表。虽然tuple是可迭代的,看起来像一个简单的不可变列表,但它实际上是Python中的C结构体:
struct {
int a;
char b;
float c;
} foo;
struct foo x = { 3, 'g', 5.9 };
在Python中变成
x = (3, 'g', 5.9)
理解通过循环或迭代项并将它们赋值到容器中来工作,元组无法接收赋值。
一旦创建了元组,就不能对其追加、扩展或赋值。修改元组的唯一方法是它的一个对象本身可以被赋值(是一个非元组容器)。因为元组只保存了对这类对象的引用。
而且,元组有自己的构造函数tuple(),你可以给它任何迭代器。这意味着创建一个元组,你可以这样做:
tuple(i for i in (1,2,3))