现在我正在使用一个列表,并期待类似的东西:

verts = list (1000)

我应该用数组代替吗?


当前回答

Wanting to initalize an array of fixed size is a perfectly acceptable thing to do in any programming language; it isn't like the programmer wants to put a break statement in a while(true) loop. Believe me, especially if the elements are just going to be overwritten and not merely added/subtracted, like is the case of many dynamic programming algorithms, you don't want to mess around with append statements and checking if the element hasn't been initialized yet on the fly (that's a lot of code gents).

对象= [0 for x in range(1000)]

这将为程序员试图实现的目标工作。

其他回答

@Steve已经很好地回答了你的问题:

verts = [None] * 1000

警告:正如@Joachim Wuttke指出的,列表必须用一个不可变元素初始化。[[]] * 1000不能像预期的那样工作,因为你会得到一个包含1000个相同列表的列表(类似于C中包含1000个指向同一列表的点的列表)。像int, str或tuple这样的不可变对象可以很好地工作。

选择

调整列表的大小很慢。以下结果并不令人惊讶:

>>> N = 10**6

>>> %timeit a = [None] * N
100 loops, best of 3: 7.41 ms per loop

>>> %timeit a = [None for x in xrange(N)]
10 loops, best of 3: 30 ms per loop

>>> %timeit a = [None for x in range(N)]
10 loops, best of 3: 67.7 ms per loop

>>> a = []
>>> %timeit for x in xrange(N): a.append(None)
10 loops, best of 3: 85.6 ms per loop

但是如果您没有非常大的列表,那么调整大小并不会非常慢。不要用单个元素(例如None)和固定长度来初始化列表以避免列表大小的调整,你应该考虑使用列表综合式并直接用正确的值填充列表。例如:

>>> %timeit a = [x**2 for x in xrange(N)]
10 loops, best of 3: 109 ms per loop

>>> def fill_list1():
    """Not too bad, but complicated code"""
    a = [None] * N
    for x in xrange(N):
        a[x] = x**2
>>> %timeit fill_list1()
10 loops, best of 3: 126 ms per loop

>>> def fill_list2():
    """This is slow, use only for small lists"""
    a = []
    for x in xrange(N):
        a.append(x**2)
>>> %timeit fill_list2()
10 loops, best of 3: 177 ms per loop

与numpy的比较

对于庞大的数据集,numpy或其他优化的库要快得多:

from numpy import ndarray, zeros
%timeit empty((N,))
1000000 loops, best of 3: 788 ns per loop

%timeit zeros((N,))
100 loops, best of 3: 3.56 ms per loop

这样的:

 lst = [8 for i in range(9)]

创建一个列表,元素初始化8

但这:

lst = [0] * 7

会创建7个包含一个元素的列表吗

您应该考虑使用字典类型而不是预先初始化的列表。字典查找的开销很小,与访问任意列表元素的开销相当。

当使用映射时,你可以这样写:

aDict = {}
aDict[100] = fetchElement()
putElement(fetchElement(), fetchPosition(), aDict)

putElement函数可以将item存储在任何给定的位置。如果你需要检查你的集合是否包含给定索引的元素,那么更python化的做法是:

if anIndex in aDict:
    print "cool!"

比:

if not myList[anIndex] is None:
    print "cool!"

因为后者假设集合中没有真正的元素可以是None。如果发生这种情况,你的代码就会出错。

如果你迫切需要性能,这就是为什么你试图预初始化你的变量,并编写尽可能快的代码-改变你的语言。最快的代码不能用Python编写。您应该尝试使用C语言,并实现包装器来从Python调用预初始化和预编译的代码。

你可以这样做:

verts = list(xrange(1000))

这将为您提供一个大小为1000个元素的列表,并且恰巧初始化值为0-999。由于list首先执行__len__来调整新列表的大小,因此应该相当有效。

一个显而易见但可能并不有效的方法是

verts = [0 for x in range(1000)]

注意,这可以很容易地扩展到二维。 例如,要获得一个10x100的“数组”,你可以这样做

verts = [[0 for x in range(100)] for y in range(10)]