Python集vs列表

在Python中，哪种数据结构更高效/快速?假设顺序对我来说不重要，无论如何我都会检查重复，Python集比Python列表慢吗?

当前回答

与@Ellis Percival的测试相同，我想添加的是，在添加元素时，列表以类似于集合的方式执行。

添加元素

>>> def add_test_set(iterable):
...     for i in range(10000):
...         iterable.add(i)
...
>>> def add_test_list(iterable):
...     for i in range(10000):
...         iterable.append(i)
...
>>> timeit("add_test_set(iterable)",
...     setup="from __main__ import add_test_set; iterable = set()",
...     number=10000)
7.073143866999999
>>> timeit("add_test_list(iterable)",
...     setup="from __main__ import add_test_list; iterable = list()",
...     number=10000)
6.80650725000001

(我本来想编辑他的帖子，但编辑队列已经满了)

2021-05-31 08:55:47

其他回答

这取决于你打算用它做什么。

当涉及到确定一个对象是否存在于set中时(如x在s中)，set的速度要快得多，但它的元素是没有顺序的，因此您不能像在列表中那样通过索引访问项目。在实践中，迭代集的速度也比较慢。

您可以使用timeit模块查看哪种方法更适合您的情况。

2010-05-14 01:04:04

设置因近即时“包含”检查而获胜:https://en.wikipedia.org/wiki/Hash_table

列表实现:通常是一个数组，低层接近金属，适合迭代和随机访问的元素索引。

Set implementation: https://en.wikipedia.org/wiki/Hash_table, it does not iterate on a list, but finds the element by computing a hash from the key, so it depends on the nature of the key elements and the hash function. Similar to what is used for dict. I suspect list could be faster if you have very few elements (< 5), the larger element count the better the set will perform for a contains check. It is also fast for element addition and removal. Also always keep in mind that building a set has a cost !

注意:如果列表已经排序，那么在小列表上搜索列表可能会非常快，但是对于更多的数据集，对于包含检查会更快。

2016-08-02 14:35:22

我建议使用Set实现，用例仅限于引用或搜索存在，而使用Tuple实现，用例要求执行迭代。列表是一种低级实现，需要大量内存开销。

2018-05-07 08:35:40

当您只想遍历值时，列表比集合略快。

但是，如果您想检查一个项是否包含在集合中，那么集合要比列表快得多。但是它们只能包含独特的项目。

事实证明，元组的执行方式几乎与列表完全相同，除了它们的不可变性。

迭代

>>> def iter_test(iterable):
...     for i in iterable:
...         pass
...
>>> from timeit import timeit
>>> timeit(
...     "iter_test(iterable)",
...     setup="from __main__ import iter_test; iterable = set(range(10000))",
...     number=100000)
12.666952133178711
>>> timeit(
...     "iter_test(iterable)",
...     setup="from __main__ import iter_test; iterable = list(range(10000))",
...     number=100000)
9.917098999023438
>>> timeit(
...     "iter_test(iterable)",
...     setup="from __main__ import iter_test; iterable = tuple(range(10000))",
...     number=100000)
9.865639209747314

确定是否存在一个对象

>>> def in_test(iterable):
...     for i in range(1000):
...         if i in iterable:
...             pass
...
>>> from timeit import timeit
>>> timeit(
...     "in_test(iterable)",
...     setup="from __main__ import in_test; iterable = set(range(1000))",
...     number=10000)
0.5591847896575928
>>> timeit(
...     "in_test(iterable)",
...     setup="from __main__ import in_test; iterable = list(range(1000))",
...     number=10000)
50.18339991569519
>>> timeit(
...     "in_test(iterable)",
...     setup="from __main__ import in_test; iterable = tuple(range(1000))",
...     number=10000)
51.597304821014404

2013-07-30 10:51:12

列表性能:

>>> import timeit
>>> timeit.timeit(stmt='10**6 in a', setup='a = list(range(10**6))', number=1000)
15.08

设置性能:

>>> timeit.timeit(stmt='10**6 in a', setup='a = set(range(10**6))', number=1000)
3.90e-05

您可能想考虑元组，因为它们类似于列表，但不能修改。它们占用的内存更少，访问速度更快。它们没有列表那么灵活，但比列表更有效。它们的正常用途是作为字典键。

集合也是序列结构，但与列表和元组有两个不同。尽管集合确实有一个顺序，但这个顺序是任意的，不受程序员的控制。第二个区别是集合中的元素必须是唯一的。

根据定义设置。[python | wiki]。

>>> x = set([1, 1, 2, 2, 3, 3])
>>> x
{1, 2, 3}

2013-08-25 22:43:12

Python集vs列表

推荐文章

最新文章

标签