什么时候应该使用字典、列表或集合?

是否存在更适合每种数据类型的场景?


当前回答

与列表、字典和集合相结合,还有另一个有趣的python对象OrderedDicts。

有序字典就像普通字典一样,但是它们会记住条目插入的顺序。在有序字典上迭代时,项将按照键第一次添加的顺序返回。

OrderedDicts在需要保留键的顺序时可能很有用,例如处理文档:通常需要文档中所有术语的向量表示。因此,使用OrderedDicts,您可以有效地验证一个项之前是否已读取,添加项,提取项,在所有操作之后,您可以提取它们的有序向量表示。

其他回答

当您有一组映射到值的唯一键时,请使用字典。 如果你有一个有序的项目集合,可以使用列表。 使用集合存储一组无序的项。

对于c++,我总是在脑海中有这样的流程图:在哪个场景中使用特定的STL容器?,所以我很好奇Python3中是否也有类似的东西,但我运气不好。

对于Python,你需要记住的是:Python没有像c++那样单一的标准。因此,不同的Python解释器(例如CPython, PyPy)可能存在巨大的差异。下面是CPython的流程图。

此外,我发现没有好办法将以下数据结构合并到图表中:字节、字节数组、元组、named_tuples、ChainMap、计数器和数组。

OrderedDict和deque可以通过collections模块获得。 Heapq可以从Heapq模块获得 LifoQueue、Queue和PriorityQueue可以通过Queue模块使用,Queue模块是为并发(线程)访问而设计的。(还有一个多处理。队列可用,但我不知道与队列的区别。队列,但假定它应该在需要从进程进行并发访问时使用。) Dict, set, frozen_set和list当然是内置的

对于任何人,如果你能改进这个答案,并在每个方面提供一个更好的图表,我将非常感激。请随意,欢迎光临。

PS:图是用yed做的。graphml文件在这里

简而言之,使用:

列表-如果你需要一个有序的项目序列。

Dict -如果你需要将值与键联系起来

设置—如果您需要保留唯一的元素。

详细解释

List

列表是一个可变序列,通常用于存储同构项的集合。

列表实现了所有常见的序列操作:

X在l里和X不在l里 L [i], L [i:j], L [i:j:k] Len (l) min(l) max(l) l.count (x) l.index(x[, i[, j]]) - x在l中第一次出现的索引(在i前后和j索引之前)

list还实现了所有可变序列操作:

l[i] = x - item i of l is replaced by x l[i:j] = t - slice of l from i to j is replaced by the contents of the iterable t del l[i:j] - same as l[i:j] = [] l[i:j:k] = t - the elements of l[i:j:k] are replaced by those of t del l[i:j:k] - removes the elements of s[i:j:k] from the list l.append(x) - appends x to the end of the sequence l.clear() - removes all items from l (same as del l[:]) l.copy() - creates a shallow copy of l (same as l[:]) l.extend(t) or l += t - extends l with the contents of t l *= n - updates l with its contents repeated n times l.insert(i, x) - inserts x into l at the index given by i l.pop([i]) - retrieves the item at i and also removes it from l l.remove(x) - remove the first item from l where l[i] is equal to x l.reverse() - reverses the items of l in place

可以利用append和pop方法将列表用作堆栈。

字典

字典将可哈希值映射到任意对象。字典是一个可变对象。字典的主要操作是存储带有某个键的值,并在给定键的情况下提取值。

在字典中,不能使用不可哈希的值作为键,即包含列表、字典或其他可变类型的值。

Set

set是不同哈希对象的无序集合。集合通常用于包括成员测试,从序列中删除重复项,以及计算数学操作,如交集、并集、差分和对称差分。

当您需要唯一元素的无序集合时,请使用set。(例如,当您需要文档中使用的所有单词的集合时)。

当你想收集一个不可变的有序元素列表时,使用元组。(例如,当您希望将(name, phone_number)对用作集合中的元素时,您将需要元组而不是列表,因为集合要求元素是不可变的)。

当您想收集一个可变的有序元素列表时,请使用列表。(例如,当您想要将新的电话号码追加到列表:[number1, number2,…])。

当您需要从键映射到值时,请使用字典。(例如,当你想要一个将名字映射到电话号码的电话簿:{'John Smith': '555-1212'})。注意字典中的键是无序的。(如果你遍历字典(电话簿),键(名字)可能以任何顺序出现)。

你只是需要一个有序的项目序列吗?列个清单。 您是否只需要知道您是否已经获得了一个特定的值,但不需要进行排序(并且您不需要存储副本)?使用一个集合。 您是否需要将值与键相关联,以便稍后可以有效地(按键)查找它们?使用字典。