周围有一些数据结构非常有用,但大多数程序员都不知道。他们是哪一个?

每个人都知道链表、二叉树和散列,但比如Skip列表和Bloom过滤器。我想知道更多不太常见但值得了解的数据结构,因为它们依赖于伟大的想法,丰富了程序员的工具箱。

PS:我还对舞蹈链接等技术感兴趣,这些技术巧妙地利用了通用数据结构的财产。

编辑:请尝试包含更详细描述数据结构的页面链接。此外,试着补充几句关于数据结构为什么很酷的话(正如乔纳斯·Kölker已经指出的那样)。此外,尝试为每个答案提供一个数据结构。这将允许更好的数据结构仅根据其投票结果浮到顶部。


当前回答

使用2个堆栈实现的队列非常节省空间(与使用至少有1个额外指针/引用开销的链接列表不同)。

如何使用两个堆栈实现队列?

当排队人数很大时,这对我来说效果很好。如果我在一个指针上节省了8个字节,这意味着拥有百万条目的队列节省了大约8MB的RAM。

其他回答

跳过列表非常整洁。

维基百科跳过列表是一种概率数据结构,基于多个并行、排序的链接列表,其效率与二进制搜索树相当(大多数操作的顺序日志n平均时间)。

它们可以作为平衡树的替代(使用概率平衡而不是严格执行平衡)。它们很容易实现,而且比红黑树更快。我认为他们应该在每一个优秀的程序员工具箱中。

如果你想深入了解跳过列表,这里有一个麻省理工学院算法简介讲座视频的链接。

此外,这里还有一个Java小程序,直观地演示了跳过列表。

其他人已经提出了Burkhard Keller Trees,但我想我可能会再次提及它们,以便插入我自己的实现

http://well-adjusted.de/mspace.py/index.html

周围有更快的实现(参见ActiveState的Python配方或其他语言的实现),但我认为/希望我的代码有助于理解这些数据结构。

顺便说一句,BK和VP树可用于搜索类似字符串。只要距离函数满足几个条件(正、对称、三角形不等式),就可以对任意对象进行相似性搜索。

Scapegoat树。普通二叉树的一个典型问题是它们变得不平衡(例如,当按升序插入键时)

平衡二叉树(AKA AVL树)在每次插入后都会浪费大量时间进行平衡。

红黑树保持平衡,但每个节点都需要额外的存储空间。

Scapegoat树像红黑树一样保持平衡,但不需要任何额外的存储。他们通过在每次插入后分析树并进行微小调整来实现这一点。看见http://en.wikipedia.org/wiki/Scapegoat_tree.

不连续集合森林允许快速的成员查询和联合操作,并且最著名的是在Kruskal的最小生成树算法中使用。

真正酷的是,这两种操作都按阿克曼函数的倒数比例摊销了运行时间,这使其成为“最快”的非恒定时间数据结构。

我很惊讶没有人提到Merkle树(即哈希树)。

在许多情况下(P2P程序、数字签名),当您只有部分文件可用时,您需要验证整个文件的哈希。