周围有一些数据结构非常有用,但大多数程序员都不知道。他们是哪一个?

每个人都知道链表、二叉树和散列,但比如Skip列表和Bloom过滤器。我想知道更多不太常见但值得了解的数据结构,因为它们依赖于伟大的想法,丰富了程序员的工具箱。

PS:我还对舞蹈链接等技术感兴趣,这些技术巧妙地利用了通用数据结构的财产。

编辑:请尝试包含更详细描述数据结构的页面链接。此外,试着补充几句关于数据结构为什么很酷的话(正如乔纳斯·Kölker已经指出的那样)。此外,尝试为每个答案提供一个数据结构。这将允许更好的数据结构仅根据其投票结果浮到顶部。


当前回答

我喜欢缓存不可见的数据结构。其基本思想是以递归更小的块来布局树,以便许多不同大小的缓存可以利用适合它们的块。这导致了从RAM中的L1缓存到从磁盘读取的大块数据的所有缓存的高效使用,而无需了解任何缓存层的大小细节。

其他回答

不是真正的数据结构;这更像是优化动态分配阵列的一种方式,但Emacs中使用的间隙缓冲区有点酷。

min-max堆是实现双端优先级队列的堆的变体。它通过简单地更改堆属性来实现这一点:如果偶数(奇数)级别上的每个元素都小于(大于)所有子级和孙子级,则称树为最小-最大排序。级别从1开始编号。

http://internet512.chonbuk.ac.kr/datastructure/heap/img/heap8.jpg

Scapegoat树。普通二叉树的一个典型问题是它们变得不平衡(例如,当按升序插入键时)

平衡二叉树(AKA AVL树)在每次插入后都会浪费大量时间进行平衡。

红黑树保持平衡,但每个节点都需要额外的存储空间。

Scapegoat树像红黑树一样保持平衡,但不需要任何额外的存储。他们通过在每次插入后分析树并进行微小调整来实现这一点。看见http://en.wikipedia.org/wiki/Scapegoat_tree.

我认为保罗·费拉吉纳和乔凡尼·曼奇尼的FM指数真的很酷。尤其是在生物信息学方面。它本质上是一个压缩的全文索引,利用了后缀数组和参考文本的burrows-wheeler变换的组合。可以在不解压缩整个索引的情况下搜索索引。

向左倾斜的红黑树。罗伯特·塞奇威克(Robert Sedgewick)于2008年发表的红黑树的一个显著简化的实现(大约是要实现的代码行的一半)。如果您在红黑树的实现方面遇到过困难,请阅读此变体。

与安德森树非常相似(如果不是完全相同)。