周围有一些数据结构非常有用,但大多数程序员都不知道。他们是哪一个?

每个人都知道链表、二叉树和散列,但比如Skip列表和Bloom过滤器。我想知道更多不太常见但值得了解的数据结构,因为它们依赖于伟大的想法,丰富了程序员的工具箱。

PS:我还对舞蹈链接等技术感兴趣,这些技术巧妙地利用了通用数据结构的财产。

编辑:请尝试包含更详细描述数据结构的页面链接。此外,试着补充几句关于数据结构为什么很酷的话(正如乔纳斯·Kölker已经指出的那样)。此外,尝试为每个答案提供一个数据结构。这将允许更好的数据结构仅根据其投票结果浮到顶部。


当前回答

Zobrist Hashing是一个哈希函数,通常用于表示棋盘位置(如国际象棋),但肯定还有其他用途。它的一个优点是它可以随着电路板的更新而逐步更新。

其他回答

有一种巧妙的数据结构,它使用数组来保存元素的数据,但数组在链接列表/数组中链接在一起。

这确实具有这样的优点,即对元素的迭代非常快(比纯链接列表方法更快),并且在内存和/或(去)分配中移动带有元素的数组的成本最低。(正因为如此,此数据结构对于模拟工作非常有用)。

我从这里知道:

http://software.intel.com/en-us/blogs/2010/03/26/linked-list-verses-array/

“……并且一个额外的数组被分配并链接到粒子数组的单元格列表中。这在某些方面类似于TBB实现其并发容器的方式。”(这是关于链接列表与数组的性能)

芬威克树。这是一种数据结构,用于计算向量中两个给定的子索引i和j之间的所有元素的总和。简单的解决方案是,从开始时就预先计算总和,不允许更新项目(必须做O(n)工作才能跟上)。

Fenwick Trees允许您在O(logn)中更新和查询,它的工作方式非常简单。芬威克的原始论文对这一点做了很好的解释,可以在这里免费获得:

http://www.cs.ubc.ca/local/reading/proceedings/spe91-95/spe/vol24/issue3/spe884.pdf

它的父亲RQM树也很酷:它允许您保存关于向量的两个索引之间的最小元素的信息,它还可以在O(logn)更新和查询中工作。我喜欢先教RQM,然后教芬威克树。

我认为保罗·费拉吉纳和乔凡尼·曼奇尼的FM指数真的很酷。尤其是在生物信息学方面。它本质上是一个压缩的全文索引,利用了后缀数组和参考文本的burrows-wheeler变换的组合。可以在不解压缩整个索引的情况下搜索索引。

我认为循环排序是一种非常整洁的排序算法。

这是一种排序算法,用于最小化写入总数。这在处理闪存时尤其有用,因为闪存的寿命与写入量成正比。这是维基百科的文章,但我建议转到第一个链接。(视觉效果不错!)

我认为标准数据结构的无锁替代方案,即无锁队列、堆栈和列表被忽略了。随着并发性成为更高的优先级,它们变得越来越重要,并且比使用互斥或锁来处理并发读/写更令人钦佩。

以下是一些链接http://www.cl.cam.ac.uk/research/srg/netos/lock-free/http://www.research.ibm.com/people/m/michael/podc-1996.pdf[PDF链接]http://www.boyet.com/Articles/LockfreeStack.html

迈克·阿克顿(Mike Acton)的博客中有一些关于无锁设计和方法的优秀文章