上下文

看看Wordle: http://www.wordle.net/ 它比我见过的任何其他词云生成器都好看得多 注意:源代码不可用-阅读常见问题:http://www.wordle.net/faq#code

我的问题

有没有一种算法可以做到Wordle所做的呢? 如果没有,有什么替代方案可以产生类似的输出?

我为什么问这个问题

只是好奇 想要学习


当前回答

我有一个标签云生成器在这里,我称之为Disorganizer:)

TagCloudService来源 还有剃须刀的价格控制 以及用于测试的WinForm 你可以把它放在你的博客,个人资料等,用一个小包装它。它使用c# 4.0 & System。大量绘制命名空间。

我创建它是因为使用其他云生成器,你不能点击标签导航,也不能创建悬停动画,以显示它们是可点击的。因为在HTML中显示悬停动画对我来说是必要的(我用覆盖,绝对定位<a>标签来做这个),我没有开发任何角度的单词显示-它们要么垂直要么水平。

警告:上面的链接可能会在几个月内失效,我计划慢慢地把它从周围的项目解开到一个单独的项目中。

您可以在这篇示例博客文章中看到一个工作演示,但它是不完整的,并且位于一个不完整的站点中。如果有人想投稿,请联系我,我会尽快把它分开。

其他回答

http://code.google.com/apis/visualization/documentation/gallery.html

看看单词云可视化。不像wordle.net那么花哨,但很容易添加到你的网站。

我有一个标签云生成器在这里,我称之为Disorganizer:)

TagCloudService来源 还有剃须刀的价格控制 以及用于测试的WinForm 你可以把它放在你的博客,个人资料等,用一个小包装它。它使用c# 4.0 & System。大量绘制命名空间。

我创建它是因为使用其他云生成器,你不能点击标签导航,也不能创建悬停动画,以显示它们是可点击的。因为在HTML中显示悬停动画对我来说是必要的(我用覆盖,绝对定位<a>标签来做这个),我没有开发任何角度的单词显示-它们要么垂直要么水平。

警告:上面的链接可能会在几个月内失效,我计划慢慢地把它从周围的项目解开到一个单独的项目中。

您可以在这篇示例博客文章中看到一个工作演示,但它是不完整的,并且位于一个不完整的站点中。如果有人想投稿,请联系我,我会尽快把它分开。

I've implemented a word cloud generator called WordCloud.jl in Julia language. A brief description about its algorithm can be found here. Unlike most other implementations, I designed it based on gradient optimization. It’s a non-greedy algorithm in which words can be further moved after they are positioned. Thus the size of the words and the shape and size of the background mask can be kept unchanged in the generation process. This makes the outputs more accurate and easy to customize. Furthermore, we can also generate some fancy outputs like these: Comparison of Obama's and Trump's inaugural address and Wikipedia: Julia

我是Wordle的创造者。以下是Wordle的实际工作原理:

数单词,扔掉无聊的单词,按数量排序,降序排列。保留前N个单词的N个,为每个单词分配与其计数成比例的字体大小。使用Java2D API为每个单词生成一个Java2D Shape。

每个单词“都想”在某个地方,比如“在垂直中心的某个随机x位置”。按照出现频率的递减顺序,对每个单词执行以下操作:

place the word where it wants to be
while it intersects any of the previously placed words
    move it one step along an ever-increasing spiral

就是这样。困难的部分是如何有效地进行交叉测试,为此我使用了最后一次缓存、分层边界框和四叉树空间索引(所有这些都是您可以通过google了解更多的东西)。

编辑:正如Reto Aebersold指出的,现在有一本书的章节,免费提供,涵盖了同样的领域:美丽的可视化,第3章:Wordle

这是一个非常好的javascript代码,来自Jason Davies,它使用了d3。你甚至可以使用web字体。

演示: http://www.jasondavies.com/wordcloud/

Github: https://github.com/jasondavies/d3-cloud