我正在写一个程序,需要一个英语单词列表作为源文件,以便它工作。我意识到这些源文件可供学生编写诸如Hangman或Crossword solvers之类的游戏,但我很难找到这样的源文件,不知道是否有人知道我如何才能在不慢慢抓取网站和手动建立字典的情况下获得一个源文件。
当前回答
在任何Unix系统上/usr/share/dict/words怎么办?你到底说了多少个词?喜欢OED-Unabridged吗?
其他回答
@Future-searchers:你可以使用aspell来检查字典,它在ruby和python中都有绑定。这样你的工作就简单多了。
在任何Unix系统上/usr/share/dict/words怎么办?你到底说了多少个词?喜欢OED-Unabridged吗?
还可以看看:
http://wordlist.sourceforge.net/
还有WordNet。它的数据文件格式有良好的文档记录。 我用它为iOS开发人员构建了一个嵌入式字典库(www.lexicontext.com),也用在了我的一个应用程序中。
http://www.math.sjsu.edu/~foster/dictionary.txt
350000个单词
很晚了,但可能对其他人有用。