Closed. 这个问题正在寻求书籍、工具、软件库等的推荐。不满足堆栈溢出指南 /help/closed-questions 。目前不接受答案。
我想下载一本英语词典--不只是一个单词表 http://wordlist.sourceforge.net/ -- 采用结构化格式,例如 TXT、XML 或 SQL。
具体来说,我需要音标发音 and 词性 (不需要定义)。
令人惊讶的是,我在网上找不到这个。维基词典 http://www.wiktionary.org/ 可用可供下载 http://download.wikimedia.org/enwiktionary/ ,但这只是 MediaWiki 文章本身。爬取所有文章并提取语音和词性将是一项巨大的工作。
这在任何地方都可以买到吗?我不介意付钱。
编辑:有几个人问我想做什么。我当前的需求只是好奇心,例如“最常见的双音节动词是什么?”。最终,我希望有一个工具可以帮助您找到可用的域名,并通过将正确的词性配对来实现这一点,并为语音匹配提供奖励积分。
注:交叉发布于英语语言和用法 https://english.stackexchange.com/questions/3442/where-can-i-obtain-an-english-dictionary-with-structured-data .
Go to http://www.speech.cs.cmu.edu/cgi-bin/cmudict http://www.speech.cs.cmu.edu/cgi-bin/cmudict 您可以在以下位置找到发音词典的下载页面:https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk/cmudict/ https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/trunk/cmudict/
目前最新版本是cmudict.0.7a。
这就是我目前用来实现音节计数器的方法http://www.haikuvillage.com http://www.haikuvillage.com 。它是用 Ruby 编写的,如果有帮助的话我很乐意为您开源。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)