如果你看一下并选择“显示选项:显示词汇文件信息”,您将看到一个非常有用的单词分类,称为词汇文件。例如,对于“填充”,我们有:
<noun.substance>S: (n) filling, fill (any material that fills a space or container)
<noun.process>S: (n) filling (flow into something (as a container))
<noun.food>S: (n) filling (a food mixture used to fill pastry or sandwiches etc.)
<noun.artifact>S: (n) woof, weft, filling, pick (the yarn woven across the warp yarn in weaving)
<noun.artifact>S: (n) filling ((dentistry) a dental appliance consisting of ...)
<noun.act>S: (n) filling (the act of filling something)
括号中的第一个是“词法文件”。不幸的是,我无法找到提供此信息的 SPARQL 端点
The 最新 RDF 翻译 http://semanticweb.cs.vu.nl/lod/wn30/%20includesWordnet 3.0 的定义有两点:
-
达丽斯 SPARQL 端点 http://api.talis.com/stores/wordnet/services/sparql。使用例如此查询来检查是否没有此类信息:
DESCRIBE <http://purl.org/vocabularies/princeton/wn30/synset-chair-noun-1>
-
W3C 的映射说明 http://www.w3.org/TR/wordnet-rdf/。附录 D“转换详细信息”描述了一些有用的内容:wn:classifiedByTopic
。
但它不一样词汇文件,并且相当不完整。例如“椅子”什么都没有,而“完成”的意义之一是在主题“美式足球”中
DESCRIBE <http://purl.org/vocabularies/princeton/wn30/synset-completion-noun-1>
->
<j.1:classifiedByTopic rdf:resource="http://purl.org/vocabularies/princeton/wn30/synset-American_football-noun-1"/>
问题:是否有一个公共 Wordnet 查询 API 或数据库,可以提供词汇文件信息?
使用Python NLTK接口:
from nltk.corpus import wordnet as wn
for synset in wn.synsets('can'):
print synset.lexname
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)