我该如何正确使用词干分析法 http://projects.csail.mit.edu/jwi/api/edu/mit/jwi/morph/WordnetStemmer.html为了获取单词的词干,在 MIT 的 JWI(Java API for WordNet)中实现?我不确定如何初始化词干分析器并使用 findStems 方法。
您不需要额外的图书馆,但确实需要一本字典。您可以从普林斯顿大学下载一份:https://wordnet.princeton.edu/wordnet/download/current-version/ https://wordnet.princeton.edu/wordnet/download/current-version/
我建议仅从“WordNet 3.1 数据库文件”部分下载词典
提取存档。假设 PATH/dict 是输出的位置,您可以使用以下代码:
Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);
List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
System.out.println(test.get(i));
}
此示例的输出是“foot”。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)