我什么时候使用每个?
另外...NLTK 词形还原是否依赖于词性?
如果是的话不是更准确吗?
短而密:http://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html http://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html
词干提取和词形还原的目标都是将单词的屈折形式和有时派生相关的形式减少为共同的基本形式。
然而,这两个词的味道不同。词干提取通常是指一种粗略的启发式过程,它会砍掉单词的结尾,希望在大多数情况下都能正确地实现这一目标,并且通常包括删除派生词缀。词形还原通常是指使用词汇和单词的形态分析来正确地进行操作,通常旨在仅删除屈折词尾并返回单词的基本形式或字典形式,这称为引理。
来自 NLTK 文档:
词形还原和词干提取是规范化的特殊情况。他们确定一组相关词形的规范代表。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)