我需要一个包含积极和消极词语的列表weights根据单词的强度和周数来分配单词。我有 :
1.) WordNet - 它为每个单词给出 + 或 - 分数。
2.) SentiWordNet - 给出 [0,1] 范围内的正值和负值。
我用几句话检查了这些,
love - wordNet 对名词和动词都给出 0.0,我不知道为什么我认为它至少在某些方面应该是积极的。
压制 - wordNet 给出 -9.93
- SentiWordNet 为 pos 和 neg 给出 - 0.0。 (应该是负数)
休息 - wordNet - 2.488
- SentiWordNet - { pos - 0.125,neg - 0.5 }(应该是正数)
我需要一些帮助来决定使用哪一个。
Thanks.
通常,程度和/或极性可能取决于领域和/或上下文,因此仅靠这个词并不足以做出决定。
如果您有一些带注释的数据,我建议使用这两个资源提供的分数作为特征来训练分类器。如果不这样做,一种选择是使用与相关域匹配的可用情感注释语料库之一。尽管在无监督情感分类方法上有大量工作,但在没有任何数据的情况下,整个任务变得有些棘手,我相信,例如,无监督情感分析
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)