使用 NLTK 中的伯努利朴素贝叶斯算法和 scikit-learn 模块中的伯努利朴素贝叶斯算法对文本进行分类(仅分为两类)时,我得到了完全不同的结果。尽管两者的总体准确度相当(尽管远非相同),但 I 类和 II 类错误的差异很大。特别是,NLTK 朴素贝叶斯分类器给出的 I 类错误多于 II 类错误,而 scikit-learn 则相反。这种“异常”似乎在不同的特征和不同的训练样本中是一致的。是否有一个原因 ?这两者哪个更值得信赖呢?
NLTK 不实现伯努利朴素贝叶斯。它实现了多项式朴素贝叶斯,但只允许二进制特征。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)