如果我有两个非常不同的数据集和两种非常不同的分类技术,是否有一个很好的方法来组合这两个输出?我知道平均值可能有效,但有没有更相关的方法来做到这一点?我听说过一些概念,例如增强学习和集成学习,这些概念是否适用?
解决这个问题有两种一般方法。第一个,叫做boosting,使用加权投票来决定预测。主要思想是结合两个分类器的优点。
第二种方法称为stacking,使用两个分类器的输出作为另一个分类器的特征(可能带有其他特征,例如原始特征),并使用最终分类器的输出进行预测。
在没有更多细节的情况下,这是我能给出的最佳答案。
See 机器学习中的装袋、提升和堆叠请访问 Stats.SE 了解更多信息。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)