在 xgboost 的文档中我读到:
基本分数[default=0.5] : 所有的初始预测分数
实例,全局偏差
这句话的意思是什么?基本分数是数据集中感兴趣事件的先验概率吗? IE。在包含 1,000 个观察值(其中 300 个正值和 700 个负值)的数据集中,基本分数将为 0.3?
如果不是,那会是什么?
我们将不胜感激您的建议。
我认为您的理解是正确的,在您的示例中,基本分数可以设置为 0.3,或者您可以简单地将其保留为默认 0.5。对于高度不平衡的数据,您可以将其初始化为更有意义的基本分数,以改进学习过程。理论上,只要选择正确的学习率并给予足够的步数来训练,起始基础分数应该不会影响结果。看看作者的回答这个问题 https://github.com/dmlc/xgboost/issues/799.
参考:https://github.com/dmlc/xgboost/issues/799 https://github.com/dmlc/xgboost/issues/799
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)