我想知道 XGBClassifier 对它所做的每个预测的置信度如何。有可能有这样的价值吗?或者,predict_proba 是否已经间接成为模型的置信度?
你的直觉确实是正确的:predict_proba
返回每个示例属于给定类别的概率;来自docs http://xgboost.readthedocs.io/en/latest/python/python_api.html#xgboost.XGBClassifier.predict_proba:
predict_proba
(数据,output_margin=False,ntree_limit=0)
预测每个的概率data给定类的示例。
这个概率依次被常规解释在实践中 as the 信心的预测。
也就是说,这是一种临时的实用解释,与 p 值或任何其他统计严谨性度量无关;一般来说,据我所知,对于这种(和类似的)机器学习技术没有这样的措施可用。
在更一般的层面上,您可能有兴趣知道 p 值本身很快就不再受到统计学家的青睐。一些快速链接:
-
ASA 关于 p 值的声明:背景、过程和目的 https://amstat.tandfonline.com/doi/abs/10.1080/00031305.2016.1154108#.WtCvRX9LfmE(美国统计学家)
-
统计学家对滥用数据发出警告P values https://www.nature.com/news/statisticians-issue-warning-over-misuse-of-p-values-1.19503(自然)
-
p 值的问题不仅仅在于 p 值 http://www.stat.columbia.edu/%7Egelman/research/published/asa_pvalues.pdf(安德鲁·格尔曼@美国统计学家)
-
p 值的问题 https://towardsdatascience.com/a-case-study-of-the-p-value-f0d708861334(走向数据科学博客文章)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)