我知道 MAPE 和 WMAPE 作为预测误差指标,它们有一些好处。但差距是什么?有人说:
For MAPE:
"Combinations with very small or zero volumes can cause large skew in results"
And for WMAPE:
"Combinations with large weights can skew the results in their favor"
我不明白,有人能解释这两个指标的弱点吗?谢谢。
对于 MAPE,平均绝对百分比误差 [1],假设我们将实际值表示为A,和预测值P。您在时间 1 到 n 处有一系列数据,那么
MAPE = 100/n * ( Sum of |(A(t) - P(t))/A(t)| ), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
由于 A(t) 位于分母中,因此每当 A(t) 非常小或接近于零时,该除法就像一除以零,这会在绝对百分比误差中产生非常大的变化。如此大的变化的组合肯定会导致结果出现很大的偏差。
对于 WMAPE,加权平均绝对百分比误差,
Sum of |(A(t) - P(t))/A(t)| * W(t)
WMPAE = -------------------------------------, for t in 1..n
Sum of W(t)
where W(t) is the weight you associate with the prediction at time t.
由于这是一种加权度量,因此它不存在与 MAPE 相同的问题,例如由于体积非常小或为零而导致过度倾斜。
然而,权重因子将表明我们希望对每个预测赋予的主观重要性[2]。
例如,考虑发布
日期,我们可以以这样的方式分配权重:
权重,我们越重视最近的
数据。在这种情况下,我们可以观察到即使 MAE
在合理的阈值下,系统的性能
在分析这个特定功能时可能是不够的。
这就是对最新数据的偏爱如何扭曲结果的原因。
[1] http://en.wikipedia.org/wiki/Mean_absolute_percentage_error
[2] http://ir.ii.uam.es/rue2012/papers/rue2012-cleger-tamayo.pdf
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)