尽管最大似然估计(MLE)和EM都可以找到“最佳拟合”参数,但是它们查找模型的方式却大不相同。 MLE首先累积所有数据,然后使用该数据构建最可能的模型。 EM首先对参数进行猜测(考虑丢失的数据),然后对模型进行调整以适合猜测和观察到的数据。该算法的基本步骤是:
- 对模型的参数进行初步猜测,并创建概率分布。有时将其称为“预期”分发的“ E步骤”。
- 新观察到的数据被输入到模型中。
- 调整了来自E步骤的概率分布,以包括新数据。有时称为“ M步”。
- 重复执行第2步到第4步,直到达到稳定性(即从E步到M步不变的分布)为止。
EM算法通过此多步骤过程始终可以改善参数的估算。但是,有时该算法需要一些随机的开始才能找到最佳模型,因为该算法可以适应与(最佳)全局最大值不相近的局部最大值。换句话说,如果您强制它重新启动并再次执行步骤1中的“初始猜测”,则它的性能会更好。然后,从所有可能的参数中,选择可能性最大的参数。
例子:
最经典的翻硬币问题
假设我们有两个硬币A和B
同时这只两集X_a {
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)