Python 中均值和协方差的快速增量更新

2024-01-10

我有一个 Python 脚本,需要经常更新均值和协方差矩阵。我目前正在做的是,每次获得新数据点 $x$ (向量)时,我都会重新计算平均值和协方差,如下所示:

data.append(x) # My `data` is just a list of lists of floats (i.e., x is a list of floats)
self.mean = np.mean( data, axis=0) # self.mean is a list representing the center of data
self.cov = np.cov( data, rowvar=0)

问题是这对我来说不够快。有没有办法通过增量更新来提高效率mean and cov无需根据所有重新计算它们data ?

增量计算平均值应该很容易,我可以弄清楚。我的主要问题是如何更新协方差矩阵self.cov.


我会通过跟踪总和和平方和来做到这一点。

In the __init__:

self.sumx = 0
self.sumx2 = 0

然后在附录中:

data.append(x)
self.sumx += x
self.sumx2 += x * x[:,np,newaxis]

self.mean = sumx / len(data)
self.cov = (self.sumx2 - self.mean * self.mean[:,np,newaxis])  / len(data)

注意到[:,np.newaxis]广播以查找每对元素的产物

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 中均值和协方差的快速增量更新 的相关文章

随机推荐