我正在开发一个程序,让用户在“涂鸦区域”绘制一个数字,按下按钮,应用程序将使用神经网络分类器预测他输入的数字。
现在,为了训练神经网络,我使用了 MNIST 数据库,其中指定了以下内容:“NIST 中的图像经过尺寸标准化以适合 20x20 像素框,同时保留其纵横比 [...] 图像以 28 x 28 为中心通过计算像素的质心来获得图像”。
我面临的问题是,将用户在涂鸦区域中绘制的数字大小调整为 20 x 20 后,我需要计算像素的质心,以便可以将其居中于28 x 28 图像。
我该如何计算呢?
“质心”(对于二值图像)是“每个维度的平均值”的一种有点复杂的表达方式。换句话说 - 取所有 x 坐标并对它们进行平均 - 你就得到了“质心”的 x 坐标,对于 y 来说也是如此。
在Python中,对于数据X
这将是
center_of_mass = X.mean(axis=0)
如果您有像素的强度,您可以将它们用作“权重”,从而得出加权平均值,仅此而已。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)