我想知道对于 kmeans 中使用的距离度量是否需要三角不等式。
k 均值是designed for 欧几里得距离,正好满足三角不等式。
使用其他距离函数是有风险的,因为它可能会停止收敛。然而原因是not三角不等式,但是平均值可能不会最小化距离函数。 (算术平均值最小化平方和,而不是任意距离!)
k 均值有更快的方法,可以利用三角不等式来避免重新计算。但如果您坚持经典的 MacQueen 或 Lloyd k-means,那么您就可以not需要三角不等式。
使用其他距离函数时要小心,以免陷入无限循环。你需要证明平均值可以最小化你的距离到聚类中心。如果你不能证明这一点,它可能无法收敛,因为目标函数不再单调递减!所以你真的应该尝试证明距离函数的收敛性!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)