我一直在研究和学习基于分区的聚类算法,例如 K-means 和 K-Medoids。我了解到,与 K 均值相比,K 中心点对异常值的鲁棒性更强。然而,我很好奇如果在分配数据点期间,两个或多个簇代表在数据点上具有相同的距离,会发生什么。您将把数据点分配给哪个簇?将数据点分配到聚类中是否会对聚类结果产生很大影响?
为了防止发生不好的事情(无限循环等),总是更喜欢绑定时已经分配给点的簇。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)