我有一个带有(标记)集群的数据集。我试图找到每个簇的质心(一个向量,其距离是簇的所有数据点中最小的)。
我找到了许多解决方案来执行聚类,然后才找到质心,但我还没有找到现有的解决方案。
Python scikit-learn 是首选。谢谢。
直接从docs http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.NearestCentroid.html:
from sklearn.neighbors.nearest_centroid import NearestCentroid
import numpy as np
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
y = np.array([1, 1, 1, 2, 2, 2])
clf = NearestCentroid()
clf.fit(X, y)
print(clf.centroids_)
# [[-2. -1.33333333]
# [ 2. 1.33333333]]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)