我刚刚对我的数据运行了 PCA,然后运行了 K 均值聚类算法,运行算法后我得到了 3 个聚类。我试图找出我的输入属于哪些集群,以便收集有关输入的一些定性属性。我的输入是客户 ID,用于聚类的变量是某些产品的支出模式
下面是我为 K 均值运行的代码,寻找一些有关如何将其映射回源数据的输入,以查看输入属于哪个集群:
kmeans= KMeans(n_clusters=3)
X_clustered=kmeans.fit_predict(x_10d)
LABEL_COLOR_MAP = {0:'r', 1 : 'g' ,2 : 'b'}
label_color=[LABEL_COLOR_MAP[l] for l in X_clustered]
#plot the scatter diagram
plt.figure(figsize=(7,7))
plt.scatter(x_10d[:,0],x_10d[:,2] , c=label_color, alpha=0.5)
plt.show()
Thanks
如果您想将集群标签添加回数据框中,并假设 x_10d 是您的数据框,您可以执行以下操作:
x_10d["簇"] = X_clustered
这将在数据框中添加一个名为“cluster”的新列,其中应包含每行的集群标签。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)