如何使用 Python 查找我的数据属于哪个集群?

2024-02-11

我刚刚对我的数据运行了 PCA,然后运行了 K 均值聚类算法,运行算法后我得到了 3 个聚类。我试图找出我的输入属于哪些集群,以便收集有关输入的一些定性属性。我的输入是客户 ID,用于聚类的变量是某些产品的支出模式

下面是我为 K 均值运行的代码,寻找一些有关如何将其映射回源数据的输入,以查看输入属于哪个集群:

kmeans= KMeans(n_clusters=3)
X_clustered=kmeans.fit_predict(x_10d)

LABEL_COLOR_MAP = {0:'r', 1 : 'g' ,2 : 'b'}
label_color=[LABEL_COLOR_MAP[l] for l in X_clustered]

#plot the scatter diagram

plt.figure(figsize=(7,7))
plt.scatter(x_10d[:,0],x_10d[:,2] , c=label_color, alpha=0.5)
plt.show()

Thanks


如果您想将集群标签添加回数据框中,并假设 x_10d 是您的数据框,您可以执行以下操作:

x_10d["簇"] = X_clustered

这将在数​​据框中添加一个名为“cluster”的新列,其中应包含每行的集群标签。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Python 查找我的数据属于哪个集群? 的相关文章

随机推荐