我想通过使用 kmeans 聚类对组月的 X2 和 X3 进行聚类。我需要对两个变量进行聚类。另外,我想根据每个簇的平均值将簇 0、簇 1 和簇 2 分配为“强”、“平均”、“弱”。最高意味着强簇。下面是我的示例数据集。
df=pd.DataFrame({'month':['1','1','1','1','1','2','2','2','2','2','2','2'],'X1':
[30,42,25,32,12,10,4,6,5,10,24,21],'X2':[10,76,100,23,65,94,67,24,67,54,87,81],'X3':
[23,78,95,52,60,76,68,92,34,76,34,12]})
df
我需要自动执行此操作,从那时起我有很多列,我通常想在 2 个列 (df.loc[:,2:3]) 上执行此操作。将簇分配给每个 def 是
集群 2=“最佳”
集群 1=“平均”
集群 0=“弱”
要找到最佳簇,请找到每列的平均值,然后求和,如果最高则将其分配给“最佳”,较低的分配给平均,最低的分配给“弱”
请帮忙谢谢