我们如何使用 Weka 计算集群的准确性?
我可以使用这个公式:
Accuracy (A) = (tp+tn)/Total # samples
但我如何知道Weka工具中实验输出的真阳性、假阳性、真阴性和假阴性是什么?
Weka中有几种不同的聚类模式:
使用训练集(默认):聚类后,Weka 将训练实例分类到它开发的集群中,并计算属于每个集群的实例的百分比。例如,簇 0 中的 X% 和簇 1 中的 Y% 等。
提供的测试集:如果聚类表示像 EM 算法一样是概率性的,那么可以使用 Weka 在单独的测试数据上评估聚类。
使用类进行聚类评估:在这种模式下,Weka 首先忽略类属性并生成聚类。在测试过程中,它根据每个簇内类属性的多数值将类标签分配给簇。最后,它计算分类误差并显示相应的混淆矩阵。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)