我应该使用什么例程或算法来为 DBSCAN 算法提供 eps 和 minPts 参数以获得有效的结果?
DBSCAN 论文建议根据维度选择 minPts,根据 k 距离图中的肘部选择 eps。
在最近的出版物中
舒伯特,E.,桑德,J.,埃斯特,M.,克里格尔,H.P.,&徐,X.(2017)。
DBSCAN 重访,重访:为什么以及如何您应该(仍然)使用 DBSCAN。
ACM 数据库系统事务 (TODS),42(3), 19。
作者建议对大型且有噪声的数据集使用较大的 minpts,并根据是否获得太大的簇(减少 epsilon)或太多的噪声(增加 epsilon)来调整 epsilon。聚类需要迭代。
这篇论文读起来很有趣,因为它显示了如果不查看数据可能会出现什么问题。人们过于痴迷于绩效指标,而忘记查看实际数据。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)