一网打尽目前常用的聚类方法,详细介绍了每一种聚类方法的基本概念、优点、缺点!!

2023-12-19

在这里插入图片描述

1. K-均值聚类(K-Means Clustering)

基本概念 :将样本随机分配到k个中心点,计算每个样本到各个中心点的距离,将样本分配到距离最近的中心点形成一个新的簇,重新计算每个簇的中心点,重复此过程直至中心点位置不再改变。

优点 :计算简单高效;易于实现。

缺点 : 需要预设簇数k, 对异常值和属性范围敏感;无法处理非球形簇。


2. 层次聚类(Hierarchical Clustering)

基本概念:通过计算样本间的距离或相似度,采用自底向上或自顶向下的方式,逐步合并相似的样本点形成新的簇。

方法:单链聚类、完全链聚类、平均链聚类。

优点:无需预设簇数,结果以树状图清晰表达。

缺点:计算量大,对样本顺序敏感;无法修改早期错误决定。

3. DBSCAN聚类(DBSCAN Clustering)

基本概念 :根据样本的局部密度来寻找高密度区域,将密度可达区域聚集为一个簇,低密度视为噪声。

优点 :可以找到任意形状的簇, 不需要预设簇数

缺点 :选择核函数和参数对结果影响大,计算量大。

4. 谱聚类(Spectral Clustering)

基本概念 :构建相似矩阵,提取其特征向量,将样本投影到低维空间进行聚类。

优点 :可以处理非球形簇,不需要预设簇数。

缺点 :对异常点敏感,计算量大。

5. 高斯混合模型(Gaussian Mixture Model, GMM)

基本概念 :假设所有样本来自多个高斯分布,通过EM算法估计每个分布的模型参数,将样本分到概率最大的高斯分布中。

优点 :可以找到任意形状和大小的簇。

缺点 :需要预设组件数,对参数敏感。

6. DBA聚类(DBA Clustering)

基本概念 :通过构建样本间的相似矩阵,采用分块聚类算法,迭代更新每个样本的簇分配直至收敛。

优点 :效率高,可以处理大数据。

缺点 :需要预设簇数,结果依赖于初始化。


总结

除了以下聚类, K-均值聚类(K-Means Clustering),层次聚类(Hierarchical Clustering),DBSCAN聚类(DBSCAN Clustering),谱聚类(Spectral Clustering),高斯混合模型(Gaussian Mixture Model, GMM),DBA聚类(DBA Clustering) ,后期我还会补充目前最新的 不变信息聚类 Invariant Information Clustering(IIC )被提出 。IIC没有用传统聚类,而是对CNN稍作改动,用互信息最大化目标函数和双输入(two head)CNN的架构)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一网打尽目前常用的聚类方法,详细介绍了每一种聚类方法的基本概念、优点、缺点!! 的相关文章

随机推荐

  • kubernetes入门到进阶(2)

    被隔离的进程 一起来看看容器的本质 大家好 我们继续来一起学习k8s 在上一个章节里 我们初步了解了容器技术 在Linux虚拟机里安装了当前最流行的容器docker 还是用了docker ps docker run 等命令简单操作了容器 广
  • 【计算机图形学】PointNet文章的简单理解与运用,点云特征提取

    PointNet论文原文 PointNet Deep Learning on Point Sets for 3D Classification and Segmentation PointNet官方代码是使用tensorflow实现的 Po
  • 数据库学习日常案例20231218-oracle 19RAC hip远程注册服务到scan listener分析

    问题 用户一套Oracle19c RAC集群 出现一个奇怪的现象 通过SCAN IP访问的连接会话都集中在节点一实例 而且用户并没有做任何的节点服务访问去控制会话的连接节点 比如常见的通过集群的高可用服务去控制应用访问连接集中在同一节点 从
  • 渗透测试与安全测试主要区别是什么?

    在网络安全体系中 有很多专业术语 而且部分专业术语在名字上有很大的相似之处 因此很多小伙伴将它们混淆在一起 比如渗透测试和安全测试 这两个概念就经常被混淆在一起 那么什么是渗透测试和安全测试 有何区别 渗透测试是通过模拟恶意黑客的攻击方法
  • 转移mysql中的数据

    目录 1 mysqldump 2 将数据库中的数据转换为一个sql文件 3 执行sql文件 1 mysqldump 转移数据需要用到mysqldump 默认情况下mysqldump会自动被安装上 如果没有用不了 建议重新安装一下 参考 my
  • 4.docker镜像及相关命令

    目录 1 查看所有镜像 docker images 1 1 基本用法 1 2 docker images q 只显示所有镜像ID 1 3 docker images f 筛选条件 q 只显示符合条件的所有镜像ID 1 4 docker im
  • 在Springboot项目中使用Quartz执行定时任务

    所使用的jar包
  • C语言,scanf出错时,重新输入

    问题的关键在于 把stdin中剩余的字符 吃掉 才能正常地进行下次输入 scanf出错后重新输入 使用 n 清空错误的字符 include
  • 将yolo格式转化为voc格式:txt转xml(亲测有效)

    1 文件目录如下所示 对以上目录的解释 1 dataset下面的image文件夹 里面装的是数据集的原图片 2 dataset下面的label文件夹 里面装的是图片对应得yolo格式标签 3 dataset下面的Annotations文件夹
  • 集成测试:确保软件系统无缝协同的关键

    摘要 本文将详细介绍集成测试的概念 目的 方法和实践 通过深入探讨集成测试的重要性 以及如何有效地进行集成测试 帮助读者更好地理解和应用集成测试技术 提高软件系统的质量和稳定性 一 引言 随着软件开发过程的不断演进 软件系统变得越来越复杂
  • 各种免费的格式转换工具

    PDF转CAD或其它 Zamzar video converter audio converter image converter eBook converter
  • Arraylist与LinkedList有什么区别?

    Arraylist与LinkedList有什么区别 一个工作4年的程序员去某互联网公司面试 被问到了这个问题 如果大家不知道这个问题该怎么回答 可以在文章尾端扫码二维码领取我整理的50W字的大厂面试指南 问题分析 ArrayList和Lin
  • 模块测试:确保软件质量的关键步骤

    引言 在软件开发过程中 模块测试是确保软件质量的关键环节 通过模块化的设计和测试方法 可以提高开发效率 降低错误率 并最终提供稳定可靠的软件产品 本文将介绍模块测试的概念 重要性以及实施步骤 帮助读者了解如何有效地进行模块测试 一 什么是模
  • 5.docker容器及相关命令

    docker中的容器实际上就是宿主机中的一个进程 目录 1 创建并启动容器 docker run 1 1 如果没有指定的镜像的话 docker会尝试从源拉取 1 2 给容器起名字 name 1 3 交互方式启动 i 与弹出客户端 t 1 4
  • 软件测试之威胁分析:保护您的应用程序免受潜在风险的侵害

    引言 在当今数字化时代 软件已经成为我们日常生活和工作中不可或缺的一部分 然而 随着软件的复杂性和规模不断增加 软件测试的重要性也日益凸显 本文将重点介绍软件测试中的威胁分析 帮助您了解并应对潜在的风险 确保您的应用程序的安全性和稳定性 一
  • MCU平台下确定栈空间大小的方法

    本文介绍MCU平台下确定栈空间大小的方法 通常使用IDE开发MCU程序在生成Image文件时 Image文件被划分为代码区 数据区 BSS区 堆区 栈区 其中 代码区 数据区 BSS区空间大小由编译器最终决定 对于MCU 堆区一般设置为0
  • leetcode 560. 和为 K 的子数组(优质解法)

    代码 class Solution public int subarraySum int nums int k int length nums length key 表示前缀和 value 表示个数 HashMap
  • AI创艺术之美:摄影绘画的未来已来

    前言 AI 与摄影绘画 在这个数字化时代的浪潮中 人工智能技术以其惊人的创造力和创新性席卷全球 从智能助手到自动驾驶 从自然语言处理到机器学习 AI正日益成为我们日常生活和各个领域不可或缺的一部分 摄影和绘画领域也不例外 AI技术为我们提供
  • 股指期权开通要什么条件?

    股指期权是一种金融衍生工具 它赋予持有者在未来某一特定日期按照约定的价格买入或卖出标的资产的权利 对于投资者来说 开通股指期权账户需要满足一定的条件 那么股指期权开通要什么条件 本文来自 财顺期权 开通股指期权账户需要的条件是 申请前20个
  • 一网打尽目前常用的聚类方法,详细介绍了每一种聚类方法的基本概念、优点、缺点!!

    目前常用的聚类方法 1 K 均值聚类 K Means Clustering 2 层次聚类 Hierarchical Clustering 3 DBSCAN聚类 DBSCAN Clustering 4 谱聚类 Spectral Cluster