matlab统计与机器学习工具箱中的7种聚类算法

2023-11-01

1. matlab中自带聚类算法概述

本文简要概述了matlab统计和机器学习工具箱中可用的聚类方法,并给出了其聚类函数。在使用过程中,直接调用该函数即可,十分方便,不得不感慨matlab的强大。

聚类分析,又称分割分析或分类分析,是一种常见的无监督学习方法。无监督学习用于从无标记的输入数据中进行推理,得到数据所属的分类标签,相当于给数据“打标签”。例如,可以使用聚类分析查找未标记数据中的隐藏模式或分组。

聚类分析创建数据组或簇。属于同一个集群的对象彼此相似,属于不同集群的对象彼此不同。要量化“相似”和“不同”,可以使用应用于特定程序和数据集领域的不相似度量(或距离度量)。另外,根据自己的需求,可以考虑对数据中的变量进行缩放(或标准化),以便在聚类过程中给予它们同等的重要性。

具体的,统计和机器学习工具箱提供了这些聚类算法:

  • 分层聚类 Hierarchical Clustering
  • k-Means和k-Medoids聚类
  • 基于密度的带噪声应用空间聚类 DBSCAN
  • 高斯混合模型
  • k最近邻搜索和半径搜索
  • 谱聚类 Spectral Clustering

2. matlab自带的7种聚类算法介绍与应用

1)分层聚类 Hierarchical Clustering
分层聚类通过创建聚类树或树状图在不同的尺度上对数据进行分组。该树不是单一的集群集合,而是一个多层层次结构,其中一个级别的集群结合形成下一个级别的集群。这种多层层次结构允许您选择最适合您的应用程序的集群级别或规模。分层聚类将数据中的每个点分配到一个聚类中。

使用clusterdata函数即可对输入数据执行分层聚类。Clusterdata函数包含pdistlinkage, 和 cluster 3个函数,可以分别使用它们进行更详细的分析。此外,在分层聚类中,可以利用dendrogram函数绘制聚类树,得到聚类的可视化结果(分层聚类结果图)。关于分层聚类的具体介绍,这里就不再赘述,后续有时间可能会更新更详细的介绍。

T = clusterdata(X,cutoff)

但是我觉得这些已经足够使人了解基本内容,大家可根据自己的需要在matlab中查看与应用。也可以与我交流。

2)k-Means和k-Medoids聚类
k-means聚类和k-medoids聚类将数据划分为k个互斥的聚类。这些聚类方法要求预先指定聚类的数量k。k-means和k-medoids聚类都将数据中的每个点分配到一个群集;然而,与分层聚类不同的是,这些方法基于实际的观察结果(而不是不相似度度量),并创建单一级别的聚类。因此,对于大量数据,k-means或k-medoids聚类通常比分层聚类更适合。

idx = kmeans(X,k)

idx = kmedoids(X,k)

在matlab中,可直接使用kmeanskmedoids函数分别实现k-means聚类和k-medoids聚类。对于这2种比较简单的聚类算法,应该都比较了解,无需多言。

3)基于密度的带噪声应用空间聚类 DBSCAN

DBSCAN是一种基于密度的算法,可以识别任意形状的簇和数据中的异常值(噪声)。在聚类过程中,DBSCAN识别不属于任何聚类的点,这使得该方法对于基于密度的离群点检测非常有用。与k-means和k-medoids集群不同,DBSCAN不需要预先知道聚类的数量,这是非常重要的一点。

idx = dbscan(X,epsilon,minpts)

在matlab中,可直接使用dbscan函数对输入数据矩阵或观察结果之间的成对距离执行聚类。关于DBSCAN更详细的介绍,可以查看我之前的博客:基于密度的聚类算法(1)——DBSCAN详解

4)高斯混合模型

高斯混合模型(GMM)作为多元法向密度分量的混合物形成簇。对于给定的观测,GMM为每个成分密度(或聚类)分配后验概率。后验概率表明观察结果有一定概率属于每一个聚类。GMM可以通过选择后验概率最大的成分作为观察的指定聚类来进行硬聚类。您还可以使用GMM来执行软聚类模糊聚类,方法是根据聚类的评分或后验概率将观察值分配给多个聚类。当聚类具有不同的大小和不同的相关结构时,GMM可能是比k-means聚类更合适的方法。

GMModel = fitgmdist(X,k)
idx = cluster(GMModel,X)

在matlab中,使用fitgmdist使gmdistribution对象适合所分析的数据。还可以使用gmdistribution通过指定分布参数来创建GMM对象。当有一个合适的GMM时,可以使用cluster函数对数据进行聚类查询。

5)k最近邻搜索和半径搜索

k近邻搜索查找数据中与一个或一组查询点最近的k个点。相比之下,半径搜索查找数据中与查询点或查询点集合在指定距离内的所有点。这些方法的结果取决于您指定的距离度量。

在matlab中,可直接使用knnsearch函数查找k个最近的邻居,或者使用rangesearch函数查找输入数据指定距离内的所有邻居。还可以使用训练数据集创建搜索器对象,并将对象和查询数据集传递给对象函数(knnsearchrangesearch)。

Idx = knnsearch(X,Y)

6) 谱聚类 spectral clustering

谱聚类是一种基于图的聚类算法,用于在数据中找到k个任意形状的聚类。该技术涉及用低维表示数据。在低维中,数据中的集群分离得更广,这使得能够使用k-means或k-medoids聚类等算法。这个低维是基于拉普拉斯矩阵的特征向量。拉普拉斯矩阵是一种表示相似图的方法,它将数据点之间的局部邻域关系建模为无向图。

在matlab中,可直接使用spectralcluster函数对输入数据矩阵或相似图的相似矩阵执行谱聚类。Spectralcluster函数要求预先指定聚类的数量。此外,谱聚类算法也提供了一种估计数据中聚类数量的方法,具体的可在matlab中查看应用。

 idx = spectralcluster(X,k)

3. 7种聚类算法的总结与比较

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

matlab统计与机器学习工具箱中的7种聚类算法 的相关文章

  • 是否有一个函数可以将两个元胞数组“压缩”在一起? [复制]

    这个问题在这里已经有答案了 假设我有一个元胞数组A and B as so A A B C D B 1 2 3 4 我想创建元胞数组C通过将 A 和 B 压缩 在一起 如下所示 C zip A B C A 1 B 2 C 3 D 4 这样的
  • 如何检测图像中对象的实例?

    我有一张包含几个特定对象的图像 我想检测这些物体在该图像中的位置 为此 我有一些模型图像 其中包含我想要检测的对象 这些图像在我想要检测的对象实例周围得到了很好的裁剪 这是一个例子 在这张大图里 我想检测此模型图像中表示的对象 自从你最初发
  • 使用 varargin (...) 时如何显示不同的函数用法?

    当您输入 Matlab 函数名称并打开大括号时 例如sum 在命令窗口中 将打开一个工具提示 显示此函数的所有可能用法 当我编写自己的接受函数时varargin 工具提示仅显示一个选项 而不是varargin puts e g myfunc
  • 图像增强 - 从书写中清除给定图像

    我需要清理这张照片 删除 清理我 的字样并使其变亮 作为图像处理课程作业的一部分 我可能会使用 matlab 函数 ginput 来查找图像中的特定点 当然 在脚本中您应该对所需的坐标进行硬编码 您可以使用 conv2 fft2 ifft2
  • 在 matlab/octave 中将数据集分成两个子集 [关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 将数据集分为两个子集 例如 训练 和 测试 其中 训练集包含 80 的数据 测试集包含剩余的 20 分裂的意思是生成一个长度等于的逻辑索引
  • 将单元格转换为双精度

    gt gt C 1 2 CF 2 C 1 2 CF 2 gt gt whos C Name Size Bytes Class Attributes C 2x2 478 cell 我怎样才能转换C into double以便 gt gt C
  • 如何读取 10 位原始图像?其中包含 RGB-IR 数据

    我想知道如何从我的 10 位原始 它有 rgb ir 图像数据 数据中提取 RGB 图像 如何使用 Python 或 MATLAB 进行阅读 拍摄时的相机分辨率为 1280x720 室内照片图片下载 https drive google c
  • 使用 java 执行 Matlab 函数

    我正在编写一个应用程序 它使用 matlab 进行图像处理 然后使用 Java 接口显示结果 由于某些原因 我必须同时使用 Java 和 Matlab 如何在java中使用matlab函数 如何创建和访问界面 MATLAB控制 http m
  • 将 3d 矩阵重塑为 2d 矩阵

    我有一个 3d 矩阵 n by m by t 在 MATLAB 中表示n by m一段时间内网格中的测量值 我想要一个二维矩阵 其中空间信息消失了 只有n m随着时间的推移测量t剩下 即 n m by t 我怎样才能做到这一点 你需要命令r
  • opencv中矩阵的超快中值(与matlab一样快)

    我正在 openCV 中编写一些代码 想要找到一个非常大的矩阵数组 单通道灰度 浮点数 的中值 我尝试了几种方法 例如对数组进行排序 使用 std sort 和选择中间条目 但与 matlab 中的中值函数相比 它非常慢 准确地说 在 ma
  • 白色像素簇提取

    我正在研究指纹毛孔提取项目 并陷入毛孔 白色像素簇 提取的最后阶段 我有两个输出图像 我们可以从中获取毛孔 但不知道该怎么做 这两个图像的尺寸不同 image1 的尺寸为 240 320 image2 的尺寸为 230 310 这是我的图像
  • 傅里叶变换定理 matlab

    我目前正在尝试理解二维傅里叶位移定理 根据我到目前为止所了解到的情况 图像空间中的平移会导致相位差异 但不会导致频率空间中的幅度差异 我试图用一个小例子来演示这一点 但它只适用于行的移位 而不适用于列的移位 这是一个小演示 我只在这里显示幅
  • 为什么matlab的mldivide比dgels好这么多?

    Solve Ax b 真正的双 A是超定的 Mx2 其中 M gt gt 2 b是MX1 我运行了大量的数据mldivide 并且结果非常好 我用 MKL 写了一个 mex 例程LAPACKE dgels但它远没有那么好 结果有大量噪音 并
  • 如何加载具有可变文件名的 .mat 文件?

    select all mat files oar dir oar mat n oar name loop through files for l 1 length oar load pat oar l lt this is the mat
  • 从 imread 返回的 ndims

    我正在从文件夹中选取图像 尺寸为128 128 为此 我使用以下代码行 FileName PathName uigetfile jpg Select the Cover Image file fullfile PathName FileNa
  • 为什么 mex 文件中的 OpenMP 仅产生 1 个线程?

    我是 OpenMP 新手 我有以下代码 使用配置了 MSVS2010 的 Matlab mex 可以正常编译 计算机有 8 个可用处理器 我也使用 matlabpool 检查过 include mex h include
  • 在Matlab中选择图像上的像素时,索引指的是什么?

    当在Matlab中查看图像的单个像素时 该索引指的是什么 X Y 指的是像素的坐标 RGB 指的是颜色 但是关于索引是什么有什么想法吗 为了澄清一下 当我在 Matlab 中查看图形并使用数据光标选择一个点时 显示的三行是 X Y 指数 R
  • 如何获取MATLAB句柄对象的ID?

    当我尝试使用时出现问题MATLAB 句柄对象 http www mathworks com help techdoc ref handle html作为关键值MATLAB 容器 Map http www mathworks com help
  • 在Matlab中对字符进行分组并形成矩阵

    我有 26 个字符 A 到 Z 我将 4 个字符组合在一起 并用空格分隔以下 4 个字符 如下所示 abcd efgh ijkl mnop qrst uvwx yz 我的Matlab编码如下 str abcdefghijklmnopqrst
  • 从 MATLAB 调用 Java?

    我想要Matlab程序调用java文件 最好有一个例子 需要考虑三种情况 Java 内置库 也就是说 任何描述的here http docs oracle com javase 6 docs api 这些项目可以直接调用 例如 map ja

随机推荐