Kmeans原理公式图文详解

2023-11-06

在网上查看了些博客，感觉大家都对数学公式的解释的比较晦涩，下面我结合一个非常简单的示意图解释下他的数学公式，理解不到位的请留言。

kmeans是一种聚类算法下面是算法的描述

给定训练样本是每一个

这里写图片描述，即每一个样本元素都是n维向量。为了便于理解在后面的示意图中采用二维的向量。

step1：
随机选取k个聚类质心点为这里写图片描述

step2：
重复下面过程直到手链

对于每一个样本i计算其应该属于的类这里写图片描述

对于每一个类这里写图片描述，重新计算该类的质心

以下是转自http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html的解释

其中，K是给定的聚类数，这里写图片描述代表样例i与k个类中距离最近的那个类，的值是1到k中的一个。质心代表我们对属于同一个类的样本中心点的猜测，拿星团模型来解释就是要将所有的星星聚成k个星团，首先随机选取k个宇宙中的点（或者k个星星）作为k个星团的质心，然后第一步对于每一个星星计算其到k个质心中每一个的距离，然后选取距离最近的那个星团作为这里写图片描述，这样经过第一步每一个星星都有了所属的星团；第二步对于每一个星团，重新计算它的质心（对里面所有的星星坐标求平均）。重复迭代第一步和第二步直到质心不变或者变化很小。

相信到这里很多人看的一头雾水，这里我接着博主的描述再进一步解释。

第一个公式中的arg是标记符号，即表明哪个样本参数属于哪个类用的，后面的紧跟着的min最小化j是我们接下来要说的J这个函数。如下：这里写图片描述
这是kmeans算法中定性描述，公式里面的符号还是上面所说的符号。，表示第1个样本所属的类别，表示数据点x(i)被归类到的时候为 1 ，否则为 0 。

下面通过图文来解释这个公式，一直按照流程聚类一个样本相信大家就能很好地理解这个公式表达的意思了

这里写图片描述

用kmeans算法将三个样本聚类成2类，图中的红点为样本点，蓝点为随即初始的两类的样本点的质心，黑色连线代表每个样本点到某一类质心的距离。J函数最小的意思就是选取这些黑色的距离线使其长度和最小，并且从红点出发的线只能选取一次，即如图中的1.9这条线和2这条线由于都是从同一个红点出发所以只能选取一个进行相加，选取的总线数就是红点的个数，下面两张图分别是多种组合选择的二种选取结果

这里写图片描述

其中绿线为选取的线，他们的和为1.9+2+2.3=6.2

这里写图片描述

其中绿线为选取的线，他们的和为1.9+1.2+1=4.1

对比上面两张图可以看出，后者的和小，即J值小。这里第二种选取方案也是全局最优选取方案，即所有选取方案中最小的一个。此时，可以把三个点分成两类，如下图
这里写图片描述
分成2类后再重新计算每类的质心，以及质心到各个样本点的距离，如下图。需要注意的是由于黄色类只有一个样本点，即该类的质点就是该样本点，故其中一个“0”表示质点到该样本点的距离为零。

仍然按照，找每个红点到蓝点的一条线的和最小的组合方式，注意每个红点到蓝点的多个距离值只容许一条计算，下图是错误的，其中一个红有两条线参加了计算，1和0.8这两条线只能有一天参与求和。
这里写图片描述
此时，样本被分成新的两类，如下图

再求新分的两类的质心

重复以上操作，直到质心不变，即J函数值最小，结束算法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kmeans原理公式图文详解的相关文章

【具有延迟反馈的滤波器，其具有负群延迟】对于混沌系统，在可预测性高的阶段，该滤波器具有预测能力(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【状态估计】【卡尔曼-加权最小二乘(KEWLS)和KEWLS-KF(KKF)】采用低维线性卡尔曼滤波器将单个传感器测量外推/预测到单个估计瞬间，用于WLS多点定位方法的新方法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
矩阵基本操作3

题目描述问题描述定义一个N M N M lt 100 的矩阵将一个该矩阵的行和列的元素互换存到另一个二维数组中输入格式一行两个整数 N M 中间用空格隔开表示矩阵有N行 M列接下来共N行M列表示矩阵输出格式输出转置以后的
LeetCode解法汇总82. 删除排序链表中的重复元素 II

目录链接力扣编程题解法汇总分享记录 CSDN博客 GitHub同步刷题项目 https github com September26 java algorithms 原题链接力扣 LeetCode 描述给定一个已排序的链表的头
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
用栈实现队列（OJ中报错的处理）

用栈实现队列 ERROR AddressSanitizer myQueueFree函数中栈的释放处现了问题没有调用StackDestory而是直接free了这个是栈初始化时 capacity与malloc申请的空间大小没有匹配请你仅使
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与
5_机械臂运动学基础_矩阵

上次说的向量空间是为矩阵服务的 1 学科回顾从科技实践中来的数学问题无非分为两类一类是线性问题一类是非线性问题线性问题是研究最久理论最完善的而非线性问题则可以在一定基础上转化为线性问题求解线性变换数域 F 上线性空间V中的变
OpenCV K 均值 (kmeans2)

我正在使用 Opencv 的 K means 实现来对一大组 8 维向量进行聚类它们聚类得很好但我找不到任何方法来查看聚类过程创建的原型这可能吗 OpenCV 似乎只提供对集群索引或标签的访问如果没有我想是时候自己实现了我不
对一维数据进行最佳聚类？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有人有一篇论文解释如何CKmeans 1d dp http cran r project org
剪影分数怎么可能是负数？

如果我们有一些数据点例如我们使用 k means 进行分段所得到的线段是否不是每个点都最接近其各自簇的质心如果是这样当 Silhouette Score 比较 ai 到簇内点的平均距离和 bi 到簇外点的平均距离时怎么会出现
使轮廓图对于 k 均值清晰易读

我正在尝试为 k 均值聚类制作轮廓图但条形几乎看不见我怎样才能使这个图表清晰易读示例代码 require cluster X lt EuStockMarkets kmm lt kmeans X 8 D lt daisy X plot

随机推荐

怎样更改Jupyter NoteBook默认的工作空间

1 首先打开命令窗口输入 jupyter notebook generate config 2 根据上面得到的路径找到jupyter notebook config py这个配置文件 3 用记事本打开查找directory 4 把前面
内容安全综合实践-数字水印

DCT实现数字水印功能模块 1 整体效果功能添加和提取字符水印添加和提取图片水印整体效果 2 数字水印的基本特点 1 不可见性在宿主数字媒体中嵌入一定数量的附加信息后不能引起明显的将质现象隐藏的数据不易觉察即无法人为的看见或
Java中的关键字

Abstract 表明类或者成员方法具有抽象属性 Assert 用来进行程序调试 Boolean 基本数据类型之一布尔类型 Break 提前跳出一个块 Byte 基本数据类型之一字节类型 Case 用在switch语句之中表示其中的一
蓝桥杯算法模板

模拟散列表单链表 import java io import java util Scanner public class dlb private static int N 100010 private static int head p
STL之mismatch

判断两个区间的第一个不匹配点返回一个由两个迭代器组成的pair 其中第一个迭代器指向第一个区间的不匹配点第二个迭代器指向第二个区间的不匹配点如果都匹配返回的是指向两个区间的last迭代器 quality 1 采用默认operator
VUE element-ui 之button按钮之间切换时单个按钮持续聚焦状态实现（点击按钮聚焦，仅当点击其他按钮时，之前的按钮会失焦，当前按钮聚焦）

多个按钮切换时页面切换假设不做处理会出现点击按钮时聚焦离开按钮点击任何地方鼠标单击按钮会失焦我这里要求实现点击按钮聚焦仅当点击其他按钮时之前的按钮会失焦当前按钮聚焦也就是提醒用户当前处于哪个维度的页面这里自己研究的方法
apt install报错E: Unmet dependencies. Try ‘apt --fix-broken install‘ with no packages的解决方案

摘要最近在一台Ubuntu 22 04系统中部署语音识别项目不知道怎么我使用apt install安装软件时报错无论安装什么软件都是报同一个错误E Unmet dependencies Try apt fix broken inst
柯美背包服务器系统,全能升级！全面合作！经纬科技与柯美中国正式签约

经纬长期关注客户需求现针对图文行业客户核心需求加推卷材送料功能该功能已在海外市场成熟应用1年多时间可助力客户承接更多业务但又不会因订单数量起伏导致设备闲置真正实现一机多能提升效率创造价值横向打通睿思新科技锐启新合作真
.env.development（开发环境）、.env.prodction（正式环境）、自定义环境的使用

1 配置文件 env development 开发环境下的配置文件 env production 生产环境下的配置文件 2 命名属性必须以VUE APP 开头案列 env development NODE ENV development
《趣谈Linux》总结十：虚拟化

37 虚拟化 Linux越来越强大了例如内存动不动就是百G内存网络设备一个端口的带宽就能有几十G甚至上百G 存储在数据中心至少是PB级别的一个P是1024个T 一个T是1024个G 这自然有了一些不灵活的地方资源大小不灵活有时候
python初阶---基础语法篇(二)

文章目录一数据类型二列表三元组四集合五字典六序列七遍历函数map 八筛选函数filter 九累计函数reduce 一数据类型 1 逻辑型逻辑型又称布尔型取值只有两种 0和1 或者真和假 False和Tr
7.2

include
Android自定义RecyclerView实现多级树

Android自定义RecyclerView实现多级树在Android开发中 RecyclerView是一个强大灵活的控件常用于展示大量数据列表而有时候我们需要实现多级树结构的列表即每个节点下面可以包含子节点这时候就需要对Recy
shell脚本启动jar包

bin bash NAME spring admin echo NAME PID ps ef grep NAME grep java grep v grep awk print 2 echo 当前进程号为 PID echo for pid
iphone屏蔽系统更新_iphone如何实现永久屏蔽IOS系统更新？

一直以来苹果的新系统更新覆盖率是全行业最快也是最高的截止到ios13发布为止 ios12的全网覆盖率已经达到了惊人的90 iphone手机如何永久屏蔽IOS系统更新对于ios13加入的诸多功能升级以及隐藏的一些不稳定因素更多用户会选择
线性代数 - 矩阵形式下的最小二乘法

20201001 0 引言最近在看异常点检测的时候其中在PCA部分准确来说是前面一小节在进行推导的时候使用了最小二乘法其实这个东西本质上并不难但是让我比较尴尬的是很多线性代数的东西有些遗忘了好在最近直截了当的复习让大部
Python3中with用法

Python中的with语句用于用上下文管理器 context manager 定义的方法包装块的执行它允许将常见的try except finally使用模式封装起来以方便重用在Python中在处理非托管资源 unmanaged r
Idea代码上传至Git完整教程（阿里云）

项目背景本期项目是一个数据化应用系统使用的是idea开发后台前端使用微信小程序的项目项目中为了代码管理方便使用了阿里云作为代码托管直接使用idea上传下载代码本期文章介绍idea上传代码的过程与大家分享如有不行详细或错误
Python code模块

code 解释器基类 code 模块提供了在 Python 中实现 read eval print 循环的功能它包含两个类和一些快捷功能可用于构建提供交互式解释器的应用程序 class code InteractiveInterpret
Kmeans原理公式图文详解

在网上查看了些博客感觉大家都对数学公式的解释的比较晦涩下面我结合一个非常简单的示意图解释下他的数学公式理解不到位的请留言 kmeans是一种聚类算法下面是算法的描述给定训练样本是每一个即每一个样本元素都是n维向量为了便于理解在后

Kmeans原理公式图文详解

Kmeans原理公式图文详解 的相关文章

随机推荐

热门标签

Kmeans原理公式图文详解的相关文章