剪影分数怎么可能是负数？

2024-02-18

如果我们有一些数据点：

例如，我们使用 k-means 进行分段；所得到的线段是否不是每个点都最接近其各自簇的质心？如果是这样，当 Silhouette Score 比较 ai（到簇内点的平均距离）和 bi（到簇外点的平均距离）时，怎么会出现分数为负，或者 bi 小于 ai 的情况？

我可以看到，对于不同的分类算法，一些更复杂的分类算法可能会以不同的方式聚类，或者某些点分配不正确。但是 k 均值是如何发生这种情况的呢？

点 i 到簇中点的平均距离为not与其到该星团质心的距离相同。 Silhouette Score 在计算 a(i) 和 b(i) 时使用前者，而 k-means 在聚类分配时使用后者，因此可能会出现分歧。

例如，在下图中：假设蓝点已分配给一个集群，绿点已分配给另一个集群。红点将被分配到哪个簇？蓝色簇的质心位于 (0, 1)，绿色簇的质心位于 (0, -1.15)，因此红色点将分配给蓝色簇。然而，它到绿点的平均距离是 1.15，而到蓝点的平均距离是 1.414，所以它会得到负的轮廓分数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

kmeans

silhouette

剪影分数怎么可能是负数？的相关文章

通过聚类中心进行0-9数字语音识别（matlab）——基于K-means聚类

项目已免费开源 https gitee com zhengzsj automatic speech recognition ars tree master 1 技术路线 2 实现过程层次聚类和K means聚类的样本是0 9语音每个数字各
智能优化算法改进-K-means聚类种群初始化附Matlab代码

目录 0引言一 K means聚类原理二 K Means聚类算法步骤三 K Means聚类原理图编辑四 K means聚类改进智能优化算法种群初始化效果图 4 1 初始种群数据图 4 2 K means聚类结果图 4 2 1 根据
机器学习实战笔记8(kmeans)

前面的7次笔记介绍的都是分类问题本次开始介绍聚类问题分类和聚类的区别在于前者属于监督学习算法已知样本的标签后者属于无监督的学习不知道样本的标签下面我们来讲解最常用的kmeans算法 1 kmeans算法算法过程 Kmeans中
kmeans算法和kmeans++

kmeans算法及其优化改进 kmeans聚类算法算法原理 kmeans的算法原理其实很简单我用一个最简单的二维散点图来做解释如上图我们直观的看到该图可聚成两个分类我们分别用红点和蓝点表示下面我们模拟一下Kmeans是怎么对原始
机器学习（三）K-means聚类（手肘法、轮廓系数、可视化代码）

K means聚类聚类是无监督学习当中非常重要的一部分能够在没有标签的情况下将数据分类说到聚类最常用也是最重要的一个算法就是K means算法算法介绍 K means是一种非常简单快速高效的算法只需要迭代几次即可其原理用一句话
将matlab矩阵分成几个相等的部分

我有一个大小矩阵64500x17 它代表检测到的文本特征我必须用它来找到 5 个质心kmeans 我需要的是把这个矩阵分成5份12900x17矩阵找到方法将它们连接成一个5x17矩阵输入到开始参数kmeans 我几乎知道如何做所有事
KMeans 聚类后的聚类点 (scikit learn)

我已经使用 sklearn 使用 Kmeans 完成了聚类虽然它有一种打印质心的方法但我发现 scikit learn 没有一种方法来打印每个簇的簇点或者我到目前为止还没有看到它这很奇怪有没有一种巧妙的方法来获取每个簇的簇点我目
如何设置Spark Kmeans初始中心

我正在使用 Spark ML 来运行 Kmeans 我有一堆数据和三个现有中心例如这三个中心是 1 0 1 0 1 0 5 0 5 0 5 0 9 0 9 0 9 0 那么我如何表明 Kmeans 中心是上述三个向量我看到 Kmean
在 Apache Spark Python 中自定义 K-means 距离公式

现在我使用 K means 进行聚类和跟踪本教程 and API 但我想使用自定义公式来计算距离那么如何使用 PySpark 在 k means 中传递自定义距离函数呢一般来说使用不同的距离度量没有意义因为 k 均值与k 中心点
使用 scikit-learn.k-means 库输出最接近每个聚类中心的 50 个样本

我使用 python scikit learn 库在 5000 多个样本上安装了 k 均值算法我想要将最接近聚类中心的 50 个样本作为输出我该如何执行这个任务 If km是 k means 模型到j数组中每个点的第一个质心X is
我自己的 R 中的 K 均值算法

我是 R 编程的初学者我正在 R 中进行此练习作为编程入门我已经在 R 中实现了自己的 K 均值实现但在某一点上卡住了一段时间我需要达成共识算法迭代直到找到每个簇的最佳中心这是没有迭代的原始算法它只是从整个数据中随机选取一个数
使用 k 均值算法进行异常值检测

我希望你能帮助我解决我的问题我正在尝试使用 kmeans 算法来检测异常值首先我执行算法并选择那些距聚类中心距离较远的对象作为可能的异常值我不想使用绝对距离而是想使用相对距离即对象到聚类中心的绝对距离与聚类中所有对象到其聚类中心
scikit-learn k-means：预测方法的真正作用是什么？

当我使用 scikit learn 的 k means 实现时我通常只调用fit 方法这足以获得聚类中心和标签这predict 方法用于计算标签甚至fit predict 方法是为了方便起见但如果我只能使用fit 目的是什么pre
Python 中的球形 k 均值实现

我一直在使用scipy 的 k 均值 http docs scipy org doc scipy reference cluster vq html已经有一段时间了我对它在可用性和效率方面的工作方式感到非常满意然而现在我想探索不同的
SOM（自组织映射）和 K 均值有什么区别？

stackoverflow中只有一个与此相关的问题更多的是关于哪个更好我只是不太明白其中的区别我的意思是它们都使用向量这些向量被随机分配给集群它们都使用不同集群的质心来确定获胜的输出节点我的意思是差异到底在哪里在 K 均值中
对一维数据进行最佳聚类？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有人有一篇论文解释如何CKmeans 1d dp http cran r project org
剪影分数怎么可能是负数？

如果我们有一些数据点例如我们使用 k means 进行分段所得到的线段是否不是每个点都最接近其各自簇的质心如果是这样当 Silhouette Score 比较 ai 到簇内点的平均距离和 bi 到簇外点的平均距离时怎么会出现
最相距的 k 个元素（聚类？）

我有一个简单的机器学习问题我有 n 110 个元素以及所有成对距离的矩阵我想选择相距最远的 10 个元素也就是说我想要 Maximize Choose 10 different elements Return min distan
Sklearn.KMeans：如何避免内存或值错误？

我正在研究图像分类问题并且正在创建一个词袋模型为此我提取了所有图像的 SIFT 描述符并且必须使用 KMeans 算法来找到用作我的词袋的中心这是我拥有的数据图片数量 1584 SIFT 描述符的数量 32 个元素的向量 571
使用 scikit 包在 Python 中绘制集群区域的边界

这是我处理 3 个属性 x y 值中的数据聚类的简单示例每个样本代表其位置 x y 及其所属变量我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random

随机推荐

asp.net mvc如何将完整模型从视图传递到控制器

我在视图中有这样的表 table class sendemailtable if string IsNullOrEmpty Model CustomerName tr td style font size 26px Html Label s
当只知道三个不共线的点时，如何确定圆的半径和圆心？

我正在开发一个处理 Oracle Spatial 几何的 C 程序当圆数据存储在几何字段中时仅存储三个非共线点来表示圆问题是我需要在 Google 地图网页上使用这些数据并且需要圆的中心点和半径因为我的圆绘制函数使用该信息任何人
使用 php 按团队名称对 Json 数据进行分组

我必须在各自的团队名称下显示团队积分我有以下 json 数据 id 319231 innings id 967766 id 967767 id 967768 id 967769 team1 team name Minor Counties
如何在 Ubuntu 20.04 Linux 上安装 Python 包安装程序 PIP

尝试安装pip with Ubuntu 版本 20 04 Python版本我的 Oracle 虚拟机上的 3 8 尝试了一切安装 pip 但失败尝试过的步骤 sudo apt update sudo apt install python3
VS Code 中的 System.Windows.Forms 程序集引用

要在 Visual Studio Code 中设置我的 C 开发框架我想使用System Windows Forms参考以设置窗口 Code using System using System Collections using Syst
从 Blob URL 创建下载链接

在我正在开发的 Google Chrome 扩展中从服务器下载一个文件XMLHttpRequest 该文件包含一些二进制数据这些数据存储在ArrayBuffer目的为了提供下载此文件的可能性我正在使用createObjectURL
在没有焦点的情况下滚动 RichEdit

添加一行后我需要将 RichEdit 滚动到最后我有一个单独的形式的 RichEdit 我根本不想获得焦点我尝试了经常建议的解决方案 RichEdit Lines Add someText RichEdit SelStart Rich
类型错误：webpack.optimize.UglifyJsPlugin 不是构造函数

我正在经历一个TypeError我不确定如何解决它我期待您能提供的任何帮助以下是终端输出yarn run build BUILD DIR Users blakelucey Desktop fsd next build SRC DIR U
我应该避免在数据集/数据帧中使用 groupby() 吗？ [复制]

这个问题在这里已经有答案了我知道在 RDD 中我们不鼓励使用 groupByKey 并鼓励使用替代方案例如 reduceByKey 和aggregateByKey 因为这些其他方法将首先在每个分区上减少然后执行 groupByKey
python pandas-可以使用where(max())比较相同形状的3个dfs？这是一个掩蔽问题吗？

我有一个包含 3 个形状相同的数据帧的字典我想创建第 4 个数据帧用于标识每个坐标处原始 3 个数据帧的最大值因此 dic four ix 0 A MAX dic one ix 0 A dic 二 ix 0 A dic 三 ix 0
NHibernate hql 元组结果

hql select f b from Foo f Bar b var resultList session CreateQuery hql List
我可以使用 Xamarin 中的控件模板之类的东西来包围新对象吗？

我的应用程序具有以下包围的对象
applicationcontext.xml 和 .hbm 文件放在哪里？

我正在学习 spring hibernate zk stack 并做我的第一个 crud 以下内容本教程 http books zkoss org wiki Small Talks 2011 December Integrate ZK5 w
jquery判断浏览器是否为IE

如何检查用户浏览器是否是IE 我这里有这段代码但它不起作用 if browser msie browser version lt 9 alert You Are Using An Outdated Browser Switch To Ch
AutoHotKey - 如何多次发送控件和相同的键

具体来说我想按住control键然后按m键松开m但保持按住control键然后再次按m 这将触发该功能更一般地说我想知道告诉 autohotkey 多次读取同一键的语法我怎么做我可以像这样用一个 m 做到这一点 m Send
将真彩色 RGB 图像转换为索引颜色

我想使用索引调色板将 24 位 RGB 图像每个通道 8 位转换为 8 位我最初的想法是创建一个数组并简单地计算每种颜色在图像中出现的次数但我认为如果有大面积的颜色略有变化而占用了所有调色板空间那将是浪费较小但可能更重要的颜色组
有没有办法阻止此代码每次打开一个新的浏览器窗口？

Process Start url 每次执行此代码时我都会在浏览器中看到一个新选项卡显示 url 的内容有没有办法防止新选项卡行为并每次在同一个选项卡窗口中打开出于安全原因我不想使用 WebBrowser 控件我正在构建一
WPF：加载时动画用户控件

我正在开发一个应用程序其中窗口内有一个用户控件我想在该控件附加到窗口时对该控件的大小执行一些增长动画谁能帮我吗在你的造型中
iOS 在从外设传入 BLE 连接时停止唤醒应用程序

我们有一个 BLE 外设每小时连接到手机并传递一些数据该过程的工作原理如下使用密钥启动后UIApplicationLaunchOptionsBluetoothCentralsKey in application didFinishLa
剪影分数怎么可能是负数？

如果我们有一些数据点例如我们使用 k means 进行分段所得到的线段是否不是每个点都最接近其各自簇的质心如果是这样当 Silhouette Score 比较 ai 到簇内点的平均距离和 bi 到簇外点的平均距离时怎么会出现

剪影分数怎么可能是负数？

剪影分数怎么可能是负数？ 的相关文章

随机推荐

热门标签

剪影分数怎么可能是负数？的相关文章