K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点

2023-12-05

我一直在研究和学习基于分区的聚类算法，例如 K-means 和 K-Medoids。我了解到，与 K 均值相比，K 中心点对异常值的鲁棒性更强。然而，我很好奇如果在分配数据点期间，两个或多个簇代表在数据点上具有相同的距离，会发生什么。您将把数据点分配给哪个簇？将数据点分配到聚类中是否会对聚类结果产生很大影响？

为了防止发生不好的事情（无限循环等），总是更喜欢绑定时已经分配给点的簇。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

Distance

datamining

kmeans

K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点的相关文章

shell脚本中关联数组的时间复杂度

我想知道在 shell 脚本中使用关联数组时如何构造实现另外我想知道基于 shell 脚本的关联数组的时间复杂度是否是最佳的因为我们可以使用字母和数字作为它们各自的键编辑他们使用什么哈希函数如果您使用关联数组则不能通过使用
给定一个具有多个重复条目的数组，找到一个重复条目 O(N) 时间和常数空间

我们得到了一个大小为 N 的数组其中包含 0 到 N 2 范围内的整数包括 0 和 N 2 该数组可以有多个重复的条目我们需要在 O N 时间和常量空间中找到重复条目之一我正在考虑取数组中所有条目的乘积和总和以及 0 到 N 2
如何用约束标记一大组“传递群”？

在 NealB解决方案之后进行编辑与以下解决方案相比 NealB的解决方案非常非常快任何另一个 https stackoverflow com q 18033115 answers and 提出了关于添加约束以提高性能的新问题 Nea
照片马赛克算法。如何在给定基本图像和瓷砖列表的情况下创建马赛克照片？

Hy 我要做的是创建一个程序使用 C 或 C 它将 24 位像素位图和图像集合作为输入我必须创建一个马赛克图像类似于使用库的输入图像给定的图像创建与输入类似的马赛克照片到目前为止我可以访问输入的图像像素及其颜色但我有点卡住了
数学/算法使图像适合屏幕保留纵横比

我需要数学算法方面的帮助来拍摄已知尺寸的图像并适合两个屏幕尺寸之一 720 x 480 或 1280 x 1024 图像尺寸来自 XML 文件但这些尺寸是 Web 尺寸我还从 XML 中选择了一些图像这些图像的分辨率可能比 Web
O(1) 算法确定节点是否是多路树中另一个节点的后代？

想象一下下面的树 A B C D E F 我正在寻找一种方法来查询 F 是否是 A 的后代注意 F 不需要是directA 的后代在这种特殊情况下这是正确的只需要针对更大的潜在后代节点池测试有限数量的潜在父节点当测试一个节点是否是潜
从 1 到 20 亿，像 (23,29) 这样相差 6 的连续素数对的数量

如何在考虑时间复杂度的情况下从 1 到 20 亿使用任何编程语言且不使用任何外部库找到像 23 29 这样相差 6 的连续素数对的数量尝试过埃拉托色尼筛但获得连续素数是一个挑战使用了生成器但时间复杂度非常高代码是 def ge
生产代码中的 LRU 实现

我有一些 C 代码需要使用 LRU 技术实现缓存替换目前我知道两种实现LRU缓存替换的方法每次访问缓存数据时使用时间戳最后比较替换时的时间戳使用缓存项的堆栈如果最近访问过它们则将它们移动到顶部因此最后底部将包含 LRU 候选
如何优化分割重叠范围？

我编写的这个 Python 脚本用于将重叠范围拆分为唯一范围最后一次迭代 https codereview stackexchange com questions 285932 python script to split overlap
如何使用 python 有效地找到两个大文件的交集？

我有两个大文件它们的内容如下所示 134430513125296589151963957125296589 该文件包含未排序的 id 列表某些 id 可能会在单个文件中出现多次现在我想找到路口两个文件的一部分这就是两个文件中都出现的
找到一个数是素数，为什么检查到n/2更好。避免n后半部分的数字的原因是什么

要检查一个数是否是素数最简单的方法是尝试将这个数除以 2 到 n 如果任何操作得到余数为 0 那么我们就说给定的数不是素数但最好只进行划分和检查直到 n 2 我知道更好的方法是直到 sqrt n 我想知道跳过后半部分的原因假设我们是否
欧拉项目 45

我还不是一名熟练的程序员但我认为这是一个有趣的问题我想我应该尝试一下三角形五边形六边形数字由以下生成公式三角形 T n n n 1 2 1 3 6 10 15 五边形 P n n 3n 1 2 1 5 12 22 35 六角
如何从 Trie 中检索给定长度的随机单词

我有一个简单的 Trie 用来存储大约 80k 长度为 2 15 的单词它非常适合检查字符串是否是单词但是现在我需要一种获取给定长度的随机单词的方法换句话说我需要 getRandomWord 5 来返回 5 个字母的单词所有 5
在矩阵/位图中查找质量簇

这是此处发布的问题的延续在 2D 位图上查找质心 https stackoverflow com questions 408358 finding the center of mass on a 2d bitmap正如给出的例子它讨论了
如何在 Unity 中对齐“轨道”或模块化对象？

我正在开发一个简单的游戏用户可以在其中放置不同但模块化的对象例如轨道道路等我的问题是当将一个物体靠近另一个物体时如何匹配和放置不同的物体我的第一种方法是为每个模块对象创建一个隐藏的子对象一个盒子并将其放在可以放置其他对象
滚动或滑动窗口迭代器？

我需要一个可在序列迭代器生成器上迭代的滚动窗口又名滑动窗口默认的 Python 迭代可以被视为一种特殊情况其中窗口长度为 1 我当前正在使用以下代码我怎样才能更优雅和或更有效地做到这一点 def rolling window
通过排列四个给定数字找到最大可能时间 HH:MM

我最近为了工作晋升而参加了编码测试这是我真正遇到的任务之一我想知道什么是最好的方法来做到这一点我使用了大量的 if 和 if else 这不是最干净的解决方案但完成了工作我被问到的问题是将 4 个数字格式化为 24 小时时间 0
2D形状识别与解析算法

我正在寻找一种算法用于从给定的一组 x y 点检测简单形状如矩形三角形正方形和圆形我还在寻找一种方法一旦检测到将路径转换为更干净的形状我已经查遍了互联网但没有找到任何简单的方法几乎所有这些对于我的简单实现来说都是高级
如何检测图像是否像素化

之前有人在 SO 上提出过这样的问题在Python中检测像素化图像 https stackoverflow com questions 12942365 detecting a pixelated image in python还有关于q
机器人探索算法

我正在尝试为机器人设计一种算法试图找到位于未知位置的旗帜该旗帜位于一个包含障碍物的世界中机器人的任务是夺取旗帜并将其带到他的基地代表他的起始位置机器人在每一步只能看到有限的邻域他事先不知道世界是什么样子但他有无限的内存来存储已

随机推荐

如何创建以当前时间命名的文件？

我想在 log 目录下创建一系列文件每个文件根据执行时间命名在每个文件中我想为我的程序存储一些日志信息例如起作用的函数原型等通常我使用 fopen log a 的硬方法这不是为了这个目的我只是写了一个时间戳函数 char ti
无法将文件 .mdf 作为数据库附加

我是 MVC 技术的新手正在阅读培训材料并遇到了以下实体框架错误消息在这里我尝试从 SQL Server Compact 数据库获取一条记录但出现错误EmployeeController步骤中的类 Employee employe
Java 8 使用Optional 避免空指针检查

是否可以编写这样的内容并避免检查元素是否不为空并且集合是否不为空 response getBody getRequestInformation getRequestParameters get 0 getProductInstances g
计算数据框列中的单词数

我有一个数据框第一列中有句子我想计算其中的单词数 Input Foo bar bar example lalala foo example sentence foo Output foo 3 bar 2 example 2 lalala
使用 Thread.sleep 让 UI 线程等待

我用 C 为 WP7 编写了这段代码 public void btn handler object sender EventArgs args Button btn Pressed Button sender ImageBrush br n
SQLite 片段函数实现不会将 TextView 中的文本格式化为 HTML

我正在使用 SQLite 全文搜索实现搜索功能我想像 Google 搜索一样用粗体查询文本显示结果我已经实现了类似下面的代码但它显示没有任何 HTML 格式的纯文本虽然将视图绑定到光标适配器并设置文本格式TextView 我无法弄清楚
简化重复的 LESS

我正在为 WordPress 网络创建一个主题系统该系统支持多种布局主题可以支持各种大学的配色方案为此我定期编译一个带有学校特定变量的 LESS 文件使用 lessphp 并实质上将其用作主题中的辅助类库每所学校都有 3 种颜色
Facebook iOS SDK Poke

是否可以使用 iOS 版 Facebook SDK 来戳 Facebook 好友我尝试过在线 API 浏览器并筛选文档但找不到公共 API 有谁知道我可以通过 iOS 应用程序发出 Graph API 请求来戳 Facebook 好友
基于用户的字符串模板

我有一个用户选择的字符串模板我需要采用该模板并填写所需的信息 string templateString author title year 我可以执行 Contains 和 Replace 但是模板可能有大量输入或少量输入例如 str
让elasticsearch只返回某些字段？

我正在使用 elasticsearch 来索引我的文档是否可以指示它只返回特定字段而不是它存储的整个 json 文档是的使用更好的选择源过滤器如果您使用 JSON 进行搜索它将如下所示 source user message qu
发送：spawn id exp7 未打开

当我尝试执行 autoexpect 文件时出现错误send spawn id exp7 not open这是我的文件sh exp usr bin expect mysql credentials and connection data db
Apache2 - 使用基本身份验证针对某个位置授权用户，但仅适用于本地子网之外的用户

在我的 Apache 2 配置中我有一个VirtualHost看起来像这样
错误：操作必须是普通对象。在 redux 中使用自定义中间件进行异步操作

下面是我的动作创建者的代码 export function fetchPosts const request axios get ROOT URL posts API KEY return type FETCH POSTS payload
根据日期过滤 Spark 数据框

我有一个数据框 date string string 我想选择某个时间段之前的日期我尝试了以下方法但没有成功 data filter data date lt new java sql Date format parse 2015 03
我发现一些显示/隐藏桌面图标的代码，但它在过程中移动了图标。如何编辑代码以不移动图标？

我正在为 Rainmeter 使用两个批处理文件一个用于隐藏所有图标然后启动 Rainmeter 另一个用于显示所有图标并退出 Rainmeter 以使我的桌面再次看起来正常我的最终目标是将这两个批处理文件制作成任务栏上的按钮我可以
在 ios UIKeyboard 上启用向上键和向下键 [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我们正在尝试创建一个 uikeyboard 它将收集用
前置视觉块在 vim 中不起作用

I m really fond of this idea of using Ctrl V Ctrl Q in windows to modify a visual block The technique is explained here
如何在格式化字符串上使用 strlen()？

我想为以下内容编写一个包装函数mvwprint mvwchgat ncurses在指定窗口中打印消息然后更改其属性的函数然而 mvwchgat需要知道它应该改变多少个字符我不知道如何告诉mvwchgat格式化字符串有多长因为strle
Visual Studio 2019 C++ 项目中的特殊字符并用它们执行 CMD 命令

首先我只想在控制台中使用波罗的海字符并用它们执行 CMD 命令但问题是从默认标准控制台 C 应用程序开始的 include
K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点

我一直在研究和学习基于分区的聚类算法例如 K means 和 K Medoids 我了解到与 K 均值相比 K 中心点对异常值的鲁棒性更强然而我很好奇如果在分配数据点期间两个或多个簇代表在数据点上具有相同的距离会发生什么您将把

K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点

K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点 的相关文章

随机推荐

热门标签

K-Medoids / K-Means 算法。两个或多个簇代表之间距离相等的数据点的相关文章