有效地将相似的数字分组在一起[重复]

2024-05-02

可能的重复：
一维数数组聚类 https://stackoverflow.com/questions/11513484/1d-number-array-clustering

我有一个数字数组，例如[1, 20, 300, 45, 5, 60, 10, 270, 3]。根据邻近度将这些数字分组在一起的有效算法是什么？在这种情况下，我期望类似的东西[1, 3, 5], [20, 45, 60] and [270, 300].

您所问的最难的部分是如何实际定义接近度。您期望的输出是什么[5,10,15,20]？分组是否与[500,1000,1500,2000]?

关于什么[1,2,3,5,7,8,9]？应该是一组还是三组？（或两个？）。
关于什么[1,2,3,5,7,8,9,1075,4000]？ 1075 和 4000 会组合在一起吗？样本中较大数字是否会改变较小数字的分组？

这个问题是整个机器学习领域提出的问题：聚类分析 http://en.wikipedia.org/wiki/Cluster_analysis或许这个相关问题 https://stackoverflow.com/questions/6147466/what-clustering-algorithm-to-use-on-1-d-data有帮助吗？

我想你想要的是K-均值聚类 http://en.wikipedia.org/wiki/K-means_clustering（在相关问题中有用链接），但您需要知道要将数据分成多少组才能使用它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

有效地将相似的数字分组在一起[重复] 的相关文章

Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
无需构建树即可预测霍夫曼压缩比

我有一个二进制文件我知道其中每个符号出现的次数如果我要使用霍夫曼算法压缩它我需要预测压缩文件的长度我只对假设的输出长度感兴趣而不对单个符号的代码感兴趣因此构建霍夫曼树似乎是多余的作为一个例子我需要得到类似的东西包含 4 个
数组中连续元素的最大乘积

我在现场面试的时候被问到了这个算法问题由于没有要求我签署保密协议我将其发布在这里寻求答案给定一个数组REAL不包含 0 的数字找到产生最大乘积的连续元素该算法应在线性时间内运行我考虑过以下方法使用两个数组第一个是利用DP思想
0-1背包算法

以下 0 1 背包问题是否可解浮动正值和浮动权重可以是正数或负数背包的浮动容量 gt 0 我平均有这是一个相对简单的二进制程序我建议用蛮力进行修剪如果任何时候你超过了允许的重量你不需要尝试其他物品的组合你可以丢弃整
以任意顺序匹配可选捕获组

在解析用户输入的许多情况下用户有机会向输入添加几个可选标志这些标志应该以任何顺序接受如何使用正则表达式对其进行解析以便每个标志都位于它自己的捕获组中如果存在例如有一个必需的令牌a 然后是 3 个可选标记可以按任何顺序出现b
7 张牌扑克手牌评估器

有谁知道评估 7 张牌扑克牌的快速算法吗这比简单地暴力检查 7 张牌中每 21 个 5 张牌的组合更有效 Cheers Pete 我写了一篇JavaScript 核心评估方法仅使用位操作因此速度非常快考虑到这一点查看 21 种组合还
快速约会算法

我在一家咨询公司工作大部分时间都在客户所在地正因为如此我很少见到同事为了更好地了解彼此我们将安排一个晚宴会有很多小桌子方便人们聊天为了在聚会期间与尽可能多的不同的人交谈每个人都必须每隔一段时间比如每小时换一张桌子如何
这个按位运算如何检查 2 的幂？

我正在看一些应该很简单的代码但我的数学在这里严重失败下面是一个使用以下条件检查数字是否为 2 的幂的条件 if num 1 num num 1 make num pow of 2 我的问题是如何在 num 和 num 1 之间使用按位
在常数空间中创建 1..N 的随机排列

我正在寻找枚举固定空间中数字 1 N 的随机排列这意味着我无法将所有数字存储在列表中原因是 N 可能非常大超过可用内存我仍然希望能够一次遍历这样一个数字的排列只访问每个数字一次我知道对于某些 N 可以这样做许多随机数生成器随机
使用并集查找（又名不相交集）检测图是否是二分图

我正在 Spoj 上做一个问题基本上可以简化为检测图是否是二分图我正在尝试使用 dfs 为图表着色但它太慢了有人评论这个没有 bfs 没有 dfs 没有二部图简单的并查集就可以做到确实速度很快提示 1 偶数长度的环不会影响两
计算两点之间的最短路线

过去几周我一直在开发一款多人 HTML5 游戏使用nodejs and websockets 我已经被这个问题困扰了一段时间想象一下我用数组实现了这个平铺地图如下所示 1 or 棕色瓷砖路上有障碍物玩家无法通过 0 or 绿色瓷
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
验证假名输入

我正在开发一个允许用户输入日语字符的应用程序我试图想出一种方法来确定用户的输入是否是日语假名平假名片假名或汉字应用程序中的某些字段不适合输入拉丁文文本我需要一种方法将某些字段限制为仅限汉字或仅限片假名等该项目使用UTF 8编码
如何重现 Ridge(normalize=True) 的行为？

这段代码 from sklearn pipeline import make pipeline from sklearn preprocessing import StandardScaler from sklearn linear mod
归并排序中递归树的高度log(n)+1是怎么来的

我按照 stackoveflow 的建议阅读了一些问题和答案我正在遵循 cormen 的算法简介一书进行自学那本书里已经解释得很清楚了但唯一没有解释的是如何在合并排序分析中计算树的高度如果在后面的章节中对此进行解释的话我仍然在
负整数的基数排序

我正在尝试对整数包括负整数实现基数排序对于非负整数我计划为数字0 9创建一个10个队列的队列并实现LSD算法但我对负整数有点困惑我现在的想法是继续为它们创建另一个包含 10 个队列的队列并分别对它们进行排序然后在最后我将
从一种数字系统转换为另一种数字系统后会有多少位数字

主要问题有多少位数字让我解释我有一个二进制数 11000000 十进制数是192 转换为十进制后它有多少位以十进制表示在我的示例中它是 3 位数字但是这不是问题我在互联网上搜索并找到了一种用于整数部分的算法和一种用于小数
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
二维滑动窗口最小值/最大值

假设我们得到一个大小为 NxN 的像素整数矩阵和一个整数 k 窗口大小我们需要使用滑动窗口找到矩阵中的所有局部最大值或最小值这意味着如果某个像素与其周围窗口中的所有像素相比具有最小最大值则应将其标记为最小最大有一种著名的滑
使用按位运算符相乘

我想知道如何使用按位运算符将一系列二进制位相乘但是我有兴趣这样做来查找二进制值的十进制小数值这是我正在尝试做的一个例子假设 1010010 我想使用每个单独的位以便将其计算为 1 2 1 0 2 2 1 2 3 0 2 4 虽然我

随机推荐

如何使用 VBA 或 Powershell 将列表从具有 NTLM 身份验证的 Sharepoint 服务器导出到 Excel

我的雇主要求我找到一种从使用 NTLM 身份验证的 SharePoint 2013 Server 自动下载更新 SharePoint 列表的方法执行此操作的可能方法是 VBA 或 Powershell 我想要提取的列表属于我公司的业务合
通过NPM安装bulma后，如何在我的项目中引用它

我通过以下方式在我的项目中引入了布尔玛 npm install bulma 之后我如何在我的页面中引用它我真的不知道如何使用 npm 所以请你指导我我是否必须在我的js中引用它 import bulma from bulma 或者需要
import { Observable } from 'rxjs/Observable' 和 import { Observable } from 'rxjs' 之间有什么区别吗？

在 Angular 2 中使用 rxjs 时有什么区别吗import Observable from rxjs Observable 和import Observable from rxjs 是的有一个细微的差别那就是捆绑包的大小如
如何在 Linux 内核空间使用 ioctl()？

可以打电话吗ioctl来自 Linux 内核模块谁能提供一个如何使用它的例子吗您可以尝试拨打电话sys ioctl 如果内核是用以下命令编译的则它会被导出CONFIG COMPAT 或者如果您有设备驱动程序struct file o
void 运算符()() 的功能

我对它的功能感到困惑void operator 你能告诉我一下吗例如 class background task public void operator const do something do something else back
有没有办法以数组的形式访问结构体字段？

我是 Rust 新手正在尝试弄清楚这是否可行因此有时函数方法以数组形式访问数据会更干净有时按名称访问数据会更干净在 Rust 中我可以定义这样的东西 struct Vector3D x f64 y f64 z f64 coord
R Notebook 预览中的奇怪字符

当我预览 R Notebook 时 HTML 输出包含奇怪的字符该块代码和输出在 HTML 中呈现为我应该如何解决这个问题会话信息 R版本3 6 0 2019 04 26 平台 x86 64 w64 mingw32 x64 64位
如何将 URL 输入参数值传递到 Blazor 页面？

这会将值传递给 blazor 组件 Parameter public string Id get set 但是如果从 URL 输入参数传递一个值呢在组件内定义并用 Parameter 属性注释的公共属性用于存储从其父组件传递到子组件的 C
避免 ItemsControl 中的 ContentPresenter

有没有办法避免产生ContentPresenter that ItemsControl将我的物品包裹起来我的ItemsControl绑定到 VM 属性我正在使用DataTemplate在我的 ItemControl 的资源中没有x K
折叠和展开选项卡 jquery / 简单的手风琴

我对手风琴选项卡有疑问我用过手风琴菜单插件下面的代码我用于页面中的选项卡 accordions accordion title about Content 1 accordion accordion title Home Content
vb.net 从数组中删除第一个元素

一种答案是创建一个短一个元素的新数组还有其他更简单的方法可以做到这一点吗您可以使用 LINQ 以非常简洁的代码生成结果 Dim a2 a Skip 1 ToArray 批评者可能会说这很慢您应该使用Array Copy反而 Dim a
在 Android 中使用 appium 在一个会话中自动化多个应用程序

如何在 Android 中使用 appium 在一个会话中自动化多个应用程序假设想要自动化一个计算器应用程序然后是一个设置应用程序如果您正在谈论使用同一会话同时自动化多个应用程序那么这是不可能的因为一个会话只能自动化一个应用程序
Android 上的 Espresso 2，在无法启动正在测试的活动后，中间测试失败，而之前测试的活动仍然存在

我正在使用 Espresso 2 来测试我的 Android 应用程序中间我看到测试随机失败并显示以下 Espresso 失败消息失败 testLongPressXXXXX com company xxx tests testSuit
无法从此设备复制符号使用 iOS 9.2.1 Xcode 是 7.2

无法调整 private var folders 5 jhpy2pns35n0kljwt0l08q 40000gn T TemporaryItems Xcode 3 保存的文档 dyld shared cache armv7s 的大小设备
Android如何将listview放入视图寻呼机片段中

I have implemented a swipey tabs app using viewpager by using this template in Eclipse 现在我得到一个像这样扩展 FragmentActivity 的活动
jQuery 1.9.1 无法获取未定义或空引用的属性“createDocumentFragment”第 5823 行

最近我更新了我的 ASP Net MVC4 项目以升级到 jQuery 1 9 1 但从那时起只要加载任何页面我就会收到一个奇怪的错误 Chrome jquery 1 9 1 js 5823 Uncaught TypeError 无法调
使用xsl获取文件名

如何使用 xsl 1 0 获取文件名 I tried
Laravel 5.5 多重身份验证路由问题

尝试使用 Doctrine 而不是 Eloquent 让 Laravel 进行多重身份验证我已经尝试了很多事情但总是陷入困境我目前定义了两个守卫两个模型两个登录控制器等如果我启用其中之一它们就会起作用如果我同时尝试两者则似
使用 Google App Engine 的 Mako 模板

我想在 GAE 中使用 Mako 模板而不是 Django 模板我找到了这个帖子http blog pansapiens com 2008 06 24 mako templates in google app engine seems t
有效地将相似的数字分组在一起[重复]

这个问题在这里已经有答案了可能的重复一维数数组聚类 https stackoverflow com questions 11513484 1d number array clustering 我有一个数字数组例如 1 20 300 4

有效地将相似的数字分组在一起[重复]

有效地将相似的数字分组在一起[重复] 的相关文章

随机推荐

热门标签