从距离矩阵开始查找 K 个最近邻

2024-04-01

我正在寻找一个接受良好优化的函数n X n距离矩阵并返回n X k矩阵的索引k第 i 行中第 i 个数据点的最近邻居。

我发现了无数的不同R可以让您执行 KNN 的软件包，但它们似乎都在同一函数中包含距离计算和排序算法。特别是，对于大多数例程来说，主要参数是原始数据矩阵，而不是距离矩阵。就我而言，我在混合变量类型上使用非标准距离，因此我需要将排序问题与距离计算分开。

这并不完全是一个令人畏惧的问题——我显然可以使用order在循环中运行函数以获得我想要的东西（请参阅下面的解决方案），但这远非最佳。例如，sort功能与partial = 1:k when k较小（小于 11）会快得多，但不幸的是仅返回排序值而不是所需的索引。

尝试使用FastKNN https://cran.r-project.org/web/packages/FastKNN/FastKNN.pdfCRAN 包（尽管没有很好的文档记录）。它提供k.nearest.neighbors可以给出任意距离矩阵的函数。下面有一个计算所需矩阵的示例。

# arbitrary data
train <- matrix(sample(c("a","b","c"),12,replace=TRUE), ncol=2) # n x 2
n = dim(train)[1]
distMatrix <- matrix(runif(n^2,0,1),ncol=n) # n x n

# matrix of neighbours
k=3
nn = matrix(0,n,k) # n x k
for (i in 1:n)
   nn[i,] = k.nearest.neighbors(i, distMatrix, k = k)

注意：您可以随时查看 Cran 软件包列表中的 Ctrl+F='knn' 相关功能：https://cran.r-project.org/web/packages/available_packages_by_name.html https://cran.r-project.org/web/packages/available_packages_by_name.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从距离矩阵开始查找 K 个最近邻的相关文章

在 for 循环中绘制的多个 ggplot2 绘图的网格

作为一个新的 ggplot2 用户我对可能性的数量感到有点迷失并且很难在网上找到我认为简单问题的简单答案我想在同一张纸上显示 ggplot2 的多个图但知道这些图来自 for 循环以下示例无法编译仅用于说明 for i in c
profvis() 何时以及为何显示“源不可用”？

我经常分析 R 代码并大量使用 profvis 对于某些函数浏览器窗口的上半部分会显示源代码有时则不会我不知道什么时候会出现这种情况对我来说这似乎是随机的有谁知道 profvis 何时以及为什么无法在顶部窗口中显示代码发生这种
R比例置信区间因子

我正在尝试总结家庭调查的数据因此我的大部分数据都是分类因子数据我想用对某些问题的回答频率图来总结它例如回答某些问题的家庭百分比的条形图误差线显示置信区间我发现了这个很棒的教程我认为它是我祈祷的答案 http www coo
解释 survreg 中的威布尔参数

我正在尝试使用从 R 中的 survreg 估计的参数生成逆威布尔分布我的意思是对于给定的概率这将是在 MS Excel 中实现的小型模拟模型中的随机数返回使用我的参数预计出现故障的时间我理解逆威布尔分布的一般形式是 X b l
通过 RSelenium 单击按钮

我正在尝试使用 Rselarium 和 Rvest 来抓取 REI 的评论吊床我想点击底部的按钮 x 次这样我就可以抓取所有评论我有点失落这是我到目前为止所拥有的如果您也知道如何在取景器中预览您正在做的事情而不是屏幕打印那就
R：使用管道将单个参数传递到函数中的多个位置

我试图专门使用管道来重写以下代码使用babynames包中的babynames数据 library babynames library dplyr myDF lt babynames gt group by year gt summari
Python 中列表的线性合并

我正在努力通过Google 的 Python 课堂练习 http code google com edu languages google python class index html 其中一个练习是这样的给定两个按升序排序的列表创建
R：在函数中包含循环？

以下代码可用于创建一个 data frame 其中 Kendall Tau 和 Spearman 相关结果彼此相邻 data mtcars mtcars correlation lt function x y df1 cor data fr
如何从列中创建对称矩阵？

例如我想转动以下列 90 175 600 650 655 660 代入矩阵 90 175 600 650 655 660 175 600 650 655 660 655 600 650 655 660 655 650 650 655 66
当子集长度为零时，如何简洁地处理子集？

从向量中排除元素x x lt c 1 4 3 2 我们可以减去位置向量 excl lt c 2 3 x excl 1 1 2 这也是动态工作的 excl lt which x which max x gt quantile x 25 1 2
使用亚毫秒日期时间从字符->POSIXct->字符准确转换

我的文件中有一个字符日期时间列我加载文件到data table 并执行需要将列转换为的操作POSIXct 然后我需要写POSIXct值返回文件但日期时间不会相同因为打印不正确这个打印格式问题是众所周知的并且已经被讨论过多次我
如何优化 R 中的 sapply 来计算数据帧上的运行总计

我在 R 中编写了一个函数来按月份计算累积总数但随着数据集变大我的方法的执行时间呈指数增长我是一名 R 程序员新手你能帮我提高效率吗该函数以及我调用该函数的方式 accumulate lt function recordnum d
如何在 R 中查找平衡面板数据（又名，如何查找面板中的哪些条目在给定窗口内完整）

我有来自 Compustat 的大量数据我向其中添加了一些手工收集的数据认真地从一堆旧书中手工收集但我不想手工收集整个面板只想随机选择一个子集为了找到更大的集合我从中随机选择我想从 Compustat 的平衡面板开始我看到p
无法在 Powershell 中运行 R.exe

我经常发现在命令行 Windows 上运行 R 更有用然而当我在 Powershell 中尝试时我往往会遇到问题但这可以通过第一次运行轻松克服cmd然后就可以了这是我执行此操作时遇到的错误R CMD BATCH Invoke Hi
如何制作一连串的ggplots并在它们之间绘制箭头？

对于一个项目我需要绘制一些图并在它们之间放置箭头作为序列的指示我想知道我是否可以用 ggplot 来做到这一点是否可以使用 ggplot2 绘制一个干净的大箭头并将其添加到最终的多重图中作为示例我使用此代码来绘制绘图 librar
将 csv 文件上传到shinyApps.io

我的应用程序在本地运行良好并且我能够成功地将应用程序部署到shinyapps io 服务器但是当我尝试使用shinyapps URL 在浏览器中加载应用程序时收到以下错误消息错误对象数据不是成立我认为这是因为 data 变量从
求解非线性方程组

我正在尝试求解以下四个方程组我尝试过使用 rootSolve 包但似乎我无法通过这种方式找到解决方案我正在使用的代码如下 model lt function x F1 lt sqrt x 1 2 x 3 2 1 F2 lt sqrt
通过 r 中的组变量进行汇总

我有一个数据框如下 head newStormObject FATALITIES INJURIES PROPVALDMG CROPVALDMG EVTYPE total 1 0 15 2 5e 05 0 TORNADO 15 2 0 0 2
使用插入符和方法 = gamLoess 进行训练时 R 崩溃

当我运行下面的代码时 R 崩溃了如果我在训练调用中注释掉tuneGrid行就不会发生崩溃我已经用另一个数据集尝试过此操作但仍然使 R 崩溃崩溃消息是 R 会话中止 R遇到致命错误会话被终止开始新会话代码是 library s
DT数据表中的列对齐

In my shiny我正在使用的应用程序datatable函数来自DT库构建一个表格并希望将列居中对齐我可以用formatStyle column textAlign center 但它只影响列体而不影响标题我们必须设置columnD

随机推荐

React JS npm run start 返回错误 SyntaxError: Unexpected token;

我试图启动反应网络服务器npm start但不小心它又回来了 home azureuser react inventory node modules eslint webpack plugin node modules jest worke
Spark Dataframes 已成功创建，但无法写入本地磁盘

我正在使用 IntelliJ IDE 在 Microsoft Windows 平台上执行 Spark Scala 代码我有四个 Spark Dataframe 每个 Dataframe 大约有 30000 条记录我尝试从每个 Dataf
如何使用 jQuery POST 将变量从 JavaScript 传递到 PHP

我正在传递变量sessionnum来自页面 chat php 中的以下 Javascript 函数 document ready function timestamp 0 updateMsg form chatform submit fun
如何才能更准确地计算 PI？

我应该使用 1 到 30 之间的数字通过下面的公式来计算 pi Picture https i stack imgur com fYtUE png 这是我到目前为止所做的 int k outside 0 double inside 0 co
IDE 可以使用 Maven 解析 Java 中的 Scala 类吗？

我有一个混合 Java 和 Scala 源的项目按照以下说明进行操作这一页 http scala tools org mvnsites maven scala plugin usage html 它在从命令行运行 Maven 时有效然而
Firestore：用其内容填充 ids 数组的最佳方法是什么？

我有包含用户 ID 的对象数组 const userIDs key user 1 key user 2 key user 3 我想用 cloud firestore 中的用户数据填充它 const userIDs key user 1 na
在 SQL Server 2005 中授予对 2 个表的只读访问权限的最佳方法？

向少数用户授予对 SQL Server 2005 数据库中几个表的访问权限的最佳方法是什么我知道文献推动了视图的使用但是授予对实际表的只读访问权限有什么好处至少对于表来说开销会更少因为索引和其他限制已经就位并在表中进行管理单点维
如何使用 jQuery 附加 HTML

我正在使用构建一个 HTML 元素 this html my html here 我需要使用不同的 CSS 在这里添加许多元素所以我想要的是我应该能够在此处附加另一个 HTML this html my html here this ht
ObjC: +[NSObject isSubclassOfClass:] 给出不正确的失败

我有一个 iOS 静态库它定义了NSOperation客户端应该子类化以添加自己的逻辑的基类 interface BaseClass NSOperation 客户向管理器注册他们的子类 OperationManagerClass regi
按组排列的 NA 计数[重复]

这个问题在这里已经有答案了我知道 R 中的以下语法将按变量给出 NA 的计数如何通过分组变量对此进行分层 na count lt sapply x function y sum length which is na y 我们可以用agg
如何验证 Azure 虚拟机 RDP 证书？

我的虚拟机的 RDP 证书指纹由于某种原因发生了更改有没有办法在 Azure 中验证新的证书指纹类型虚拟机经典计算机 Basic A3 操作系统 Windows Server Azure 中有可用的启动诊断日志在启动虚拟机时默认
Iexpress - 提取路径

我要创建一个自解压存档但在连接默认解压路径时遇到问题我想在与自解压存档程序相同的路径中解压我的文件不幸的是这些文件正在另一个路径中提取 C Users computer AppData Temp IXP000 TMP 可以设置路径吗
应用程序无法打开，因为它来自身份不明的开发者

我昨天安装了 Mac OS X Mavericks 10 9 从那时起我无法启动 Eclipse 我附上我看到的消息的屏幕截图有解决方法吗我找到了一个解决方案修复 Mac OS X 中的应用程序无法打开因为它来自身份不明的开发者错
如何使用 GitPython 拉取远程存储库？

我正在尝试找到使用 gitPython 提取 git 存储库的方法到目前为止这是我从官方文档中获取的内容here http gitpython readthedocs org en latest tutorial html handli
Android File.exists() 不区分大小写吗？

我创建了一个新文件夹 sdcard dd by File album new File albumPath if album exists Log d TAG albumPath already exists else boolean bF
OS X 上带有 fat 库的架构 x86_64 的未定义符号

我已经建立了libcrypto a and libssl a我自己从来源处指定darwin64 x86 64 cc 对于 64 位和darwin i386 cc 对于 32 位至OpenSSL的配置脚本创建了脂肪库lipo并将它们添加
难道静态成员不会使类本身成为（全局）对象吗？

每当我遇到单例模式或任何静态类即几乎仅具有静态成员的类的实现时我想知道这是否实际上是一种黑客行为因此严重滥用了类和实例的原则只是为了设计单个对象而不是设计类并创建单个实例对我来说看起来类的静态成员通常会尝试向类添加某种它们实
套接字附加程序 - 基本示例一步一步[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
React router Link 标签的 target="_blank" 上的不同路由渲染

即使链接将 to 属性设置为正确的路线但单击时也不会加载 React router 中的另一条路由被加载到它的位置这是代码 App js const isLoggedIn setIsLoggedIn React useState fal
从距离矩阵开始查找 K 个最近邻

我正在寻找一个接受良好优化的函数n X n距离矩阵并返回n X k矩阵的索引k第 i 行中第 i 个数据点的最近邻居我发现了无数的不同R可以让您执行 KNN 的软件包但它们似乎都在同一函数中包含距离计算和排序算法特别是对于大多数例程

从距离矩阵开始查找 K 个最近邻

从距离矩阵开始查找 K 个最近邻 的相关文章

随机推荐

热门标签

从距离矩阵开始查找 K 个最近邻的相关文章