选择R中n个最远的点

2024-01-08

给定一组 xy 坐标，如何选择 n 个点以使这 n 个点彼此距离最远？

一种低效方法可能不适用于大数据集，如下所示（从 1000 个点中找出距离最远的 20 个点）：

xy <- cbind(rnorm(1000),rnorm(1000))

n <- 20
bestavg <- 0
bestSet <- NA
for (i in 1:1000){
    subset <- xy[sample(1:nrow(xy),n),]
    avg <- mean(dist(subset))
    if (avg > bestavg) {
        bestavg <- avg
        bestSet <- subset
    }
}

该代码基于 Pascal 代码，删除距离矩阵中行和最大的点。

m2 <- function(xy, n){

    subset <- xy

    alldist <- as.matrix(dist(subset))

    while (nrow(subset) > n) {
        cdists = rowSums(alldist)
        closest <- which(cdists == min(cdists))[1]
        subset <- subset[-closest,]
        alldist <- alldist[-closest,-closest]
    }
    return(subset)
}

在高斯云上运行，其中m1是@pascal的函数：

> set.seed(310366)
> xy <- cbind(rnorm(1000),rnorm(1000))
> m1s = m1(xy,20)
> m2s = m2(xy,20)

通过查看点间距离的总和来看看谁做得最好：

> sum(dist(m1s))
[1] 646.0357
> sum(dist(m2s))
[1] 811.7975

方法2胜出！并与20个点的随机样本进行比较：

> sum(dist(xy[sample(1000,20),]))
[1] 349.3905

正如预期的那样，效果很差。

发生什么了？让我们绘制一下：

> plot(xy,asp=1)
> points(m2s,col="blue",pch=19)
> points(m1s,col="red",pch=19,cex=0.8)

方法 1 生成红点，这些点在空间上均匀分布。方法 2 创建几乎定义周长的蓝点。我怀疑其原因很容易解决（在一个维度上更容易......）。

使用初始点的双峰模式也说明了这一点：

同样，方法 2 产生的总和距离比方法 1 大得多，但两者都比随机采样更好：

> sum(dist(m1s2))
[1] 958.3518
> sum(dist(m2s2))
[1] 1206.439
> sum(dist(xy2[sample(1000,20),]))
[1] 574.34

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Distance

选择R中n个最远的点的相关文章

如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
如何在 R 中的 for 循环内将值存储在向量中

我正在开始使用 R 但我对以下问题感到非常沮丧我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中问题是如何进行索引因为for循环迭代代码的次数取决于用户的输入所以变量i不一定要从1开始它可以从80开始 for举个例
`dplyr::_join` 函数的命名向量“by”参数[重复]

这个问题在这里已经有答案了我正在写一个函数dplyr join两个数据框by不同的列第一个数据帧的列名称动态指定为函数参数我相信我需要使用rlang准引用元编程但未能找到可行的解决方案我很感激任何建议 library dplyr
R ggplot 中的柯尔莫哥洛夫-斯米尔诺夫图

我正在尝试在 r 中绘制 KS 图一切似乎都很顺利除了我只能使用颜色来可视化两个不同的样本而不是线型这一事实我已经尝试过以下方法 sample1 lt SD13009 sample2 lt SD13009PB group lt c r
在 R 的 for 循环中创建动态命名对象并分配动态值

我正在尝试创建一套动态命名的新对象例如 temp2015 使用 for 循环并存储动态值具体来说其他对象的名称例如 Y2015 和 for 循环中使用的值例如 2015 在动态命名的新对象中我不确定为什么下面的代码不起作用 Y
闪亮的应用程序包：css 和所有 www/ 目录内容

我正在尝试将 Shiny 应用程序转换为 R 包但我在处理有关 www 目录以及松散文件的所有问题时遇到了问题我闪亮的应用程序运行得很好但是当我尝试打包它时它不起作用我闪亮的应用程序目录 my shiny app R ut
如何声明包含 M 个元素的列表对象

我想声明一个包含 M 3 x 3 矩阵的列表如果我事先知道数字 M 那么我可以通过以下方式声明这样的列表 elm lt matrix NA 3 3 Say M 7 myList lt list elm elm elm elm elm el
在r中的某个阈值处破坏 cumsum() 函数

例如我有以下代码 cumsum 1 100 我想打破它如果一个元素 i 1 大于3000 我怎样才能做到这一点因此而不是这个结果 1 1 3 6 10 15 21 28 36 45 55 66 78 91 105 120 136 15
在 R 中提取 data.frames 列表的名称以及 data.frame 中的值

在下面的代码中 j是 data frames 的命名列表我想知道是否有办法 a 提取变量的数值即one short and one long 在 data frames 内并附加它们的相关名称即 AAA or BBB or CCC 到
data.table 抛出“找不到对象”错误[重复]

这个问题在这里已经有答案了我有一个数据表 library data table mydt lt data table index 1 10 当我在全局环境中尝试它时我可以让它工作但当我在调试器中或在包测试中使用它时却无法工作问题是我
增加雷达图中长轴标签的空间

我想创建一个雷达图ggirahExtra ggRadar 问题是我的标签很长并且被剪掉了我想我可以通过添加在标签和绘图之间创建更多空间margin margin 0 0 2 0 cm to element text in axis tex
当设置 coord_fixed 时，ggplot/shiny 中的鼠标悬停坐标是错误的

我正在使用问题中的答案当您将鼠标悬停在闪亮的 ggplot 上时出现工具提示 https stackoverflow com questions 27965931 tooltip when you mouseover a ggplot o
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
R：如何将字符/数字转为1，NA转为0？

有没有一种简单的方法可以将列的字符数字变为 1 将 NA 变为 0 这里有一些示例数据我想将其应用于 3 4 structure list Item Code c 176L 187L 191L 201L 217L 220L Item x
如何动态地将 sliderInput 添加到闪亮的应用程序中？

使用闪亮我上传一个 csv 文件并根据列名称我需要向 ui 添加滑块 sidebarPanel fileInput file1 Upload CSV File to Create a Model accept c text csv t
如何将旋转的 NetCDF 转换回正常的纬度/经度网格？

我有一个带有旋转坐标的 NetCDF 文件我需要将其转换为正常的纬度经度坐标经度为 180到180 纬度为 90到90 library ncdf4 nc open dat nf 对于尺寸它显示 1 5 variables exclu
R - 基于列名称的子集

我的数据框有超过 120 列变量我想根据列名称创建子集例如我想创建一个子集其中列名称包含字符串心情这可能吗我一般用 SubData lt myData grep whatIWant colnames myData 我很清楚
StatET调试工具

我想我只是很密集但我似乎无法弄清楚如何在 Eclipse 中的 R 中使用调试工具 StatET 插件有人有关于这个主题的任何提示或教程吗 StatET 2 00 现在对高级可视化调试提供实验性支持需要 Eclipse 3 6 或
R：改变堆积条形图的颜色

library ggplot2 df2 lt data frame supp rep c VC OJ each 3 dose rep c D0 5 D1 D2 2 len c 6 8 15 33 4 2 10 29 5 head df2 g

随机推荐

将小写字母转换为大写字母

我是 Haskell 的新手在定义一个将所有小写字母转换为大写字母并保持其余部分不变的函数时遇到一些问题到目前为止我尝试在书中解决这个问题 capitalise String gt String capitalise xs capit
当 mixin 方法名冲突时，如何选择调用的方法？

当您在方法名称冲突的类中包含模块时它将使用该类定义的方法有没有办法选择我想要运行的一个 module B def self hello hello B end end class A include B def self hello h
在 ASP.net MVC6 网站上使用 Office Interop

我想从我的 ASP net MVC 6 网站生成 Word 文档我已经实现了多种在 POC 中生成文档的方法 DocX NetOffice OpenXml COM Interop 对象我被它诱惑了我制作了一个控制台应用程序来测试并且它
如何将Firebase的身份验证链接到实时数据库？

正如标题所说我需要将经过身份验证的用户链接到数据库这样不同的用户只能看到自己的数据我已经成功实现了Firebase的身份验证功能但记录不会保存到实时数据库我不知道如何执行此操作谁能教我如何实现这样的功能我尝试了数据库我大致知
我可以在 Swift 中模拟特征/混合吗？

Swift 是否有一种像 Scala 那样混合特征的方法 Swift 书中关于使用扩展向现有类添加协议的部分非常接近但是由于协议不能包含实现因此不能用于将代码混合到类中还有别的办法吗模拟混合的一种方法是使用通用函数来提供实现例如
ClassCastException：org.sonar.java.model.expression.MethodInitationTreeImpl 无法转换为 org.sonar.plugins.java.api.tree.IdentifierTree

今天我们将SonarQube Java插件从3 2升级到3 3 http docs sonarqube org display PLUG Java Plugin http docs sonarqube org display PLUG Ja
如何将 Micrometer 计时器与 webflux 端点一起使用

是否有任何简单的方法可以将 Micrometer 计时器与 Webflux 控制器一起使用看来 Timed 仅适用于非反应式方法对于反应性来说它记录的时间值非常低我发现了一个类似的问题如何使用 Micrometer Timer 记
将两个 xml 片段合并为一个？

如何合并xml内容 a and b into c declare a xml select 1 aaa for xml path AAAs declare b xml select 1 bb1 2 bb2 for xml path BBBs
使用 HttpServer 或 HttpSelfHostServer 对 Web API 进行单元测试

我正在尝试为 Web API 项目进行一些单元测试我将模拟 Web API 托管环境看来我可以使用内存主机 HttpServer 或自主机 HttpSelfHostServer 只是想知道有什么区别哪种技术有什么好处以及这些选项是否
Git-Svn dcommit 导致分支分裂

我遇到了 git svn dcommits 问题导致 git 存储库无法跟踪哪些提交我尝试确保 git 中的 master 分支始终遵循 SVN 存储库中的 trunk 所以每当我工作时我都会在一个主题分支上这是我的场景在主题分支
php 中的长计算会导致 503 错误

我的脚本需要很长时间才能执行结果服务器响应 503 错误如何设置更长的执行时间在我的 PHP 脚本中我设置 set time limit 0 ignore user abort true 这个问题非常类似于PHP 后台进程 https
将数据库从sql server 2008 r2备份恢复到2008

我需要将sql server 2008R2上的数据库备份和恢复到sql server 2008 备份文件不兼容这种方式我发现的另一个选项是生成包含数据的脚本由于我使用大量外键对数据库进行了规范化插入会成功吗还有其他可靠的方法吗正如
Web Audio API：停止播放所有预定的声音

所以我有一堆加载的音频样本我在下面的代码中调用调度函数 let audio function playChannel let audioStart context currentTime let next 0 for let i 0 i
如何获取离线安装的所有nuget依赖项

我使用两台电脑一台有互联网连接另一台没有互联网连接我想在脱机计算机上安装 Nuget 包 Nuget server 及其所有依赖项不幸的是仅仅下载软件包本身是不可能的我必须手动下载所有依赖项而且有几十个依赖项如何在具有 In
希望从大量 javascript 文件中删除注释

这是我的困境我是一个 javascript 菜鸟目前正在实习并帮助维护两个电子商务网站我最近被指派删除我们 javascript 库中出现的所有评论超过 25 000 条评论显然我想找到一个函数或一些预先存在的程序可以解析代码
如何更改滑动（可可）自定义工作表的点？

我想在我的 Mac 应用程序中使用一个带有自定义高度标题栏的主窗口例如 sparrow twitter 应用程序 mac 阅读器等我在用着https github com indragiek INAppStoreWindow https
SQL Server Nvarchar 和 Java 准备好的语句

我有一个关于将字符串插入 SQL Server 2008 R2 的问题当我尝试插入带有一些国家地区字母的字符串时我收到反而我知道添加N在字符串文字的开头可以解决这个问题但我使用的是 JDBC 准备好的语句如下所示 INSERT
Selenium：如何通过部分href查找元素？

工作代码1 Driver Instance FindElement By XPath a contains href PartialLinkHref 工作代码2 ReadOnlyCollection
如何查找基类库中实现特定接口的类型列表？

有时我想找出实现特定接口的所有标准 NET 类型的列表通常是出于好奇有时也有一些实际目的但这不是重点我试图从 MSDN 中获取此内容但类型的页面仅包含类型的子级链接而不包含实现接口的类型您知道如何做到这一点的任何技巧或有帮助
选择R中n个最远的点

给定一组 xy 坐标如何选择 n 个点以使这 n 个点彼此距离最远一种低效方法可能不适用于大数据集如下所示从 1000 个点中找出距离最远的 20 个点 xy lt cbind rnorm 1000 rnorm 1000 n lt

选择R中n个最远的点

选择R中n个最远的点 的相关文章

随机推荐

热门标签

选择R中n个最远的点的相关文章