使用正整数参数优化

2024-05-06

我需要解决一个需要比较具有相同列数的两个矩阵的问题。其中之一被操纵，直到获得最佳匹配。我对两个矩阵之间的差异进行评分的方式非常复杂，我仍然需要最终确定它。目前我真正感兴趣的是找到一种仅适用于正整数的搜索/优化算法。我创建了一个简单的示例，其中包含一个简单的最大化函数。假设我有一个数据集 D。

 D <- data.frame(rbind(c(1,1,1),
                       c(1,1,0),c(1,1,0),c(1,1,0),c(1,0,0),
                       c(0,0,0),c(1,0,0),c(1,0,0),c(1,1,0),
                       c(1,0,0),c(1,1,1),c(1,1,0),c(1,0,0),
                       c(1,0,0),c(1,0,1)))

我想找出 Dx 的哪种重新排列给我带来最低的绝对差异。

Dx<-data.frame(rbind(c(1,1,0),c(1,0,0),c(0,0,0),c(1,1,0)))

所以我可以使用下面的函数完成所有可能的排列

    library(combinat)
    SPACE <- t(as.data.frame(list(permn(1:3))))
    f <- function(x){
      if(anyDuplicated(x)>0){return(0)}
      Dist<-NA
      for (i in 1:nrow(D)){
        Dist[i]<-sum(abs(Dx[,x]-t(D[i,])))} 
    return(sum(Dist))}
apply(SPACE,1,f)

并得到正确的结果。但是，这对于我实际使用的数据有两个缺点：

我必须指定 SPACE-所有可能的列顺序和
apply遍历每个可能的排列并计算我的错误分数。

随着矩阵中列数的增加，A 和 B 都变得计算困难。我认为，在大多数计算机上，即使在一个 R 会话中保留数字 1 到 14 的所有可能排列也是不可能的。

我发现的一种优化算法是网格搜索。这开始解决 A。这意味着我不必指定 SPACE（即所有可能的排列），因此这是朝着正确方向迈出的一步，因为我想查看更大的数据集。

library(NMOF)
gridSearch(f, rep(list(seq(1,ncol(D))),ncol(D)))

但显然这并没有解决 B，因为它会经历每个可能的迭代。如果我的数据集非常大（假设有 15 列甚至更多列）怎么办？

请记住，我的参数只能是正整数（即它们是列号），是否有一种 R 算法可以让我在合理的时间内找到最佳的列顺序（或至少是一个好的近似值）（例如1-2 天），当我处理更大的数据集时？这可能看起来像一个愚蠢的例子，但它很好地模拟了我试图解决的问题。我试过了optim() with method="SANN"，但无处可去。不幸的是，我的经验很少，所以如果您认为这是一个无法解决的问题，请告诉我。首先从一个更简单的数据集（行数很少但列很多）问题开始，您认为是否可以通过使用某种巧妙的优化来找到如上所示的 D2 的最佳列顺序？

   #D2
D<-cbind(D,D,D,D,D)
ncol(D)
Dx<-cbind(Dx,Dx,Dx,Dx,Dx)
#examples 
f(c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15))
f(c(13,2,4,3,5,6,7,8,9,10,11,12,1,14,15))

编辑：我的主要兴趣是了解如何使用在搜索过程中使用一系列独特正积分（基本上是排名）的优化算法，而不是解决这个特定问题。在这种情况下，我使用了一个简单的示例，以便很容易复制，但是我正在比较的两个数据集通常在行数和其他方面有所不同，我在这里没有详细说明......距离函数我' m 构建很好地处理了这个问题，因此了解如何使用 D2 将优化算法（例如下面建议的遗传算法）应用于上面的函数 f 是我目前的主要问题。

如果你的目标函数f必须真正被视为黑匣子，然后我们需要诉诸近似方法，例如遗传算法。这是一个使用以下解决方案gaoptim包，最大化f(p)在所有排列中p的列数Dx:

library(gaoptim)
myGA = GAPerm(f, ncol(Dx), popSize=10)
myGA$evolve(10)
myGA
# Results for 10 Generations:
# Mean Fitness:
#    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#    95.0   107.4   115.6   112.4   118.3   120.6 
# 
# Best Fitness:
#    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#     125     125     125     125     125     125
# 
# Best individual:
# [1] 3 1 2
# 
# Best fitness value:
# [1] 125

在本例中，它找到了最佳可能的解决方案，目标值为 125，但一般来说，无法保证遗传算法返回的解决方案的质量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用正整数参数优化的相关文章

为什么我在 R 向量的类别中看到“整数”而不是“向量”

为什么从数据框中切片的列的数据类型显示为整数而不是向量 df lt data frame x 1 3 y c a b c x y 1 1 a 2 2 b 3 3 c c1 lt df 1 1 1 2 3 class c1 1 inte
使用插入符号完全可重现的并行模型

当我在插入符中运行 2 个随机森林时如果设置随机种子我会得到完全相同的结果 library caret library doParallel set seed 42 myControl lt trainControl method cv
使用 R 数学独立库使用 C++ 编写矩阵/向量？

All 我一直在使用 C 中的 R 数学独立库我非常喜欢能够生成随机数并使用我熟悉的 R 分布函数我的问题是是否可以使用 R 中可用的矩阵运算乘法转置逆 Chol 等一个独立的库我在 Rmath h 中没有看到它们如果矩阵
按值对 geom_bar ggplot2 中的条形重新排序

我正在尝试制作一个条形图其中的图是从miRNA与最高的value to the miRNA与最低的为什么我的代码不起作用 gt head corr m miRNA variable value 1 mmu miR 532 3p pos
使用条件求 R 中的累积和

我需要创建一个新变量其中包含每个 ID 过去三年金额的总和如果没有三年的数据则应显示 NA 举个例子 ID YEAR AMOUNT 1 2010 5 1 2011 2 1 2012 4 1 2013 1 1 2014 3 2 2013
将值排列在特定组内

我试图在嵌套数据帧的精确组内按降序排列值我的输入数据如下所示我有两个分组变量 group1 and group2 和三个值即id value2 value3 library tidyverse set seed 1234 df lt
通过 R 连接到 Azure SQL

下面的代码允许我通过 R 连接到 Azure SQL 服务器但是我只能访问主数据库而不能访问我在下面创建的两个数据库表格显示为空白有什么想法吗谢谢 library RODBC library dplyr library DB
Databricks：如何从 R Dataframe 切换到 Pandas Dataframe（同一笔记本中的 R 到 python）

我正在 Databricks 笔记本中编写 R 代码该代码在 R 中执行多项操作清理数据帧后我想使用 python 在 python 单元中调用它因此使用 python 代码继续对数据帧进行操作因此我想在 python 块内将我
如何使用 by 并将所有列暴露给该函数将函数应用于 data.table 的子集？

当切片一个data table按组划分用于对数据进行切片的变量在函数执行期间不在子集中我用以下方法演示了这一点debugonce library data table x lt data table a rep letters 1 4
如何在r中找到按业务分组的第二高薪水

我想要的是每个企业的输出应该只包含第二高的工资条目例如 customer id name sales firstname lastname income business 6 Priyank Dwivedi 2 Priyank Dwive
R strsplit：根据字符分割，除非后面有特定字符

假设我有一个字符串向量例如 split these c File Location C Documents File Location Pete s Computer File Location 我想根据分割该向量中的每个元素除非后面
使用 rpy2 将 NULL 从 Python 转换为 R

在 R 中经常NULL值用作默认值使用 Python 和 RPy2 如何显式提供NULL争论 None不可兑换 NotImplementedError 字符串 NULL 只会被转换为字符串并在执行过程中导致错误采取以下示例使用tsi
从 R 中的因子记录创建变量

我有点迷失了我有一个如下所示的数据框 tract ageClass count 1 0 4 71 2 0 4 192 3 0 4 81 1 5 8 9 2 5 8 86 3 5 8 42 我想要这样的结果 tract 0 4 5 8 1
dplyr::case_when 与 if_else 对于需要两个条件的摘要列

df lt data frame id c 1 6 start date c Mar 22 Feb 22 Jan 22 Dec 21 Nov 21 Oct 21 Jan 22 c NA NA 1 0 0 1 Feb 22 c NA 1 1
RStudio 服务器未启动

过去几个月我一直在远程 RStudio 服务器上工作没有任何问题今天我使用此命令重新启动了 rstudio 服务器 sudo rstudio server restart 此后我无法通过浏览器访问服务器它继续等待我用这个检查了状
R 使用 dplyr 将列移动到最后

对于 data frame 来说n列我希望能够从任何列移动列1 n 1 位置成为第 n 列即非最后一列成为最后一列我也想使用dplyr 我想这样做而不是简单地键入所有列的名称例如 data lt data frame a 1 5
mutate rowSums 排除一列

我有一个像这样的数据框 gt df Source local data frame 4 x 4 a x y z 1 name1 1 1 1 2 name2 1 1 1 3 name3 1 1 1 4 name4 1 1 1 想要通过添加 x
R 语言与 php 集成以获取 R 的结果

我有以下 R 脚本 assign data path data path lt C Users Owner Desktop R work assign valus to the following three percent train p
即使设置了语言环境，data.frames中的藏文字符也无法在R控制台中显示（中文可以，矩阵中的藏文可以）

在 R 中藏文字符位于 data frames 中时无法正确显示 gt Sys setlocale LC CTYPE Tibetan 1 Tibetan China 950 gt data frame a a 1
条件格式 DT 中的样式

我想根据 B 列中的值对 A 列中的行进行着色下面的代码基于小插图中的示例Link https rstudio github io DT 010 style html 但仅显示两列的条件 mobile number by mobile f

随机推荐

MySQL 中两个 Select 查询的结果相减

我编写了两个 mysql 查询一个获取一年中特定月份的总用户注册另一个获取一年中特定月份的活跃用户我需要找到数量inactive当年的用户为此我正在考虑减去通过两个单独的查询获得的总用户数和活动用户列以下是查询 1 Fetch
如何在android listview或线性布局中动态设置marginBottom？

friends 我想使用java代码或动态设置layout marginBottom 在列表视图或线性布局中有人指导我如何实现这一目标吗任何帮助将不胜感激 ListView lst getListView LinearLayout L
如何开始使用“scipy”

我之前安装过 Python 3 4 2 和 3 5 2 在这两种情况下我都可以在 Idle 中涉足编写和测试代码这给了我两个窗口一个用于代码的运行窗口一个用于交互和测试的 Shell 窗口输出抱歉不确定术语是否正确现在我
将美元金额动态转换为文本以包含“美元”和“美分”一词

我需要将输入字段中输入的美元金额动态转换为文本我能找到的最接近的解决方案几乎可以满足我的需求但是我希望结果文本包含美元一词并删除句子末尾带有美分的点一词这是起始原型和当前结果 function amountToWord
调用未定义的函数 mcrypt_decrypt() - 即使安装了 php5-mcrypt

所以我无法停止收到错误 PHP Fatal error Call to undefined function mcrypt decrypt in 即使我安装了 php5 mcrypt 我也重新安装了 php 好几次但我无法让它工作更多信
使用整洁的评估语义通过字符向量进行 group_by

我曾经这样做过使用group by library dplyr group by lt c cyl vs mtcars gt group by dots group by gt summarise gear mean gear but n
为什么桌面 AES 文件 IO 与 Android AES 文件 IO 不兼容？

我已将一个应用程序从 Android 移植到桌面该应用程序使用 AES 加密一些私人数据两个应用程序都能够加密和解密数据以供自己使用但无法解密其他应用程序的数据 AES 密钥 IV 和算法是相同的这两个应用程序之间的主要区别在于 a
如何以编程方式关闭wx.DirDialog？

我有 wxpython 应用程序可以在单击按钮时打开 wx DirDialog dlg wx DirDialog self Choose a directory style wx DD DEFAULT STYLE if dlg ShowM
从汇编程序获取命令行参数

通读专业汇编语言书籍似乎它提供了用于读取命令行参数的错误代码我纠正了一点现在它从段错误变成了读取参数计数然后是段错误这是完整的代码 data output1 asciz There are d params n output2
使用多索引列对多列求和

我有一个从数据透视表创建的数据框看起来类似于 import pandas as pd d company1 False Negative April 2012 112 0 April 2013 370 0 April 2014 499 0
带 Retrofit 的简单登录表单

我开始使用 Retrofit 但我坚持这个简单的步骤我有一个登录表单我正在尝试通过服务器进行身份验证但我无法发送请求这是我尝试过的我的改造客户 private static OkHttpClient Builder httpCli
DOM 操作在 Angular 2 中属于什么位置？

在 Angular 1 中所有 DOM 操作都应该在指令中完成以确保适当的可测试性但是 Angular 2 呢这是如何改变的我一直在寻找关于在哪里进行 DOM 操作以及在执行操作时如何思考的好文章或任何信息但每次都一无所获以此
我正在使用 SQL 设计公交车时刻表。每条巴士路线都有多个站点，我是否需要为每条路线准备不同的表？

我正在尝试提出尽可能最有效的数据库我的巴士路线大约有 10 个站点巴士从一号站出发直到到达第十站然后再返回这个循环每天发生3次我真的很困惑如何有效地生成公交车的时间以及应该在哪里存储站点如果我将所有停靠点放在一个字段中将时间
如何确定输入的模式是“Int，VarChar，Date，Time ...”等

我有一个下拉菜单其中包含DataType 和一个文本框这是用于输入的Regex Pattern 如果我进入 test 在文本框中或从下拉菜单中选择Int 如果在文本框中输入则其模式是错误的 0 9 那么它的correct patte
元视口标签似乎被完全忽略或没有效果

我把这个标签放在了头部一个网页 http www belovedobjects de 由于某种原因它在我的 iPhone 上似乎被忽略了甚至添加了user scalable no没有影响我尝试了许多宽度初始比例等值似乎没有任何效果
当有效的 django 表单保存在数据库中时如何触发自定义 python 代码

Django 新手我创建了一个简单的表单如下this https www youtube com watch v 3XOS UpJirU教程我的表单正确地将数据保存在我的 Postgres 连接的本地数据库中我想知道每当将有效表单保
如何使用 ASP.Net Core Identity 从登录用户检索 Google 个人资料图片？

好的我目前正在使用 ASP NET Core 1 1 2 和 ASP NET Core Identity 1 1 2 其中重要的部分是启动 cs看起来像这样 public void Configure IApplicationBuilde
R - 过滤器坐标

我是 R 新手我有一个简单的问题据我看来但到目前为止我还没有找到解决方案我有一组长 2D x y 坐标只是 2D 空间中的点如下所示 ID x y 1 1758 56 1179 26 2 775 67 1197 14 3 29
ASP.NET Core 3：如何在自定义库中引用 3.0.0 程序集？

我看到引用的应用程序Microsoft AspNetCore App框架又称为 ASP NET Core 3 0 使用程序集中的类型Microsoft AspNetCore Mvc Abstractions Version 3 0 0 0
使用正整数参数优化

我需要解决一个需要比较具有相同列数的两个矩阵的问题其中之一被操纵直到获得最佳匹配我对两个矩阵之间的差异进行评分的方式非常复杂我仍然需要最终确定它目前我真正感兴趣的是找到一种仅适用于正整数的搜索优化算法我创建了一个简单的示例其

使用正整数参数优化

使用正整数参数优化 的相关文章

随机推荐

热门标签

使用正整数参数优化的相关文章