在 R 中高效复制矩阵

2024-01-28

我有一个矩阵，并寻找一种有效的方法来将其复制 n 次（其中 n 是数据集中的观测值数量）。例如，如果我有一个矩阵 A

A <- matrix(1:15, nrow=3)

然后我想要一个表单的输出

rbind(A, A, A, ...) #n times.

显然，有很多方法可以构造如此大的矩阵，例如使用for循环或apply或类似的功能。然而，对“矩阵复制函数”的调用发生在我的优化算法的核心中，在程序的一次运行期间它被调用了数万次。因此，循环、应用类型的函数以及类似的东西都不够高效。（这样的解决方案基本上意味着 n 上的循环执行了数万次，这显然效率低下。）我已经尝试过使用普通的rep函数，但还没有找到一种方法来安排输出rep以所需格式的矩阵。

解决方案do.call("rbind", replicate(n, A, simplify=F))也太低效了，因为rbind在这种情况下使用得太频繁了。（然后，我的程序总运行时间的大约 30% 花费在执行 rbinds 上。）

有谁知道更好的解决方案？

另外两个解决方案：

第一个是问题中示例的修改

do.call("rbind", rep(list(A), n))

第二个涉及展开矩阵、复制它并重新组装它。

matrix(rep(t(A),n), ncol=ncol(A), byrow=TRUE)

既然要求的是效率，那么就需要对标

library("rbenchmark")
A <- matrix(1:15, nrow=3)
n <- 10

benchmark(rbind(A, A, A, A, A, A, A, A, A, A),
          do.call("rbind", replicate(n, A, simplify=FALSE)),
          do.call("rbind", rep(list(A), n)),
          apply(A, 2, rep, n),
          matrix(rep(t(A),n), ncol=ncol(A), byrow=TRUE),
          order="relative", replications=100000)

这使：

                                                 test replications elapsed
1                 rbind(A, A, A, A, A, A, A, A, A, A)       100000    0.91
3                   do.call("rbind", rep(list(A), n))       100000    1.42
5  matrix(rep(t(A), n), ncol = ncol(A), byrow = TRUE)       100000    2.20
2 do.call("rbind", replicate(n, A, simplify = FALSE))       100000    3.03
4                                 apply(A, 2, rep, n)       100000    7.75
  relative user.self sys.self user.child sys.child
1    1.000      0.91        0         NA        NA
3    1.560      1.42        0         NA        NA
5    2.418      2.19        0         NA        NA
2    3.330      3.03        0         NA        NA
4    8.516      7.73        0         NA        NA

所以最快的是原始的rbind调用，但这假设n是固定的并且是提前知道的。如果n不固定，那么最快的是do.call("rbind", rep(list(A), n)。这些用于 3x5 矩阵和 10 次复制。不同大小的矩阵可能会给出不同的排序。

EDIT:

对于 n=600，结果的顺序不同（省略了显式的rbind版本）：

A <- matrix(1:15, nrow=3)
n <- 600

benchmark(do.call("rbind", replicate(n, A, simplify=FALSE)),
          do.call("rbind", rep(list(A), n)),
          apply(A, 2, rep, n),
          matrix(rep(t(A),n), ncol=ncol(A), byrow=TRUE),
          order="relative", replications=10000)

giving

                                                 test replications elapsed
4  matrix(rep(t(A), n), ncol = ncol(A), byrow = TRUE)        10000    1.74
3                                 apply(A, 2, rep, n)        10000    2.57
2                   do.call("rbind", rep(list(A), n))        10000    2.79
1 do.call("rbind", replicate(n, A, simplify = FALSE))        10000    6.68
  relative user.self sys.self user.child sys.child
4    1.000      1.75        0         NA        NA
3    1.477      2.54        0         NA        NA
2    1.603      2.79        0         NA        NA
1    3.839      6.65        0         NA        NA

如果您包括明确的rbind版本，它比do.call("rbind", rep(list(A), n))版本，但不是很多，而且比这两个版本都慢apply or matrix版本。所以泛化到任意n在这种情况下不需要损失速度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 R 中高效复制矩阵的相关文章

fread 的填充选项

假设我有这个 txt 文件 AA 3 3 3 3 CC ad 2 2 2 2 2 ZZ 2 AA 3 3 3 3 CC ad 2 2 2 2 2 With read csv I can gt read csv linktofile txt
如果为 null 则替换为 0，否则在同一列中使用默认值

在SparkR shell 1 5 0中创建了一个示例数据集 df test lt createDataFrame sqlContext data frame mon c 1 2 3 4 5 year c 2011 2012 2013 2
R/ggplot2：在执行 ylim 上限的同时平滑整个数据集

更新我找到了答案包含在下面我有一个包含以下变量和类似值的数据集 COBSDATE CITY RESPONSE TIME 2011 11 23 A 1 1 2011 11 23 A 1 5 2011 11 23 A 1 2 2011 1
将复数名词转换为单数名词

如何使用 R 将复数名词转换为单数名词我使用 tagPOS 函数来标记每个文本然后提取所有标记为 NNS 的复数名词但是如果我想将这些复数名词转换为单数该怎么办 library openNLP library tm acq o lt
如何在R中使用twoord.plot()绘制多个图（分面）？

我的数据看起来像这样 height lt c 1 2 3 4 2 4 6 8 weight lt c 12 13 14 15 22 23 24 25 person lt c Jack Jim Jill Tess Jack Jim Jill
Shiny + downloadHandler + Openxlsx 不生成xlsx文件

我试图通过 Openxlsx 包生成一个 xlsx 文件其中包含文件内的反应名称和标头输入变量为 ASL 1 和 Year 1 要保存在文件中的对象是反应表 tab 1 它是由应用程序生成的没有任何问题但是当我尝试下载它时浏览器
在 R 中使用 NA 计算栅格数据的变异函数

Summary 我有一个包含 NA 值的栅格数据集并且想要计算它的变异函数忽略 NA 我怎样才能做到这一点我有一个图像已使用以下命令加载到 R 中readGDAL函数存储为im 为了使其可重复结果dput图像上可在https g
在 R 中连接/匹配数据帧

我有两个数据框第一列有两列 x是水深 y是每个深度的温度第二个也有两列 x也是水深但与第一个表中的深度不同第二栏z是盐度我想通过以下方式连接两个表x 通过增加z到第一张桌子我已经学会了如何使用 key 来连接表tidyr 但只有
在具有德语区域设置的 Windows 上将 ISO 8601 一年中的周数字与一年中的月份数字相匹配

这与我的问题直接相关来自每周时间格式的日期的 POSIX 日期 https stackoverflow com questions 41597604 posix date from dates in weekly time format 但
无法使用 Shinyjs() 禁用闪亮的应用程序单选按钮

我正在尝试禁用闪亮的应用程序单选按钮趋势 input Product A input month All 使用Shinyjs包但没有成功我的 ui 页面定义为 ui lt fluidPage shinyjs useShinyjs pa
如何创建热图来说明控制发散调色板中心颜色位置的网格差异？

我有两个人脸 3D 网格我希望使用热图来说明差异我想使用红蓝发散色阶我的数据可以查到here https github com Patricklv How to create heatmap illustraing 3D mesh d
在 R 中每小时获取在线数据

我想获取天文台每小时更新预报的数据我的一次性数据提取代码如下 library RCurl web lt getURL http www hko gov hk contente htm web lt unlist strsplit web
在 grid.text 中使用 pch 字符

我使用 ggplot2 创建了一个图表现在我想让图例不在图表上而是在图表外的网格中我现在的问题是是否有人知道是否有可能在 grid text 中使用 pch 符号 Here is an image to show what I wa
R data.table 计算行数，直到达到值

我想在 data table 中返回一个新列该列显示在达到低于当前值 Temp 的值之前有多少行 library data table set seed 123 DT lt data table Temp runif 10 0 20 这就
在单个图中获取 geom_hex 中的观测值 (Shiny)

我正在尝试创建一个十六进制的交互式图用户可以单击给定的十六进制并接收分组在该单击的十六进制中的原始数据帧的所有观察结果的列表下面是一个 MWE 看起来非常接近我的目标我正在使用 Shiny hexbin 和 ggplotly app
如何格式化DT背景*每行*？

我想用DTformatStyle 给出颜色渐变per row 鉴于此示例数据 library DT data lt round data frame x runif 5 0 5 y runif 5 0 10 z runif 5 0 20 3
用任意数量的空格分割字符串

我有以下字符串 1 10012 CAB UNCH CAB 我想按间隙分割该字符串但间隙的空格数量是可变的有没有办法使用strsplit 函数来分割这个字符串并返回一个包含 8 个元素的向量该向量已删除所有间隙一行代码是首选只需使用
匹配较大向量中的序列

我想要一个函数它返回向量的匹配子序列的初始索引例如 y lt c a a a b c multi match c a a y 1 1 2 multi match c a b y 1 3 我有一个粗略的实现但我觉得我必须重新发明轮子而
将箱线图与 Wilcoxon 检验进行比较

我正在使用 R 中的 ggplot2 包比较两组长度不同的个体和箱线图我想比较这两个分布但到目前为止我发现使用 wilcoxon 测试的唯一方法是 ggpubr 包中的 stat compare means 这是比较分布的正确方法吗
Rvest 从 select 中提取选项值和文本

Rvest 选择选项我认为用可重现的示例来解释是最简单的网站 http www verema com vinos portada http www verema com vinos portada我想获取葡萄酒的类型 Tipos de

随机推荐

IE7 中的 CSS
- 间隙
我有一个CSS ul li 嵌套菜单在 IE 8 和 Firefox 中完美运行但在 IE7 中它会在元素之间产生一个小间隙这是我的CSS nav nav ul margin 0 padding 0 list style type no
Heroku sock=Flask SocketIO 应用程序的后端服务器请求中断

我有一个在heroku上托管的flask socketio应用程序其中包含以下Procfile web gunicorn worker class eventlet hello app 自从我切换到 socketio 以来该应用程序的行
在箱线图中绘制空组

我想以特定的风格绘制很多箱线图来比较它们但是当组为空时该组不会被绘制假设我有一个数据框 a b 1 1 5 2 1 4 3 1 6 4 1 4 5 2 9 6 2 8 7 2 9 8 3 NaN 9 3 NaN 10 3 NaN
为什么 ::first-letter 中的文本修饰不能级联 ::first-line 中的文本修饰？

看起来text decoration in first letter不能级联text decoration in first line 这是代码 p first line color orange font size 22px text d
从参数分配集合的首选方法是什么？

我有这门课 public MyClass public void initialize Collection
将会话数据存储在 cookie 中

最近我偶然发现一些文章建议使用 cookie 来存储会话数据我喜欢这个想法并通过添加一个运行良好的 CookieStorage 类来扩展我的会话存储请注意每个用户我使用唯一的哈希密钥来签名和加密数据然而还有很多其他文章建议不要在
如何在 VSTS nuget 还原中指定外部 nuget 源的凭据

我正在使用 VSTS 中内置的 nuget 任务来执行包恢复我们的提要托管在内部 Artifactory 服务器上并在我的 nuget config 中作为包源进行引用然后我使用 VSTS 中的 nuget 服务端点来存储访问该源的
如何将大整数从字符串转换为 uint64_t？

我有一个大整数存储为字符串我需要将其转换为整数 uint64 t 我试过stoi 但是在抛出一个实例后它崩溃了std out of range 该字符串的最大长度为 64 位整数值最大值为 18 446 744 073 709 551
Visual Studio 安装项目：以当前用户而非系统帐户身份运行 CustomActions/process

我正在 Visual Studio 2010 中使用 C Outlook 加载项 Office 2010 2013 和其他独立工具的安装项目在安装过程中我杀死了所有 Outlook 实例然后我想重新启动 Outlook 实例在我的插
删除R文件中重复两次的无序对

我在 R 中有一个这样的文件 0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 10 1 0 1 11 1 12 1 13 1 14 1 15 1 16 1 17 1 18 1 19 3 0 正如我们所看到的其中
如何在 VBA 中将 GUID 分配给 DAO 参数

我有一段代码可以归结为 dim stmt as dao queryDef dim parId as dao parameter set stmt currentDB createQueryDef parameters id guid ins
编辑用作 Power BI 中的数据输入的 python 脚本

我有一个 python 脚本并用它在 Power BI 中创建一个数据框现在我想在 Power BI 中编辑该数据框但不要从头开始输入新数据因为我想将所有图表保留在我的 Power BI 模型中例如在我的旧数据框中我在脚本中指
如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？

例如如何执行以下等效的 SQL 插入到BINARY 16 field INSERT INTO Table1 MD5 VALUES X 6717f2823d3202449201145073ab871A X 6717f2823d3202449
正则表达式替换精确匹配的字符串

我想要一个正则表达式来替换与其完全匹配的字符串例如 var a test te world dimension 我需要更换 te Since te 存在于 test因此 Replace 语句正在替换 test就我而言那么有人可以让我知道
css 日历 - td 背景对角分割 - 两种颜色

我在 jsfiddle 找到了一个 css 风格的日历并想添加一些特定的 td 背景例如这里的对角线分割jsfiddle http jsfiddle net Tw5Wa 但组合起来却显得非常扭曲jsfiddle http jsfiddl
如何将时间戳插入rails数据库列

我刚刚开始使用 RoR 有一个问题如何将当前时间戳或任何类型的时间插入模型中下面您可以看到日志函数创建 def create log Log new params log respond to do format if log sa
将 gettext 的 .mo 文件保留在存储库中的好处

例如为什么 django cms 的作者将 gettext 的 mo 文件保留在 repo 中这不仅仅是疏忽请参阅这次提交 https github com divio django cms commit eb3824d4e4ec76
hadoop mapreduce 框架将我的 System.out.print() 语句发送到哪里？（标准输出）

我想调试一个mapreduce 脚本并且在没有遇到太多麻烦的情况下尝试在我的程序中放入一些打印语句但我似乎无法在任何日志中找到它们实际上标准输出只显示System out println of the 非映射缩减类 The Syste
打印“EXTERNSHEET（b7-）：”熊猫

我试图像往常一样运行我的图书馆 pandas 但后来我遇到了一个错误 import pandas as pd DF temp pd read excel example xlsx Output File opt anaconda3 lib
在 R 中高效复制矩阵

我有一个矩阵并寻找一种有效的方法来将其复制 n 次其中 n 是数据集中的观测值数量例如如果我有一个矩阵 A A lt matrix 1 15 nrow 3 然后我想要一个表单的输出 rbind A A A n times 显然有很

在 R 中高效复制矩阵

在 R 中高效复制矩阵 的相关文章

随机推荐

热门标签

在 R 中高效复制矩阵的相关文章