使累计总和更快

2024-04-06

我正在尝试计算矩阵每一列的累积和。这是我的 R 代码：

testMatrix = matrix(1:65536, ncol=256);
microbenchmark(apply(testMatrix, 2, cumsum), times=100L);

Unit: milliseconds
                         expr      min       lq     mean  median       uq      max neval
 apply(testMatrix, 2, cumsum) 1.599051 1.766112 2.329932 2.15326 2.221538 93.84911 10000

我使用Rcpp进行比较：

cppFunction('NumericMatrix apply_cumsum_col(NumericMatrix m) {
    for (int j = 0; j < m.ncol(); ++j) {
        for (int i = 1; i < m.nrow(); ++i) {
            m(i, j) += m(i - 1, j);
        }
    }
    return m;
}');
microbenchmark(apply_cumsum_col(testMatrix), times=10000L);

Unit: microseconds
                         expr     min      lq     mean  median      uq      max neval
 apply_cumsum_col(testMatrix) 205.833 257.719 309.9949 265.986 276.534 96398.93 10000

所以 C++ 代码的速度是原来的 7.5 倍。有可能做得比apply(testMatrix, 2, cumsum)在纯 R 中？感觉就像我无缘无故地有一个数量级的开销。

仅用 R 代码很难击败 C++。我能想到的最快方法是，如果您愿意将矩阵拆分为列表。这样，R 使用原始函数并且不会在每次迭代时复制对象（apply本质上是一个漂亮的循环）。您可以看到 C++ 仍然胜出，但速度有了显着提升list如果您真的只想使用 R 代码，请使用此方法。

fun1 <- function(){
    apply(testMatrix, 2, cumsum)
}

testList <- split(testMatrix, col(testMatrix))

fun2 <- function(){
    lapply(testList, cumsum)
}

microbenchmark(fun1(),
               fun2(),
               apply_cumsum_col(testMatrix),
               times=100L)


Unit: microseconds
                         expr      min        lq      mean   median        uq      max neval
                       fun1() 3298.534 3411.9910 4376.4544 3477.608 3699.2485 9249.919   100
                       fun2()  558.800  596.0605  766.2377  630.841  659.3015 5153.100   100
 apply_cumsum_col(testMatrix)  219.651  282.8570  576.9958  311.562  339.5680 4915.290   100

EDIT请注意，此方法比fun1如果您包括将矩阵拆分为列表的时间。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rcpp

使累计总和更快的相关文章

如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
将第 N 行上的 NA 行插入 data.frames 列表，其中 N 来自列表

经过几个小时后我发现自己无法解决以下问题我有一个数据框列表我想分别向每个 DF 插入而不是替换一行或多行 NA 始终至少一行要插入的 NA 数量存储在单独的列表中为了说明这一点我有以下两个列表 list of datafra
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
列出 R 数据文件的内容而不加载

我有时用print load myDataFile RData 当我加载数据文件时列出它的内容有没有办法列出内容而不加载数据文件中包含的对象我认为如果不加载对象就无法做到这一点解决方案可能是使用包装器将 R 对象保存到save 该函数
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
如何在 R 中的 for 循环内将值存储在向量中

我正在开始使用 R 但我对以下问题感到非常沮丧我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中问题是如何进行索引因为for循环迭代代码的次数取决于用户的输入所以变量i不一定要从1开始它可以从80开始 for举个例
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
从 data.frame 在 ggplot 图例中添加信息

我想在图例中添加信息哪个传感器具有该值这是我的代码 z lt data frame a c sensor 1 sensor 2 sensor 3 sensor 4 sensor 5 sensor 6 sensor 7 sensor 8
在 R 中提取 data.frames 列表的名称以及 data.frame 中的值

在下面的代码中 j是 data frames 的命名列表我想知道是否有办法 a 提取变量的数值即one short and one long 在 data frames 内并附加它们的相关名称即 AAA or BBB or CCC 到
在网格中制作一个矩形图例，并标记行和列

我有一个 ggplot 我将因子映射到填充和 alpha 如下所示 set seed 47 the data lt data frame value rpois 6 lambda 20 cat1 rep c A B each 3 cat2
从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
当设置 coord_fixed 时，ggplot/shiny 中的鼠标悬停坐标是错误的

我正在使用问题中的答案当您将鼠标悬停在闪亮的 ggplot 上时出现工具提示 https stackoverflow com questions 27965931 tooltip when you mouseover a ggplot o
如何为自定义 S3 类实现提取/取子集 ([ [<-, [[ [[<-)] 函数？

我有一个自定义的 S3 类foo 它在正常的基础上添加了一些自定义行为data frame foo object lt data frame class foo object lt c foo data frame 对于这个类还应该有一个
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的

随机推荐

我想从 LAN 不仅通过 IP_OF_SYNOLOGY:PORT 访问 Jira（Synology DS716+II 上的 Docker），还想通过 jira.synology.local 访问 Jira（Synology DS716+II 上的 Dock

我正在使用 Synology NAS 类型 aDS716 II DSM 6 1 4 15217 Update 2 其上运行带有 Jira 容器的 Docker So now what I want to do I m assigned to
RegEx 不超过 2 个相同的连续字符以及 a-Z 和 0-9

Edit 谢谢你的建议让我的问题更清楚 The Match正在寻找 3 个连续的字符 Regex Match AaA653219 Regex Match AA5556219 代码是ASP NET 4 0 这是整个函数 public Val
mongoDB .toArray() 在某些聚合上速度较慢

我有一个包含 n 个文档的集合这些文件看起来像这样 id https www spacex com vehicles dragon meta title SpaceX Dragon description SpaceX designs m
在编写控制台应用程序时，有没有办法创建第二个控制台以在 .NET 中输出？

在编写控制台应用程序时有没有办法创建第二个控制台以在 NET 中输出好吧您可以启动一个新的 cmd exe 进程并使用 stdio 和 stdout 发送和接收数据 ProcessStartInfo psi new ProcessSt
请在合并之前提交您的更改或隐藏它们

我想升级但我需要提交但是当我执行 git commit 时我得到您的分支比起源开发落后 20 次提交并且可以快进使用 git pull 更新本地分支我不想丢失本地更改从项目目录使用这些终端命令使用以下方式隐藏您的本地
将命令的 stderr 从构建任务传递到 Azure DevOps

我有一个 VSTS Azure DevOps 版本其中包含电源外壳 or a 命令行任务该任务正在运行一些程序 program exe When program exe返回非零退出代码构建按预期失败 program exe还打印详细的
NSString unicode编码问题

我在将字符串转换为可读的内容时遇到问题我在用着 NSString substring NSString stringWithUTF8String symbol data cStringUsingEncoding NSUTF8StringE
我可以在 iPhone 的网络浏览器上运行嵌入网页的 Java Applet 吗？

我可以在 iPhone 上运行嵌入或 HTML 标记中的 Java 小程序吗我的意思不是作为一个应用程序而是实际上通过它的浏览器不正如史蒂夫乔布斯在 2007 年接受采访时回答的那样 Java 不值得构建没有人再使用 Java
这个属性的作用是什么：MethodImplOptions.NoInlined（或者：什么是“内联”方法）[重复]

这个问题在这里已经有答案了可能的重复 C 中的内联函数 https stackoverflow com questions 473782 inline functions in c 什么是方法内联 https stackoverflow
Spark时间戳差异

我正在尝试在 Spark 中进行时间戳差异但它没有按预期工作下面是我正在尝试的方法 import org apache spark sql functions df df withColumn TimeStampDiff from un
Bootstrap 4 .nav-link 填充

我想删除第一个的左侧填充 nav link in navbar nav 这是一个example https i stack imgur com m3XK7 png 在 bootstrap 4 中我创建了一个导航并给了填充 nav link
比较两个托管引用

是否可以比较两个托管引用类型为ref T 如果它们相等我的意思不是对对象的引用而是对变量的引用例子 public static bool Compare ref int a ref int b return ref a ref b
使用 YAML 转储 unicode

我正在从 csv 创建 yaml 文件其中包含很多 unicode 字符但我似乎无法让它转储 unicode 而不会给我一个解码错误我正在使用ruamel yaml图书馆 UnicodeDecodeError ascii codec
删除功能不起作用

我正在开发一个应用程序它有一个启动屏幕可以下载几个文件在文件开始下载之前我想检查文件是否已经存在如果存在我想删除它们下面显示的代码包含正确的文件路径并且检查文件是否存在的函数似乎与 Logcat 中读出的状态文件已删除一
gulp.dest 未创建目标文件夹

我的 gulp 代码部分如下所示 gulp src application base js application base assets js base pipe gulpPlumber errorHandler function err
watchOS 3 SpriteKit 中的触摸事件？

在watchOS 3中使用SpriteKit时如何处理触摸事件我正在从 iOS 移植 SpriteKit 游戏下面的代码不起作用或者你必须以某种方式控制 WKInterfaceController override func tou
Apache 上 Django 应用程序的 POST/GET 请求日志

Django 开发服务器非常好它实时显示所有 POST GET 请求以及其他事件的日志来自 Django 开发服务器的日志示例 04 Jul 2012 19 23 27 GET static images sprites submit
根据所选单选按钮显示控件

我有一组三个单选按钮根据选择的单选按钮我想显示三个控件之一文本框下拉列表或按钮如何根据所选单选按钮的结果显示控件您可以使用以下方法将控件的可见性绑定到 RadioButton 的 IsChecked 属性 BooleanToVi
如何在 Android 中暂停和恢复录音

我正在使用 MediaRecorder 类开发音频录制应用程序我有以下要求 1 按下暂停按钮则暂停录音 2 按下恢复按钮后从暂停处恢复录制我试试这个link https stackoverflow com questions 5743
使累计总和更快

我正在尝试计算矩阵每一列的累积和这是我的 R 代码 testMatrix matrix 1 65536 ncol 256 microbenchmark apply testMatrix 2 cumsum times 100L Unit m

使累计总和更快

使累计总和更快 的相关文章

随机推荐

热门标签

使累计总和更快的相关文章