为什么与简单的 Rcpp 实现相比，zoo::rollmean 慢？

2024-01-06

zoo::rollmean是一个有用的函数，它返回时间序列的滚动平均值；对于矢量x长度n和窗口大小k它返回向量c(mean(x[1:k]), mean(x[2:(k+1)]), ..., mean(x[(n-k+1):n])).

我注意到我正在开发的一些代码似乎运行缓慢，因此我使用 Rcpp 包和一个简单的 for 循环编写了自己的版本：

library(Rcpp)
cppFunction("NumericVector rmRcpp(NumericVector dat, const int window) {
  const int n = dat.size();
  NumericVector ret(n-window+1);
  double summed = 0.0;
  for (int i=0; i < window; ++i) {
    summed += dat[i];
  }
  ret[0] = summed / window;
  for (int i=window; i < n; ++i) {
    summed += dat[i] - dat[i-window];
    ret[i-window+1] = summed / window;
  }
  return ret;
}")

令我惊讶的是，这个版本的功能比之前的快得多zoo::rollmean功能：

# Time series with 1000 elements
set.seed(144)
y <- rnorm(1000)
x <- 1:1000
library(zoo)
zoo.dat <- zoo(y, x)

# Make sure our function works
all.equal(as.numeric(rollmean(zoo.dat, 3)), rmRcpp(y, 3))
# [1] TRUE

# Benchmark
library(microbenchmark)
microbenchmark(rollmean(zoo.dat, 3), rmRcpp(y, 3))
# Unit: microseconds
#                  expr     min       lq       mean    median        uq       max neval
#  rollmean(zoo.dat, 3) 685.494 904.7525 1776.88666 1229.2475 1744.0720 15724.321   100
#          rmRcpp(y, 3)   6.638  12.5865   46.41735   19.7245   27.4715  2418.709   100

即使对于更大的向量，加速也成立：

# Time series with 5 million elements
set.seed(144)
y <- rnorm(5000000)
x <- 1:5000000
library(zoo)
zoo.dat <- zoo(y, x)

# Make sure our function works
all.equal(as.numeric(rollmean(zoo.dat, 3)), rmRcpp(y, 3))
# [1] TRUE

# Benchmark
library(microbenchmark)
microbenchmark(rollmean(zoo.dat, 3), rmRcpp(y, 3), times=10)
# Unit: milliseconds
#                  expr        min         lq       mean     median         uq        max
#  rollmean(zoo.dat, 3) 2825.01622 3090.84353 3191.87945 3206.00357 3318.98129 3616.14047
#          rmRcpp(y, 3)   31.03014   39.13862   42.67216   41.55567   46.35191   53.01875

为什么一个简单的Rcpp实现运行速度比以下快约 100 倍zoo::rollmean?

感谢@DirkEddelbuettel 指出问题中所做的比较并不是最公平的，因为我正在将 C++ 代码与纯 R 代码进行比较。以下是一个简单的基本 R 实现（没有来自 Zoo 包的所有检查）；这与如何zoo::rollmean实现滚动平均值的核心计算：

baseR.rollmean <- function(dat, window) {
  n <- length(dat)
  y <- dat[window:n] - dat[c(1, 1:(n-window))]
  y[1] <- sum(dat[1:window])
  return(cumsum(y) / window)
}

相比zoo:rollmean，我们发现这仍然快得多：

set.seed(144)
y <- rnorm(1000000)
x <- 1:1000000
library(zoo)
zoo.dat <- zoo(y, x)
all.equal(as.numeric(rollmean(zoo.dat, 3)), baseR.rollmean(y, 3), RcppRoll::roll_mean(y, 3), rmRcpp(y, 3))
# [1] TRUE
library(microbenchmark)
microbenchmark(rollmean(zoo.dat, 3), baseR.rollmean(y, 3), RcppRoll::roll_mean(y, 3), rmRcpp(y, 3), times=10)
# Unit: milliseconds
#                       expr        min         lq       mean     median         uq        max neval
#       rollmean(zoo.dat, 3) 507.124679 516.671897 646.813716 563.897005 593.861499 1220.08272    10
#       baseR.rollmean(y, 3)  46.156480  47.804786  53.923974  49.250144  55.061844   76.47908    10
#  RcppRoll::roll_mean(y, 3)   7.714032   8.513042   9.014886   8.693255   8.885514   11.32817    10
#               rmRcpp(y, 3)   7.729959   8.045270   8.924030   8.388931   8.996384   12.49042    10

为了深入研究为什么我们在使用基础 R 时看到了 10 倍的加速，我使用了 Hadley 的 lineprof 工具，从zoo需要的地方打包源码：

lineprof(rollmean.zoo(zoo.dat, 3))
#     time  alloc release dups ref                  src
# 1  0.001  0.954       0   26 #27 rollmean.zoo/unclass
# 2  0.001  0.954       0    0 #28 rollmean.zoo/:      
# 3  0.002  0.954       0    1 #28 rollmean.zoo        
# 4  0.001  1.431       0    0 #28 rollmean.zoo/seq_len
# 5  0.001  0.000       0    0 #28 rollmean.zoo/c      
# 6  0.006  2.386       0    1 #28 rollmean.zoo        
# 7  0.002  0.954       0    2 #31 rollmean.zoo/cumsum 
# 8  0.001  0.000       0    0 #31 rollmean.zoo//      
# 9  0.005  1.912       0    1 #33 rollmean.zoo        
# 10 0.013  2.898       0   14 #33 rollmean.zoo/[<-    
# 11 0.299 28.941       0  127 #34 rollmean.zoo/na.fill

显然，几乎所有的时间都花在了na.fill函数，该函数实际上是在计算滚动平均值之后调用的。

lineprof(na.fill.zoo(zoo.dat, fill=NA, 2:999999))
#     time  alloc release dups ref                  src
# 1  0.004  1.913       0   39 #26 na.fill.zoo/seq     
# 2  0.002  1.921       0    9 #33 na.fill.zoo/coredata
# 3  0.002  1.921       0    6 #37 na.fill.zoo/[<-     
# 4  0.001  0.955       0   10 #46 na.fill.zoo         
# 5  0.008  3.838       0   19 #46 na.fill.zoo/[<-     
# 6  0.003  0.959       0    2 #52 na.fill.zoo         
# 7  0.006  0.972       0   21 #52 na.fill.zoo/[<-     
# 8  0.001  0.486       0    0 #57 na.fill.zoo/seq_len 
# 9  0.005  0.959       0    6 #66 na.fill.zoo         
# 10 0.124 11.573       0   34 #66 na.fill.zoo/[

几乎所有的时间都花在了子集化上zoo object:

lineprof("[.zoo"(zoo.dat, 2:999999))
#    time  alloc release dups          ref            src
# 1 0.004  0.004       0    0 character(0)               
# 2 0.002  1.922       0    4           #4 [.zoo/coredata
# 3 0.038 11.082       0   29          #19 [.zoo/zoo     
# 4 0.004  0.000       0    1          #28 [.zoo

几乎所有的时间子集都花在构造一个新的动物园对象上zoo功能：

lineprof(zoo(y[2:999999], 2:999999))
#    time alloc release dups                ref        src
# 1 0.021 4.395       0    8 c("zoo", "unique") zoo/unique
# 2 0.012 0.477       0    8  c("zoo", "ORDER") zoo/ORDER 
# 3 0.001 0.477       0    1              "zoo" zoo       
# 4 0.001 0.954       0    0      c("zoo", ":") zoo/:     
# 5 0.015 3.341       0    5              "zoo" zoo

设置新的动物园对象所需的各种操作（例如确定唯一的时间点并对它们进行排序）。

总之，zoo包似乎通过构造一个新的 Zoo 对象而不是使用当前 Zoo 对象的内部结构，为其滚动平均操作增加了很多开销；与基本 R 实现相比，这会造成 10 倍的减速，与 Rcpp 实现相比，会造成 100 倍的减速。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么与简单的 Rcpp 实现相比，zoo::rollmean 慢？的相关文章

融化R中的下半矩阵

如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
dplyr 返回每个组的全局平均值，而不是每个组的平均值

有人可以解释一下我在这里做错了什么 library dplyr temp lt data frame a c 1 2 3 1 2 3 1 2 3 b c 1 2 3 1 2 3 1 2 3 temp gt group by temp 1 g
将第 N 行上的 NA 行插入 data.frames 列表，其中 N 来自列表

经过几个小时后我发现自己无法解决以下问题我有一个数据框列表我想分别向每个 DF 插入而不是替换一行或多行 NA 始终至少一行要插入的 NA 数量存储在单独的列表中为了说明这一点我有以下两个列表 list of datafra
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以
我可以使用哪个 R 函数来查找两条线的交点？

我刚刚研究了 stackoverflow 上所有的在 R 中寻找交集问题它们要么是关于曲线要么是关于分布像这个 https stackoverflow com questions 20519431 finding point of
更新 R6 对象实例中的方法定义

如何更新 R6 类实例的方法定义正如我所期望的 S3 使用当前的方法定义对于 R5 参考类我可以使用 myInstance myInstance copy 在 R6 中我尝试了 myInstance myInstance clone
sapply - 保留列名称

我试图总结数据集中许多不同列变量的平均值标准差等我已经编写了自己的汇总函数以准确返回我需要和正在使用的内容sapply立即将此函数应用于所有变量它工作正常但是返回的数据帧没有列名我似乎甚至无法使用列号引用重命名它们也就是说
在 Shiny 中显示反应式 htmlTable 表格

我正在制作我的第一个 Shiny 应用程序但找不到任何有关如何显示使用 htmlTable 包创建的表格的示例我基本上想在按下按钮时创建一个表格并显示它 Shiny 显示 html 代码而不是表格我不知道用什么替换服务器部分中的 re
如何按定义的顺序将图像合并到一个文件中

我有大约 100 张图像 png 我不想手动执行此操作而是希望将它们按照定义的顺序基于文件名并排放置在一个 pdf 中每行 12 个图像有人有什么建议吗我按照下面托马斯告诉我的方法尝试了它把它们贴在旁边有一个黑边我怎样才能去
为什么这个 R ggplot2 代码会显示一个空白的显示设备？

虽然 SO 通常不用于帮助解决错误但这个显示了特别简单且特别烦人的行为如果你是一个ggplot2用户您可以在 10 秒或更短的时间内重现它正如这个 GitHub 问题 ggplot gtable 创建空白显示 https githu
增加雷达图中长轴标签的空间

我想创建一个雷达图ggirahExtra ggRadar 问题是我的标签很长并且被剪掉了我想我可以通过添加在标签和绘图之间创建更多空间margin margin 0 0 2 0 cm to element text in axis tex
要在子集中显示的非数字条目的维恩图

我有以下数据框 SET1 SET2 SET3 par1 par2 par1 par2 par3 par2 par3 par4 par5 我想制作一个维恩图其中所有这些 parX 元素都显示在各自的子集中即作为标签而不仅仅是重叠元素的数

随机推荐

Cypress 装置 - 无法读取未定义的属性（读取“数据”）

我正在尝试使用固定装置来保存不同测试的数据特别是用户凭据这是代码的示例当进行第二次测试时我得到了 Cannot read properties of undefined reading data 有什么想法以及如何解决这个问题吗这
PHP 删除点和连字符

您好我需要从变量时间和日期中删除点和连字符这是我的代码 todaydate date Y m d n time utc mktime date G date i date s NowisTime date G i s time utc
Supervisorctl 不使用 Sqs 我得到了错误

安装并配置后supervisor我有一些工作正在排队LaravelWeb应用程序我的服务器操作系统是centOs运行后supervisor我收到这个错误 Symfony Component Debug Exception FatalThr
不区分大小写 preg_replace_callback

在下面的函数中我想匹配关键字不区分大小写应匹配蓝色瑜伽垫和蓝色瑜伽垫但是目前仅当关键字大小写相同时才匹配 mykeyword 蓝色瑜伽垫 post gt post content preg replace callback b
释放模式下不显示菜单

我希望我为测试条目创建的菜单应该处于调试模式但是当我发布启动我的应用程序时不应为测试条目显示菜单有人可以帮助我吗检查IS DEBUG MODE在您的应用程序中标记并在其中添加代码 Use PackageManager得到一个Ap
如何去掉不必要的括号？

Same as this https stackoverflow com questions 10999835 regular expression to remove multiple parenthesis但是JavaScript 几个
将外部 JavaScript（来自 CDN）捆绑到 React 组件中

有哪些选项可以将外部 javascript sdk 捆绑到 React 组件中我尝试在index html中包含javascript并通过window xyz引用它它运行良好但我无法进行生产构建因为 javascript 不是以这种
C# 中的 JSON-RPC 客户端示例代码

我需要一个简单的 C JSON RPC 1 0 客户端最好使用 NET 2 0 或更高版本我查看了 JRock 0 9 他们有几个示例包括 Yahoo reader 但示例演示的是 JSON 而不是 JSON RPC 我知道我可以使用
如何从 SQL 转换为 NoSQL/MapReduce？

我有使用关系数据库的背景但最近开始涉足 CouchDB 并对一些非关系操作在 SQL 中很简单在 CouchDB 中并不是一流函数感到惊讶如果您花点时间将下面的每个 SQL 语句映射到其 MapReduce 等效项我将不胜感激 S
x86 汇编等式 vs =

我正在上一门 x86 汇编语言课程它的进展速度相当快本书一直在做一件事但没有提及它是如何工作的那就是在定义数据时使用 equ 和运算符所以看起来 equ 是用来定义常量的但是是一样的吗如果我有一些代码 data count
文件下载器中的基本访问身份验证问题

我在从互联网下载应用程序中的二进制文件 zip 文件时遇到问题我必须使用基本访问身份验证来授权对文件的访问但服务器响应始终是 HTTP 1 0 400 Bad request String authentication this lo
如何调试 Node.js 服务器？调试器跳过我的断点！（使用VSCode）

我正在尝试使用自定义服务器调试 Next js 应用程序该服务器通常使用dev执行的 Yarn 脚本node server js VSCode 包含 Node js 调试扩展和本指南 https code visualstudio com
Chart.js 在画布上单击时获取最近的点

单击画布上的任意位置时有没有办法获得最近的点也许以某种方式收获核心最近方法谢谢我想你会发现getElementsAtXAxis很有帮助基本上 getElementsAtXAxis有一个非常相似的行为getElementsAtEv
html 表单 - 摆脱问号和方程式

这是我的代码 if request path employees
C# xml 文档

目的是什么 xml随组件一起提供的文档文件 dll files 我知道如何构建一个例如这里 http msdn microsoft com en us library aa288481 28VS 9 0 29 aspx 但是它们有什么用呢
如何确定 Node.js 中导致 UnhandledPromiseRejectionWarning 的原因？

我已经围绕 async await 库构建了我的 Node js 应用程序并且它在大多数情况下都运行良好我遇到的唯一麻烦是每当未履行承诺时我都会收到以下错误的一些变体 node 83333 UnhandledPromiseRejec
C#.Net 面板控制和 MDI 子表单 - 问题

您好我被困在带有面板控制的 MDIform 中我有一个面板控件停靠填充到父 MDI 窗体当我尝试使用菜单单击事件打开新的子窗体时子窗体不会显示在 MDI 容器中经过几次调试我将面板控件的visible属性设置为false 现
将 RCurl 与 SFTP 结合使用

我正在尝试使用ftpUpload第一次在 RCurl 包中我尝试访问的站点使用 sftp 协议我已确保安装包含建立安全连接功能的 libcurl 版本 SFTP 被列为 RCurl 可用的协议之一 curlVersion protoco
Sed - 用充满奇怪字符的变量替换字符串

我正在使用 sed 将文件中的字符替换为变量该变量基本上是读取文件或网页的内容其中包含多个类似散列的字符串如下所示这些字符串是随机生成的 define AUTH KEY CVo BO Qt1B GE h2 yU7h 5 wRV gt
为什么与简单的 Rcpp 实现相比，zoo::rollmean 慢？

zoo rollmean是一个有用的函数它返回时间序列的滚动平均值对于矢量x长度n和窗口大小k它返回向量c mean x 1 k mean x 2 k 1 mean x n k 1 n 我注意到我正在开发的一些代码似乎运行缓慢因此我使

为什么与简单的 Rcpp 实现相比，zoo::rollmean 慢？

为什么与简单的 Rcpp 实现相比，zoo::rollmean 慢？ 的相关文章

随机推荐

热门标签

为什么与简单的 Rcpp 实现相比，zoo::rollmean 慢？的相关文章