需要更快的滚动应用函数以及开始停止索引

2024-03-26

下面是一段代码。它给出滚动 15 分钟（历史）窗口的交易价格水平的百分位。如果长度为 500 或 1000，它运行得很快，但正如您所看到的，有 45K 个观测值，对于整个数据来说，它的运行速度非常慢。我可以应用任何 plyr 功能吗？欢迎任何其他建议。

贸易数据如下所示：

> str(trade)
'data.frame':   45571 obs. of  5 variables:
 $ time    : chr  "2013-10-20 22:00:00.489" "2013-10-20 22:00:00.807" "2013-10-20 22:00:00.811" "2013-10-20 22:00:00.811" ...
 $ prc     : num  121 121 121 121 121 ...
 $ siz     : int  1 4 1 2 3 3 2 2 3 4 ...
 $ aggress : chr  "B" "B" "B" "B" ...
 $ time.pos: POSIXlt, format: "2013-10-20 22:00:00.489" "2013-10-20 22:00:00.807" "2013-10-20 22:00:00.811" "2013-10-20 22:00:00.811" ...

这就是新列 trade$time.pos 之后数据的样子

trade$time.pos <- strptime(trade$time, format="%Y-%m-%d %H:%M:%OS") 

> head(trade)
                     time      prc siz aggress                time.pos
1 2013-10-20 22:00:00.489 121.3672   1       B 2013-10-20 22:00:00.489
2 2013-10-20 22:00:00.807 121.3750   4       B 2013-10-20 22:00:00.807
3 2013-10-20 22:00:00.811 121.3750   1       B 2013-10-20 22:00:00.811
4 2013-10-20 22:00:00.811 121.3750   2       B 2013-10-20 22:00:00.811
5 2013-10-20 22:00:00.811 121.3750   3       B 2013-10-20 22:00:00.811
6 2013-10-20 22:00:00.811 121.3750   3       B 2013-10-20 22:00:00.811

#t_15_index function returns the indices of the trades that were executed in last 15 minutes from the current trade(t-15 to t).
t_15_index <- function(data_vector,index) {
  which(data_vector[index] - data_vector[1:index]<=15*60)
}

get_percentile <- function(data) {
  len_d <- dim(trade)[1]  

  price_percentile = vector(length=len_d)  

  for(i in 1: len_d) {   

    t_15 = t_15_index(trade$time.pos,i)
    #ecdf(rep(..)) gets the empirical distribution of the the trade size on a particular trade-price level
    price_dist = ecdf(rep(trade$prc[t_15],trade$siz[t_15]))
    #percentile of the current price level depending on current (t-15 to t) subset of data
    price_percentile[i] = price_dist(trade$prc[i])
  }
  trade$price_percentile = price_percentile
  trade
}


res_trade = get_percentile(trade)

可能有一种方法可以加速滚动应用程序，但由于窗口大小的变化，我认为标准工具（例如rollapply）不起作用，尽管也许一些更熟悉它们的人会有想法。同时，您可以优化百分位计算。而不是使用ecdf它创建了一个具有所有相关开销的函数，您可以直接计算一个合适的近似值：

> vec <- rnorm(10000, 0, 3)
> val <- 5
> max(which(sort(vec) < val)) / length(vec)
[1] 0.9543
> ecdf(vec)(val)
[1] 0.9543
> microbenchmark(max(which(sort(vec) < val)) / length(vec))
Unit: milliseconds
expr      min       lq   median       uq      max neval
max(which(sort(vec) < val))/length(vec) 1.093434 1.105231 1.116364 1.141204 1.449141   100
> microbenchmark(ecdf(vec)(val))
Unit: milliseconds
expr      min       lq   median       uq      max neval
ecdf(vec)(val) 2.552946 2.808041 3.043579 3.439269 4.208202   100

大约提高 2.5 倍。对于较小的样本，改进更大。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

需要更快的滚动应用函数以及开始停止索引的相关文章

使用 R 读取和转换二进制原始数据

我有一个file https drive google com file d 0BxMpk0nhnJy6SFhxd2xuMzJYYlk edit usp sharing其中包含原始二进制数据和 ascii 它包含一个时间戳和一个代表速度的
使用pivot_longer将R中的多列变成一列[重复]

这个问题在这里已经有答案了我有一个dfpopulation看起来像这样未列出所有列和行 Region X1975 X1976 X1977 X2008 National Total 942420 93717 94974 132802 Be
R-在多个图的外缘绘制居中图例

我想在具有多个绘图的设备中的绘图区域之外绘制居中图例 SO 中提出了许多关于更改 R 图中图例位置的问题略有不同例如 1 R 组合图的通用标题和图例 https stackoverflow com questions 8736966 r
建模前减少因子水平数量

我有一个 2600 个级别的因子我想在建模之前将其减少到 10 我想我可以通过这样的操作来做到这一点如果一个因素列出的次数少于 x 次则应将其放入名为其他的存储桶中这是一些示例数据 df lt data frame colour
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
有没有一种简单的方法可以根据多个标准进行排名，从而保留 R 中的联系？

当单个标准排序良好时 rank 函数会返回明显的结果 rank c 2 4 1 3 5 1 2 4 1 3 5 当单个标准具有联系时排名函数默认情况下将平均排名分配给联系 rank c 2 4 1 1 5 1 3 0 4 0 1 5
以编程方式触发 R 传单中的标记鼠标单击事件以获得闪亮效果

我的问题与此相同在 R 传单中触发标记鼠标单击事件以获得闪亮效果 https stackoverflow com questions 56962857 trigger marker mouse click event in r leafl
具有动态变量数的公式

假设有一些 data framefoo data frame想要找到目标列的回归Y由其他一些专栏为此目的通常使用一些公式和模型例如 linear model lt lm Y FACTOR NAME 1 FACTOR NAME 2 fo
使用管道语法处理模型列表

我经常喜欢拟合和检查与 R 数据框中的两个变量相关的多个模型我可以使用如下语法来做到这一点 require tidyverse require broom models lt list hp exp cyl hp cyl map df m
连接多个用户的 R 闪亮会话

最小可重现示例 library shiny ui lt fluidPage actionButton button1 Run 1 actionButton button2 Run 2 server lt function session i
使用滑动窗口动画 ggplot 时间序列图

我正在寻找在不失去分辨率的情况下对长时间序列图进行动画处理的方法我希望视图能够平移数据显示从开始到结束的滑动子集假设我有以下内容 library ggplot2 library dplyr library gganimate df
从向量中删除元素在 R 中出现的时间量

我想从一个向量中删除元素在另一个向量中出现的时间就像我要减去它们一样鉴于我想要删除的元素向量中的每个元素也存在于我想要从中删除的主向量中 a lt c A B B C C C b lt c A B C C a a in b return
jupyter 中的 r 图形 - 无法启动 png() 设备

我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
R：根据元素长度从向量中删除元素

如何根据字符串的字符数或长度从字符串向量中删除元素 df lt c asdf fweafewwf af aewfawefwef awefWEfawefawef gt df 1 asdf fweafewwf af aewfawefwef aw
如何从R中的日期中提取月份

我正在使用lubridate封装并应用month从日期中提取月份的函数我在日期字段上运行了 str 命令得到了 Factor w 9498 levels 01 01 1979 01 01 1980 5305 1 1 1 1 1 1 1
如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
将不同的 grViz 组合成一个图

我想结合不同的DiagrammeR绘制成一个图形生成的图如下例所示 library DiagrammeR pDia lt grViz digraph boxes and circles a graph statement graph ov
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac

随机推荐

Go中没有startswith、endswith函数吗？

只是好奇地想知道为什么 Go 编程语言中的标准库中没有像startswith endswith 等标准函数 The strings http golang org pkg strings包装包含有前缀 http golang org pk
默认字符串初始化：NULL 还是空？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在颤动中按下后更改 ElevatedButton 的背景颜色，但我有三个，所以在选择时应该更改一个

在此输入图像描述 https i stack imgur com LpWw0 png 我有三个按钮当我按一个按钮时我不希望所有按钮都更改背景颜色只有选定的一个可以那么我该如何实现这一目标尝试以下代码希望对您有帮助 Create E
Azure linux上的Git推送节点js失败，kudu想要运行dotnet命令

从本地 git 推送到 Azure 应用服务 git 失败直到昨天为止这一直运作良好我真的不明白为什么dotnet当App在Linux中运行时参与Azure中的推送执行我在本地从 Windows Powershell 运行 git
使用多个配置文件配置 logback

我试图通过 springboot 下的配置文件分割我的 logback xml 这是我的方法 logback prod xml
如何从 Web 服务 JSON 数组或对象反序列化？

我在 Windows Phone 7 中创建了一个 Web 服务应用程序这是从下面的 uri 获取的 JSON 数组 id 4 name 班加罗尔 id 1 name 钦奈 id 3 name 海得拉巴 id 2 name 孟买 List
如何实现从一个进程到另一个进程的快速上下文切换？

我需要在沙箱进程上运行不安全的本机代码并且需要减少进程切换的瓶颈两个进程控制器和沙箱共享两个自动重置events http msdn microsoft com en us library windows desktop aa964
为什么 C 允许缺少函数声明？

今天我们遇到了一个不寻常的现象一位同事在他的代码中调用了一个正常运行的函数这触发了 libc gethostbyname 中的段错误令人费解的是相同的函数在同一运行时的其他源文件中运行没有问题令人惊讶的是当使用 valgrind
如何使用 OpenCV Viz 和 ARUCO 转换增强现实应用的 3D 模型

我正在开发一个简单的基于标记的增强现实应用程序OpenCV 可视化 and ARUCO 我只想在标记上可视化 3D 对象 PLY 格式我可以使用 ARUCO 毫无问题地运行标记检测和姿态估计返回旋转和平移向量我可以在 Viz 窗口中可
如何将函数的python代码打印到终端？ [复制]

这个问题在这里已经有答案了我有一个系统在其中我不断地试验函数的内容然后运行程序由于我经常打开许多终端窗口因此有时我并不确切知道哪个版本的函数属于哪个终端窗口有没有办法将特定函数的源代码打印到终端好吧感谢 Hoopdady 在
重新采样数据帧，计算间隔内不同列的最小值、最大值以及第一列和最后一列

我有一个数据库其中包含 1 分钟的交易数据条目包括开盘价最高价最低价和收盘价我想创建一个函数删除某些时间戳以仅保留 30m 条目但是需要更新该时间戳的值以反映新的周期我执行了以下代码但有一个问题 def time sta
调用 Objective-C 函数时将值返回给 JavaScript

我一直在使用WebViewJavascriptBridge https github com marcuswestin WebViewJavascriptBridge在 iOS 应用程序中桥接 Objective C 和 JavaScrip
IF 语句中值之前或之后的变量

这两种说法有区别吗 if a hello and if hello a 我注意到像 Wordpress 这样的应用程序倾向于使用后者而我通常使用前者我似乎记得不久前读过一些文章为后者提供了理由但我不记得其背后的推理没有区别使用它
C# 字符串比较方法返回第一个不匹配的索引

是否存在现有的字符串比较方法该方法将根据两个字符串之间第一次出现的不匹配字符返回一个值 i e string A 1234567890 string B 1234567880 我想返回一个值让我可以看到匹配中断的第一次出现是 A 8
如何在 Xcode 中 #include

include
css word-wrap：断词不起作用

我有两个内联跨度代码示例 div class comment content span class comment author span span class comment text span div 和 scss 示例 commen
从 AJAX 请求获取页面内容后，我可以选择标签元素，但无法选择正文元素

我通过 AJAX 请求获得了一个 html 页面 ajax async true method GET url linkPage cache true success function data console log data 我得到的数
无法绑定到“x”，因为它不是“y”的已知属性

我有一个有角度的站点其中包含另一个组件内的一个组件我正在使用路由和延迟加载外部组件 ComponentA 内部组件 ComponentB 取决于第 3 方指令这是概念证明 https plnkr co edit 7maVz2vO9LK
JavaScript：JSLint 错误“for in 的主体应包含在 if 语句中，以过滤原型中不需要的属性”

我正在使用JSLint http JSLint com确保我的 JavaScript 是严格的的工具我收到以下错误但不明白如何修复它 The body of a for in should be wrapped in an if s
需要更快的滚动应用函数以及开始停止索引

下面是一段代码它给出滚动 15 分钟历史窗口的交易价格水平的百分位如果长度为 500 或 1000 它运行得很快但正如您所看到的有 45K 个观测值对于整个数据来说它的运行速度非常慢我可以应用任何 plyr 功能吗欢迎任

需要更快的滚动应用函数以及开始停止索引

需要更快的滚动应用函数以及开始停止索引 的相关文章

随机推荐

热门标签

需要更快的滚动应用函数以及开始停止索引的相关文章