r 根据值（不是行数或日期/时间变量）计算滚动平均值

2023-11-27

我对 R 中用于计算滚动平均值的所有软件包都很陌生，我希望你能给我指明正确的方向。

我有以下数据作为示例：

ms <- c(300, 300, 300, 301, 303, 305, 305, 306, 308, 310, 310, 311, 312,
    314, 315, 315, 316, 316, 316, 317, 318, 320, 320, 321, 322, 324,
    328, 329, 330, 330, 330, 332, 332, 334, 334, 335, 335, 336, 336,
    337, 338, 338, 338, 340, 340, 341, 342, 342, 342, 342)
correct <- c(1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0,
         1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1,
         1, 0, 0, 1, 0, 0, 1, 1, 0, 0)
df <- data.frame(ms, correct)

ms是以毫秒为单位的时间点，correct是特定动作是否正确执行
（1 = 正确，0 = 不正确）。

我现在的目标是计算指定毫秒数窗口内的正确百分比（或平均值）。正如您所看到的，某些时间点缺失，某些时间点出现多次。因此，我不想根据行号进行过滤。我研究了一些软件包，例如“tidyquant”，但在我看来，这些类型的软件包需要时间/日期变量而不是数值变量来确定平均值的窗口。有没有办法指定窗口上的数值df$ms?

为了完整起见，这里是一个使用的答案数据表 to 非等值连接中的聚合.

OP 已澄清comments，他正在寻找 5 ms 的滑动窗口，即300-304、301-305、302-306 等窗口.

由于OP的数据集中没有302 ms的数据点，因此需要填充缺失值。

library(data.table)
ws <- 5   # define window size
setDT(df)[SJ(start = seq(min(ms), max(ms), 1))[, end := start + ws - 1], 
          on = .(ms >= start, ms <= end),
          .(share_correct = mean(correct)), by = .EACHI]

     ms  ms share_correct
 1: 300 304     0.4000000
 2: 301 305     0.0000000
 3: 302 306     0.2500000
 4: 303 307     0.2500000
 5: 304 308     0.2500000
 6: 305 309     0.2500000
 7: 306 310     0.2500000
 8: 307 311     0.0000000
 9: 308 312     0.2000000
10: 309 313     0.2500000
11: 310 314     0.2000000
12: 311 315     0.4000000
13: 312 316     0.4285714
14: 313 317     0.2857143
15: 314 318     0.3750000
16: 315 319     0.4285714
17: 316 320     0.4285714
18: 317 321     0.4000000
19: 318 322     0.4000000
20: 319 323     0.2500000
21: 320 324     0.4000000
22: 321 325     0.3333333
23: 322 326     0.5000000
24: 323 327     1.0000000
25: 324 328     1.0000000
26: 325 329     0.5000000
27: 326 330     0.2000000
28: 327 331     0.2000000
29: 328 332     0.4285714
30: 329 333     0.3333333
31: 330 334     0.2857143
32: 331 335     0.5000000
33: 332 336     0.3750000
34: 333 337     0.2857143
35: 334 338     0.3000000
36: 335 339     0.3750000
37: 336 340     0.3750000
38: 337 341     0.4285714
39: 338 342     0.4000000
40: 339 343     0.4285714
41: 340 344     0.4285714
42: 341 345     0.4000000
43: 342 346     0.5000000
     ms  ms share_correct

如果 OP 仅对数据集中存在起点的窗口感兴趣，则可以简化代码：

setDT(df)[SJ(start = unique(ms))[, end := start + ws - 1], 
          on = .(ms >= start, ms <= end),
          .(share_correct = mean(correct)), by = .EACHI]

     ms  ms share_correct
 1: 300 304     0.4000000
 2: 301 305     0.0000000
 3: 303 307     0.2500000
 4: 305 309     0.2500000
 5: 306 310     0.2500000
 6: 308 312     0.2000000
 7: 310 314     0.2000000
 8: 311 315     0.4000000
 9: 312 316     0.4285714
10: 314 318     0.3750000
11: 315 319     0.4285714
12: 316 320     0.4285714
13: 317 321     0.4000000
14: 318 322     0.4000000
15: 320 324     0.4000000
16: 321 325     0.3333333
17: 322 326     0.5000000
18: 324 328     1.0000000
19: 328 332     0.4285714
20: 329 333     0.3333333
21: 330 334     0.2857143
22: 332 336     0.3750000
23: 334 338     0.3000000
24: 335 339     0.3750000
25: 336 340     0.3750000
26: 337 341     0.4285714
27: 338 342     0.4000000
28: 340 344     0.4285714
29: 341 345     0.4000000
30: 342 346     0.5000000
     ms  ms share_correct

在这两种情况下，包含间隔的 data.table[start, end]是动态创建的并正确连接到df。在此期间非等值连接，中间结果立即按连接参数分组（by = .EACHI) 并汇总。注意闭区间习惯上符合OP的预期。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r 根据值（不是行数或日期/时间变量）计算滚动平均值的相关文章

从组成员数据创建加权图

假设我有一个 R 数据集指示组内的个体这是一个例子 grp lt c 1 1 1 2 2 2 2 3 3 3 4 4 4 5 5 ind lt c A C D B C D E A D E B F E A F data frame grp
如何根据R中的条件创建新变量

我正在尝试根据某些条件创建一个新变量我的数据看起来像 a b 1 NA 2 3 3 3 NA 2 NA NA 我想要的是一个变量c这样 when a is not NA b is NA c a when a is NA b is not
将不规则时间序列拆分为规则月平均值 - R

为了确定季节性对能源使用的影响我需要将计费数据库中的能源使用信息与每月温度进行调整我正在使用一个计费数据集其中包含不同长度以及开始日期和结束日期的账单并且我希望获得每个月内每个帐户的月平均值例如我有一个计费数据库具有以下特征
如何从包含 htmlwidget 的 rmarkdown 文件生成 md 文件

我正在用这个 rmd 创建一个 html 文件 title test author me date r Sys Date output html document r data HairEyeColor rpivotTable rpivot
为什么连接终止

我正在尝试使用随机森林分类模型H2OR 内部的库训练集有 7000 万行和 25 个数字特征总文件大小为 5 6 GB 验证文件的大小为 1 GB 我的系统有 16 GB RAM 和 8 核 CPU 系统成功读取 H2O 对象中的两个文
R ggplot2 比例 alpha 离散以显示在图例中

我正在尝试绘制两个因素压力和性别的图并使用 alpha 值来传达性别这是我的代码和结果图 ggplot subset df zfish data overall long day day 01 measure distance fr
在 expr *之前*执行的任务处理程序

是否有运行代码的回调before提示输入expr被评价通过 SO CRAN 和一些谷歌搜索发现了我怀疑的答案当前的 REPL 实现不可能如果我错过了类似详细的重复讨论我深表歉意我对addTaskCallback 及其函数族正在阅
如何在R中对多个时间序列应用dtw算法？

Problem 我有不同车辆速度的时间序列我的最终目标是根据不同车辆在时间上的速度相似性对它们进行聚类因此我基本上需要生成一个距离矩阵其中每个单元格包含一对车辆速度时间序列之间的距离我想使用动态时间扭曲 dtw 作为距离度量所以
润滑mdy功能

我正在尝试转换以下内容但对其中一个日期 1 没有成功 4 2 10 变为 0010 04 02 有办法纠正这个问题吗谢谢维韦克 data lt data frame initialDiagnose c 4 2 10 14 01 200
是否有任何 R 函数可以将链接的值可视化为节点内的文本？

我正在使用 R 包networkD3绘制以下桑基图这些值设置链接的大小我需要一个在节点内添加与文本相同的值的函数 Library library networkD3 library dplyr Make a connection dat
R 脚本 - 如何在错误时继续执行代码

我编写了一个 R 脚本其中包含一个检索外部 Web 数据的循环数据的格式大多数时候是相同的但有时格式会以不可预测的方式发生变化并且我的循环崩溃停止运行有没有办法不管错误如何继续执行代码我正在寻找类似于 VBA 中的 On er
如何计算大型数据集的平均值

我正在使用一个数据集该数据集每天 24 小时每小时读取一次温度读数已有 100 多年的历史我想获得每天的平均温度以减少数据集的大小标题看起来像这样 YR MO DA HR MN TEMP 1943 6 19 10 0 73 1943
R数据表：如何找到特定单元格正下方的未知数量的空单元格并用编号字符串填充它们

我知道如何找到空的cells in a data table一般来说但这有点棘手我还没有完全弄清楚如何管理它可以说我有一个data table其中在df 2 1 包含我需要定位的关键字字符串智能触发在这种情况下仪器用户使用的智能
有没有办法在 R Shiny 应用程序加载时自动验证对 GoogleSheets 的访问？ Googlesheets4 身份验证问题

我目前正在使用 R Shiny 应用程序它利用 googlesheets4 从 GoogleSheet 读取数据我认识到身份验证对于访问 GoogleSheets 很重要因此我尝试使用 app R 文件中的以下代码对应用程序进行身份验
从数据框中的列中删除小数

我有一个数据框列中有数字这些数字是小数我想删除列中的小数和整数我的数据框expsrs看起来像这样 ENSG00000226823 1 15 14 4947 22 5606 13 5819 5 09327 16 8503 ENSG00
使用 mutate_if 和 Replace_na 替换数字列上的 NA

我想使用某些变体替换数字列中的 NAmutate if and replace na如果可能的话但无法弄清楚语法 df lt tibble first c a NA b second c NA 2 NA third c 10 NA NA
kableExtra：垂直对齐在多列 PDF 输出中不起作用

我想将 kableExtra 表中的所有列对齐到顶部这valign top 选项似乎并不能解决这里的问题此外由于某种原因第三列不知何故被放在第二列之上并且引用也不起作用下面的MWE是基于这个相关的SO问题它只需要2列 kabl
jQuery 选择和过滤 div 内的元素

我在选择和过滤 div 内的元素时遇到问题 HTML div div
prop.test 使用什么公式？

The prop test函数显然没有使用给定的公式here https onlinecourses science psu edu stat200 node 48创建置信区间那么使用什么公式下面是一个置信区间CI使用 prop tes
螺旋环绕文本

我看到在LaTeX 人们将文本包装成螺旋状 https tex stackexchange com questions 88751 text spirals with tikz如下所示我想在 R 中复制这个我虽然plotrix s ar

随机推荐

用于验证逻辑 && || 的正则表达式字符串中的运算符

我正在尝试创建一个正则表达式来验证逻辑字符串组合及其相应的开始和结束括号我一直在搞乱正则表达式象形文字模式但似乎无法让它正常工作主要是因为我完全缺乏对正则表达式模式的理解经过几个小时的 StackOverflow 和谷歌搜索这
从纬度和经度字段创建几何/地理字段 (SQL Server)

我有一个包含纬度和经度两个字段的视图我想创建一个新视图将这些纬度经度字段转换为几何地理字段不确定哪个最适合 ArcGIS 原始视图中的字段是双精度类型我希望它们在新视图中转换为空间类型目前我不确定如何将这些字段转换为空间类型
无效的捆绑包结构 - iOS

我尝试通过 Xcode 以及应用程序加载器向 Apple 商店提交应用程序但收到以下错误无效的捆绑结构不允许使用二进制文件 xx app xx 您的应用程序可能只包含一个可执行文件有关 iOS 应用程序包结构的信息请参阅捆绑包编
如何在 Windows 上的 python 2.7 virtualenv 上安装 python-ldap 而不进行编译

我使用 Windows 作为我的主要 python 2 7 开发环境我想在虚拟环境上安装 python ldap python ldap 包需要编译当然我无法在我的环境中编译它所以我尝试查找二进制文件以便通过 easy install
Android 相机，onPictureTaken(byte[] imgData, Cameracamera) 方法和 PictureCallback 从未被调用

我有一个自定义相机应用程序它可以在 SurfaceView 上预览相机视频输出并尝试拍照这些照片应该由 xzing 扫描仪 API 进行处理以解码图像中的任何条形码我的应用程序预览正确并且不会引发任何错误或期望但是我的 onPic
通过许可证或密钥保护Java应用程序[关闭]

Closed 这个问题需要多问focused 目前不接受答案我想制作一个仅在拥有密钥或许可证的计算机上运行的桌面应用程序如何实现这一目标这完全取决于您想要使其安全程度如何 Java的问题在于你可以对其进行反向编译因此如果有人愿意
Spark 合并具有不匹配架构的数据帧，无需额外的磁盘 IO

我想合并 2 个具有可能不匹配模式的数据帧 org apache spark sql DataFrame name string age int height int org apache spark sql DataFrame nam
如何在没有管理员权限的情况下判断驱动器是否经过 BitLocker 加密？

出于我的目的我需要知道的是驱动器的 DOS 路径的 BitLocker 加密状态像这样的东西 enum DriveEncryptionStatus Unprotected Protected Unknown DriveEncryptio
DirectX 11 像素着色器什么是 SV_POSITION？

我正在学习 DirectX 11 的 HLSL 我想知道 SV POSITION 究竟是什么它是顶点着色器的输出和像素着色器的输入 1 这是屏幕上每个像素的 x y z 还是物体的 x y z 2 为什么是4个32位浮点数 3 顶点输出需
Android - HTTP GET 请求

我开发了一种显然有效的 HTTP GET 方法 public class GetMethodEx public String getInternetData throws Exception new TrustAllManager new
如何在 Cakephp 3 中的 ajax 调用中定义 CSRF 令牌。另外，如何针对某些 ajax 请求关闭 CSRF

在Cakephp3中启用Csrf组件时我如何在ajax调用中使用它在这个beforeSendajax csrf token 的参数在 header 中设置有什么价值csrfToken 因为它给出了错误 csrfToken 未定义 be
Dockerfile 中的“AS base”和“AS build”有什么区别？

我想知道之间的区别 FROM mcr microsoft com dotnet core aspnet 2 1 stretch slim AS base and FROM mcr microsoft com dotnet core sdk
表格列大小调整

In Bootstrap 3 我可以申请col sm xx to the th中的标签thead并随意调整表格列的大小然而这在 bootstrap 4 中不起作用我怎样才能在 bootstrap 4 中实现类似的功能 thead th
在 Visual Studio Code 中调试 MSTest 单元测试

我正在尝试使用 Visual Studio Code 调试 MSTest 单元测试项目但测试只是运行并且从未到达断点这是我的 launch json version 0 2 0 configurations name NET Core
Maven：“读取原型目录时出错”，不在代理后面

Command mvn archetype generate DarchetypeArtifactId maven archetype quickstart DinteractiveMode false DgroupId org apach
返回 MySQL 查询的第 n 条记录

我希望从 MySQL 查询返回第二条第三条或第四条记录基于按 ID 升序的查询问题是我不知道 ID 只知道它是查询中的第三行 SELECT FROM table ORDER BY ID LIMIT n 1 1 它表示返回从记录 n
使用 babel 和 laravel-mix 将 ES6 转换为 ES2015

我的 Vue 组件中有 ES6 JavaScript 代码为了支持 IE 11 我需要使用 babel 和 laravel mix 将其转换为 ES5 代码我怎么做这是我的 webpack mix js 文件 let mix requ
正则表达式：匹配空格之间的单词

我试图用 python 中的正则表达式做一些相当简单的事情至少我是这么想的我想要做的是匹配字符串中的单词如果它前面和后面都有空格如果它位于字符串的开头则之前不需要空格如果它位于末尾则也不搜索空格 Example WordA W
verilog模块中的reg和wire有什么区别？

在verilog模块中我们什么时候应该使用reg以及什么时候应该使用wire 我还注意到有时输出会再次声明为 reg 例如 D 触发器中的 reg Q 我在某处读过这个过程赋值语句的目标输出必须是 reg 数据类型什么是程序赋值语句我
r 根据值（不是行数或日期/时间变量）计算滚动平均值

我对 R 中用于计算滚动平均值的所有软件包都很陌生我希望你能给我指明正确的方向我有以下数据作为示例 ms lt c 300 300 300 301 303 305 305 306 308 310 310 311 312 314 315

r 根据值（不是行数或日期/时间变量）计算滚动平均值

r 根据值（不是行数或日期/时间变量）计算滚动平均值 的相关文章

随机推荐

热门标签

r 根据值（不是行数或日期/时间变量）计算滚动平均值的相关文章