R：使用基于时间的窗口计算按 id 变量分组的不规则时间序列的滚动总和

2024-03-13

我喜欢 R，但有些问题实在是太难了。

面临的挑战是在基于时间的窗口大于或等于 6 小时的不规则时间序列中找到滚动总和小于 30 的第一个实例。我有该系列的样本

Row Person  DateTime    Value
1   A   2014-01-01 08:15:00 5
2   A   2014-01-01 09:15:00 5
3   A   2014-01-01 10:00:00 5
4   A   2014-01-01 11:15:00 5
5   A   2014-01-01 14:15:00 5
6   B   2014-01-01 08:15:00 25
7   B   2014-01-01 10:15:00 25
8   B   2014-01-01 19:15:00 2
9   C   2014-01-01 08:00:00 20
10  C   2014-01-01 09:00:00 5
11  C   2014-01-01 13:45:00 1
12  D   2014-01-01 07:00:00 1
13  D   2014-01-01 08:15:00 13
14  D   2014-01-01 14:15:00 15

For Person A, Rows 1 & 5 create a minimum 6 hour interval with a running sum of 25 (which is less than 30).
For Person B, Rows 7 & 8 create a 9 hour interval with a running sum of 27 (again less than 30).
For Person C, using Rows 9 & 10, there is no minimum 6 hour interval (it is only 5.75 hours) although the running sum is 26 and is less than 30.
For Person D, using Rows 12 & 14, the interval is 7.25 hours but the running sum is 30 and is not less than 30.

给定 n 个观测值，必须比较 n*(n-1)/2 个区间。例如，当 n=2 时，只有 1 个区间需要评估。对于 n=3，有 3 个间隔。等等。

我假设这是子集和问题的变体（http://en.wikipedia.org/wiki/Subset_sum_problem http://en.wikipedia.org/wiki/Subset_sum_problem)

虽然可以对数据进行排序，但我怀疑这需要一个强力解决方案来测试每个间隔。

任何帮助，将不胜感激。

编辑：这是 DateTime 列格式为 POSIXct 的数据：

df <- structure(list(Person = structure(c(1L, 1L, 1L, 1L, 1L, 2L, 2L, 
2L, 3L, 3L, 3L, 4L, 4L, 4L), .Label = c("A", "B", "C", "D"), class = "factor"), 
DateTime = structure(c(1388560500, 1388564100, 1388566800, 
1388571300, 1388582100, 1388560500, 1388567700, 1388600100, 
1388559600, 1388563200, 1388580300, 1388556000, 1388560500, 
1388582100), class = c("POSIXct", "POSIXt"), tzone = ""), 
Value = c(5L, 5L, 5L, 5L, 5L, 25L, 25L, 2L, 20L, 5L, 1L, 
1L, 13L, 15L)), .Names = c("Person", "DateTime", "Value"), row.names = c("1", 
"2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13", 
"14"), class = "data.frame")

我发现这在 R 中也是一个难题。所以我给它做了一个包！

library("devtools")
install_github("boRingTrees","mgahan")
require(boRingTrees)

当然，您必须正确计算出上限的单位。

如果您有兴趣，这里还有更多文档。https://github.com/mgahan/boRingTrees https://github.com/mgahan/boRingTrees

对于数据df@beginneR 提供的，您可以使用以下代码来获取 6 小时的滚动总和。

require(data.table)
setDT(df)
df[ , roll := rollingByCalcs(df,dates="DateTime",target="Value",
                    by="Person",stat=sum,lower=0,upper=6*60*60)]

    Person            DateTime Value roll
 1:      A 2014-01-01 01:15:00     5    5
 2:      A 2014-01-01 02:15:00     5   10
 3:      A 2014-01-01 03:00:00     5   15
 4:      A 2014-01-01 04:15:00     5   20
 5:      A 2014-01-01 07:15:00     5   25
 6:      B 2014-01-01 01:15:00    25   25
 7:      B 2014-01-01 03:15:00    25   50
 8:      B 2014-01-01 12:15:00     2    2
 9:      C 2014-01-01 01:00:00    20   20
10:      C 2014-01-01 02:00:00     5   25
11:      C 2014-01-01 06:45:00     1   26
12:      D 2014-01-01 00:00:00     1    1
13:      D 2014-01-01 01:15:00    13   14
14:      D 2014-01-01 07:15:00    15   28

原来的帖子对我来说很不清楚，所以这可能不正是他想要的。如果提供具有所需输出的专栏，我想我可以提供更多帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

TimeSeries

groupedtable

R：使用基于时间的窗口计算按 id 变量分组的不规则时间序列的滚动总和的相关文章

使用 ggplot 构面时增加闪亮的绘图大小

有没有办法增加绘图窗口的大小shiny取决于在一个中使用的面的数量ggplot图也许使用垂直滚动例如使用下面的示例当输入为 A 有三个方面情节看起来不错当选项 B 选择绘图数量会增加但绘图窗口保持相同大小导致绘图太小是否有
R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
使用 pkg:sjPlot 函数创建一个生成部分斜体单元格的数据框

我正在尝试创建一个简单的数据表其中 Coral taxon 列中的属名称为斜体而 spp 列中的属名称为斜体属名后面的部分不大写我尝试使用 expression 函数对 Coral taxon 的每一行进行编码但没有成功 sum
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d
对 data.table 中的列表列执行操作

假设我有一个data table 例如dt lt data table foo list 1 3 4 6 bar c 2 7 如何使用 dt 框架对 foo 向量列表执行操作操作可能是将 bar 添加到 foo 返回列表 3 5 11 1
如何使用 R 将每个文件的数据添加为附加行，从而将不同的 .csv 文件合并为一个完整的文件？

我有几个不同的文件夹它们都包含一个 csv 文件所有这些 csv 文件都有一个单独的列其中包含实验的一种条件的数据我想以将每个文件的数据添加为新列的方式合并这些 csv 文件目前它看起来像这样 C1 csv 102 106 15
dplyr 返回每个组的全局平均值，而不是每个组的平均值

有人可以解释一下我在这里做错了什么 library dplyr temp lt data frame a c 1 2 3 1 2 3 1 2 3 b c 1 2 3 1 2 3 1 2 3 temp gt group by temp 1 g
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
列出 R 数据文件的内容而不加载

我有时用print load myDataFile RData 当我加载数据文件时列出它的内容有没有办法列出内容而不加载数据文件中包含的对象我认为如果不加载对象就无法做到这一点解决方案可能是使用包装器将 R 对象保存到save 该函数
在R中循环子文件夹

我正在 R 环境中包含多个子文件夹的文件夹中工作我想要循环遍历多个子文件夹然后在每个子文件夹中调用 R 脚本来执行我想出了下面的代码但我的代码似乎添加了到子文件夹列表我收到错误文件中的错误文件名 r 编码编码无效的描述
如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch

随机推荐

PHP 有没有办法在 foreach 中重新启动循环，或更改 switch 中的测试值？

如果我正在循环一个数组并且在其中一个循环的中间我发现一些小问题改变一些东西并且需要重试有没有办法跳回到循环顶部而不从数组中获取下一个值我怀疑这是否存在但它会是一些关键字例如continue or break 事实上它很像c
C# 的 CSV 解析器/阅读器？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
将 astropy.table.columns 转换为 numpy 数组

我想绘制points points np random multivariate normal mean 0 0 cov 0 4 9 9 10 size int 1e4 print points 2 50584156 2 77190372
PostgreSQL 没有自增功能？

我有一个用 Java 编写的测试应用程序用于在 MySQL PostgreSQL Oracle 和 Firebird 数据库除其他外中创建索引和非索引表难道只是 PostgreSQL 不允许自动增量功能的情况吗如果没有拥有索引列
等待 alamofire 完成获取请求并创建对象[重复]

这个问题在这里已经有答案了我在等待一个对象制作完成后遇到问题然后我希望更新我的用户界面如果我运行该函数它将立即出现索引错误因为它试图从第一个对象中获取一些文本而该对象尚不存在任何人都可以帮助我吗 func getMovieDa
Android 中的身份验证

我正在使用客户端 Android 应用程序开发基于 Django 的 Web 应用程序在 Web 端身份验证是借助存储在 cookie 中的会话 ID 完成的默认的 Django 实现但我无法弄清楚如何在 Android 客户端中对
React Typescript 故事书通过 onChange 回调实现自定义输入组件，然后将 State 值返回到输入

我目前正在用故事书实现一个 React 定制输入组件我希望实现的是这个定制的输入组件将需要几个参数其中一个参数是onChangeInput 稍后它将负责为输入值设置状态值下面是我的主要输入组件实现输入 tsx import Re
Pandas 将 groupby 之后的值计数扩展为列

作为特征工程的一部分我想使用 groupby 之后的列计数作为模型的特征这是我尝试过的 gt gt gt import pandas as pd gt gt gt from collections import Counter gt g
如何获取给定捕获的正则表达式组？

我正在使用正则表达式解析 CSS3 选择器例如选择器a gt b c d分为 Selector a gt b c d SOSS a b c d TypeSelector a b c d Identifier a b c d Combin
在 C++/CLI 包装类中翻译异常的最佳实践

我正在为抛出异常的现有本机类编写 NET 包装类在本机 C 异常和托管异常之间进行转换的最佳实践是什么一对一地捕获并重新抛出例如 std invalid argument gt System System ArgumentExcept
连接 MySQL 中表中的单行

我有两张桌子players and scores 我想生成一个如下所示的报告 player first score points foo 2010 05 20 19 bar 2010 04 15 29 baz 2010 02 04 13 现
有 Hadoop 的官方 Docker 镜像吗？

有谁在哪里有 Hadoop 的官方 docker 镜像吗纱线 HDFS 我想在 docker 镜像中使用它们目前还没有官方的 Hadoop Docker 镜像但 Docker Hub 上有许多用户贡献的镜像包括this https
PyCharm 3.0 找不到 PyQt5

我安装了 Python 3 3 2 x86 和 x64 版本并在其上安装了 PyQt5 1 Recently I installed PyCharm 3 0 Community Edition and configured to work
如何使用最新的应用程序目录获取 nextjs 13 应用程序内的路由路径名？ “服务器端”[重复]

这个问题在这里已经有答案了我正在 Next js 13 中使用实验性的 appDir 并且想要获取请求的 URL 路径在进行重定向之前我需要此信息来设置搜索参数我想获取服务器端的请求路径有一个与此类似的问题如何使用 Next 1
我们可以在 JSF2 复合组件中拥有组件范围的 bean 吗？

我想知道如何创建组件范围 bean 或者说复合组件内的局部变量这些变量对于复合组件的实例来说是私有的并且只要该实例存在就一直存在下面是更多详细信息并通过示例进行了解释假设有一个计算器组件允许用户输入数学表达式并计算其值
将react-native与react-relay一起使用时，引用节点模块的箭头函数中的自动绑定被破坏

我正在使用react native和react relay 因此我有以下 babelrc 文件 sourceMaps both presets plugins babelRelayPlugin react native passPerPre
从 Python 调用 Cython C 函数

我有一个Cython http cython org 文件名为foo pyx包含以下功能 def add one int n cdef int m n 1 return m cdef int c add one int n return n
为什么使用 __get_free_pages() 进行顺序为 10 或 11 的页面分配通常会失败？

我的系统内存充足 24GB的服务器在我的系统中内核空间分配了320MB和120MB用于崩溃内核其余的内存用于其他目的但是当我使用 get free pages 分配顺序为 11 的连续页内核无法分配 2 10 页为什么根据制
Devise、Rolify 和 Cancan 到 ActiveAdmin

我正在使用 Devise Rolify 和 CanCan 开发一个应用程序我可以将其完全转变为由 ActiveAdmin 管理吗有相关文件吗我知道问题被提出已经有一段时间了但是当我在谷歌搜索时发现它时我想我可以发布一个答案来帮助其
R：使用基于时间的窗口计算按 id 变量分组的不规则时间序列的滚动总和

我喜欢 R 但有些问题实在是太难了面临的挑战是在基于时间的窗口大于或等于 6 小时的不规则时间序列中找到滚动总和小于 30 的第一个实例我有该系列的样本 Row Person DateTime Value 1 A 2014 01 01

R：使用基于时间的窗口计算按 id 变量分组的不规则时间序列的滚动总和

R：使用基于时间的窗口计算按 id 变量分组的不规则时间序列的滚动总和 的相关文章

随机推荐

热门标签

R：使用基于时间的窗口计算按 id 变量分组的不规则时间序列的滚动总和的相关文章