R 创建滑动窗口时间段内先前事件的统计

2024-04-02

任何人都可以帮助我解决使用 R 创建特定时间段内先前事件总和的问题吗？如果我不遵守协议，我深表歉意，这是我的第一个问题。

我有一系列 ID 和活动日期。在真正的 df 中，事件是日期时间，但为了让事情更简单，我在这里使用了日期。

我正在尝试创建一个变量，该变量是过去 2 年内该 ID 号（或 750 天，因为我不太关心闰年，但将其考虑在内）的先前事件数量的统计。

还有一个额外的问题，即某些 ID 在同一日期（以及真实 df 中的时间）会发生多个事件。我不想删除这些，因为在真实的 df 中还有一个不一定相同的附加变量。但是，总的来说，我想将同一日期发生的事件计数为一个事件，即，如果 ID 只有 2 个事件，但它们发生在同一天，则结果将为 0，或者前一个事件中可能有 3 行日期ID 为 2 年 - 但由于两个日期相同，因此结果为 2。我创建了一个结果向量，以给出 ID 7 有这样的示例后我所拥有的示例。

如果之前的 3 个事件都发生在同一天，则结果总和将为 1，并且 2 年内的任何后续事件

ID <- c(10,1,11,2,2,13,4,5,6,6,13,7,7,7,8,8,9,9,9,10,1,11,2,11,12,9,13,14,7,15,7)
event.date<-c('2018-09-09','2016-06-02','2018-08-20', '2018-11-03', '2018-07-10', '2017-03-08', '2018-06-16', '2017-05-20', '2016-04-02', '2016-07-27', '2018-07-15', '2018-06-15', '2018-06-15', '2018-01-16', '2017-10-07', '2016-08-17','2018-08-01','2017-01-22','2016-08-05', '2018-08-13', '2016-11-28', '2018-11-24','2016-06-01', '2018-03-26', '2017-02-04', '2017-12-01', '2016-05-16', '2017-11-25', '2018-04-01', '2017-09-21', '2018-04-01')
df<-data.frame(ID,event.date)

df<-df%>%
  arrange(ID,event.date)

结果列应该看起来像这样。

event.count <- c(0,1,0,0,1,0,0,0,1,0,1,1,2,2,0,1,0,1,2,3,0,1,0,1,2,0,0,1,1,0,0)
df$event.count<-event.count

我尝试了各种 if else 和使用 lag() 但无法得到我想要的

谢谢。

这是一个解决方案data.table.

减去2年event.date，您可以使用lubridate并减去years(2).

分组后by both ID and event.date，您可以对 2 年前和日期 (incbounds of between将排除上限和下限）。

Using uniqueN将防止重复的日期被多次计算。

library(data.table)
library(lubridate)

df$event.date <- as.Date(df$event.date)

setDT(df)[, new.event.count := uniqueN(df$event.date[df$ID == ID][
  between(df$event.date[df$ID == ID], 
          event.date - years(2), 
          event.date, 
          incbounds = FALSE)]),
          by = c("ID", "event.date")][]

Output

    ID event.date event.count new.event.count
 1:  1 2016-06-02           0               0
 2:  1 2016-11-28           1               1
 3:  2 2016-06-01           0               0
 4:  2 2018-07-10           0               0
 5:  2 2018-11-03           1               1
 6:  4 2018-06-16           0               0
 7:  5 2017-05-20           0               0
 8:  6 2016-04-02           0               0
 9:  6 2016-07-27           1               1
10:  7 2018-01-16           0               0
11:  7 2018-04-01           1               1
12:  7 2018-04-01           1               1
13:  7 2018-06-15           2               2
14:  7 2018-06-15           2               2
15:  8 2016-08-17           0               0
16:  8 2017-10-07           1               1
17:  9 2016-08-05           0               0
18:  9 2017-01-22           1               1
19:  9 2017-12-01           2               2
20:  9 2018-08-01           3               3
21: 10 2018-08-13           0               0
22: 10 2018-09-09           1               1
23: 11 2018-03-26           0               0
24: 11 2018-08-20           1               1
25: 11 2018-11-24           2               2
26: 12 2017-02-04           0               0
27: 13 2016-05-16           0               0
28: 13 2017-03-08           1               1
29: 13 2018-07-15           1               1
30: 14 2017-11-25           0               0
31: 15 2017-09-21           0               0
    ID event.date event.count new.event.count

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R 创建滑动窗口时间段内先前事件的统计的相关文章

条件格式 DT 中的样式

我想根据 B 列中的值对 A 列中的行进行着色下面的代码基于小插图中的示例Link https rstudio github io DT 010 style html 但仅显示两列的条件 mobile number by mobile f
OpenBUGS：伯努利分布中缺失值

我正在尝试通过 R R2OpenBUGS 使用 OpenBUGS 将观察时间建模为随机变量如果所有观察时间都可用没有 NA 则一切正常但如果我将其中一个时间设置为 NA 则什么也不会发生我使用 WinBUGS 测试了相同的代码
使用plot(...,add=T) 叠加栅格图会导致最终图任意错位

我发现当我尝试使用plot add T 叠加多个栅格时如果我尝试将超过3 个栅格叠加在一起则后续图不会正确对齐栅格我的初衷是创建一个模拟土地覆盖的分类地图其中代表覆盖类别的颜色深浅随着我们模型投影的确定性而变化为此我创建了一个
使用 R 将多个数据帧写入 .csv 文件

我使用 lapply 将函数应用于多个数据框 data cleaned lt lapply data list shooter cleaning 然后根据主题编号例如 100 标记列表中每个结果数据帧 names data cleaned
绘制由 R 中的 caret 包训练的 SVM 线性模型

Purpose 我试图通过可视化 SVM 线性分类模型plot 我正在使用中提供的示例代码和数据kernlab包注意到了caret实际上通过训练 svmksvm函数参考这里的src代码 https github com topepo ca
data.table 对数字和文本变量分别进行分组

我正在尝试简化这个data table作用于数字变量和字符变量的两阶段过程例如取第一个元素textvar and sum每个数值变量考虑这个小例子 library data table dt lt data table grpvar
嵌套循环中的索引

我是 R 和这个网站的新手我的目标是创建一个 R 函数在 ggplot2 中生成特殊类型的箱线图这肯定是不必要的晦涩难懂的代码我首先需要通过计算稍后希望绘制的变量来处理其中的潜在输入我首先生成一些随机数据称为datos c1 r
如何使用 R markdown 和 bookdown 将图形列表和表格列表添加到目录中

我有一份报告 pdf 输出我想在附录中添加参考书目图表列表和表格列表我希望这三个元素出现在目录中我添加参考书目通过增加bibliography bibliography bib到我的 yaml 标头我直接用 LaTex 添加的图形
R 是解释型编程语言还是编译型编程语言？

R 是解释型编程语言还是编译型编程语言 The R FAQ https cran r project org doc FAQ R FAQ html What is R 003f说 R 的核心是一种解释型计算机语言
如何为 jQuery 制作 switch case？

我有这个 if else 语句它给了我奇怪的响应每当我首先选择输出时之后选择的任何其他内容都不会出现仅供参考我正在使用多重选择因此我可以选择并显示任意数量的内容 outputText hide armCB hide outp
如何将管道链 (magrittr) 的结果提供给对象

这是一个相当简单的问题但我无法通过 google stackexchange 找到答案并查看 magrittr 的文档如何提供通过 gt 连接的函数链的结果来创建向量我看到大多数人做的是 a lt data frame x c 1 3
按月/年间隔汇总每日数据

我并不经常需要在 R 中处理日期但我认为这相当简单我有一列代表数据框中的日期我只想创建一个新的数据框使用日期按月年总结第二列最好的方法是什么我想要第二个数据框这样我就可以将它提供给绘图您能提供的任何帮助将不胜感激编辑供
在for循环中重命名ggplot2图

我有一个关于在 for 循环中创建 ggplot2 图表根据迭代重命名它们然后在网格中排列图表的问题我想做类似这个虚拟示例的事情 library ggplot2 a c 1 2 3 b c 4 5 6 for i in c 1 5 x
在 R 中将列表列表转换为数据帧：Tidyverse 方式

我正在寻找将列表列表转换为 R 中的数据帧的 Tidyverse 方法 Create a list of lists a lt seq 1 10 1 b lt seq 1 20 2 Function to calculate the sum
在字符串中每个字母后面添加数字

我有几个具有固定格式的字符串格式为一个字母后跟一个数字例如 A3B1C7D1 但是如果字母后面的数字为 1 则字符串将写为 A3BC7D 我想做的是插入数字 1 然后将字符串转换为A3BC7D to A3B1C7D1 我的示例数据是
修改 GGplot2 对象

然而我很好奇是否可以添加任何特定的图例或将哪个物种对应于观察到的预期绘图中以分别知道它是哪个圆圈我目前使用的是一个名为 finches 的假数据集该包称为 cooccurr 它创建一个 ggplot 对象我很好奇如何实际编辑它以
R Markdown / Bookdown 中的水平规则导致错误

突然我在 Markdown Bookdown 中编织为 PDF 时遇到错误我的系统没有任何变化该错误是由水平规则引起的即 Markdown 中的任意位置或尽管两侧都有行空格我提供了一个简单的违规示例它不会合并成 PDF
在ggplot2中添加边框或背景以缩放图例guide_colorbar

我在 ggplot 图中有一个从白色到红色的颜色条并且白色边框在白色背景上不太明显有没有办法对图例中的刻度线进行不同的着色或在渐变比例周围添加边框这是一个最小的例子 df lt data frame x lt rnorm 10 y l
闪亮的演示文稿 (ioslides)：自定义 CSS 和徽标

我安装了以下内容 RStudio 预览版版本 0 98 864 2014 年 5 月 24 日 knitr 和shiny 的开发版本来自 devtools install github c yihui knitr rstudio shi
R：变换不规则时间字符串

我有两个不同的时间序列来自不同的数据帧具有不同的不规则格式但问题是相同的我只想提取小时分钟秒和毫秒时代系列看起来像这样 ts1 08 27 23 445 08 27 24 280 08 27 25 115 I tried st

随机推荐

Freemarker：从模板文件 (*.ftl) 调用静态 util 方法

在 Freemarker FTL 文件中我想调用StringUtils capatilize myString 例如 p You selected selectionString p p StringUtils capatilize se
绘制圆形渐变

我想绘制一个圆形渐变如下图所示我可以轻松管理径向渐变但我不知道如何做圆形渐变我正在考虑在一条线上绘制渐变然后将其转换为圆形这可能吗这就是我绘制径向渐变的方法 CGFloat a MIN self frame size widt
使用 codeigniter 403 的 Ajax 请求（禁止）

我正在尝试使用 Ajax 向 Codeigniter 中的控制器文件发送一个值但没有成功我已经搜索过这个问题现在这个问题在这里被提出了很多次但仍然找不到解决方案希望任何人都可以帮助我谢谢 Js file function sub
在堆栈上为 execve 创建一个 arg 数组

我想编写一个汇编程序通过 EXECVE 系统调用 0x3C 使用开关 al 执行程序 bin ls 手册页 man 2 execve 指出该调用需要三个值 int execve const char filename char const
通过 http 拉取大型存储库（大小超过 1GB）失败

存储库的大小超过 1GB 当我拉到 50 时出现错误 gt remote Counting objects 23891 done remote Compressing objects gt 100 19980 19980 done fat
如何仅在 log4j 中记录警告

在 Struts 2 应用程序中我们使用 log4j 进行日志记录我只想记录警告但是当我尝试在 log4j properties 中使用时 log4j rootLogger warn stdout 它也打印错误和致命日志我只想要警告
如何在 Visual Basic .NET 中从 Internet“读取”XML？

因此我正在 Visual Basic 2010 中创建一个程序它将处理来自 Internet 的大约 120 万个 XML 文件每个文件的 URL 格式如下 website com xmlfeed action number VARI
从 Android Wear 上的日历获取数据

我正在查询这样的日历数据 Constructor of the class mCursor context getContentResolver query CalendarContract Events CONTENT URI mColu
Axios 未传递 Content-Type 标头

我在后端运行一个 Odoo 实例并创建了一个公开 Web 控制器的自定义模块如下所示网页控制器 coding utf 8 from odoo import http import odoo from odoo http import
Linux/Unix 中是否有与 futex 等效的东西？

我正在寻找可以用来做的东西polling like select kqueue epoll即不忙轮询在 C C 中换句话说我需要阻塞一个线程然后在另一个线程中唤醒它尽可能少的开销 A mutex condition variable
iOS Playground 中的 NSUserDefaults

iOS Playgrounds 似乎有一个奇怪的问题NSUserDefaults总是返回nil而不是实际值在 iOS Playground 中最后一行错误地返回nil import UIKit let defaults NSUserDe
如何升级现有的 Flutter 应用？

我有一个半年前构建的现有 Flutter 应用程序我查了一下pubspec lock 它有这一行 sdks dart gt 2 10 0 110 lt 2 11 0 flutter gt 1 16 0 lt 2 0 0 所以我假设该应用程
sql server中事务回滚的机制是什么？

sql server中事务回滚的机制是什么数据库中的每个更新都会首先将一个条目写入包含更改描述的日志中例如如果您将列值从 A 更新到 B 日志将包含更新记录类似于在表 T 中列 C 已从 A 更改为 B 以通过 id I 的事务
获取ArrayList中重复项的数量

例如假设我有一个ArrayList可能包含以下值 x x x y y 现在我想要检索的是x and x我希望能够区分我所拥有的x or y因为实际上我可以在 ArrayList 中拥有任何对象并且我必须能够区分它们我想做的是首先转换
操作 struct tm 中的 tm_mon？

我无法理解这个程序即tm mon 1 part 我是 C 语言新手通常我总是编写自己的小程序来应对我在遵循的课程书中设置的任何挑战但我不得不咨询其他人来解决这个问题它是课本和他们的代码所以不是我的我不明白为什么 1被添加到tm
node.js/MySQL：当我尝试插入数据库时，某些字符串编码（表情符号）抛出错误

我正在运行一个 node js 脚本该脚本从公共数据库它是一个区块链中提取数据然后对其执行一些操作然后将其插入到 MySQL 数据库中我已经使用 MySQL 数据库UTF8 general ci编码绝大多数数据都可以很好地
对于每个循环：仅删除第一个附件

在使用 for 每个循环复制附件后我一直尝试删除 Outlook 中的附件它只是在复制后删除第一个附件但不会处理第二个附件它只是下降到 End Sub Private Sub Items ItemAdd ByVal item As
如何在 Laravel Vapor 应用程序中获取 HTTP 请求的 IP？

我最近将 Laravel 应用程序从服务器移至 Vapor 此应用程序依赖于使用日志记录请求IP地址Request ip 但自从切换到 Vapor 后所有 IP 都记录为 127 0 0 1 我查看了可信代理文档https laravel
在 Observable 中 xhr.send() 之后获取服务器响应

我实现了一种在 Angular 2 应用程序中发布文件的方法它基于我找到的解决方案here https stackoverflow com a 35985489 2018084 由于 Angular 2 本身不支持文件上传因此解决方案必
R 创建滑动窗口时间段内先前事件的统计

任何人都可以帮助我解决使用 R 创建特定时间段内先前事件总和的问题吗如果我不遵守协议我深表歉意这是我的第一个问题我有一系列 ID 和活动日期在真正的 df 中事件是日期时间但为了让事情更简单我在这里使用了日期我正在尝试创建

R 创建滑动窗口时间段内先前事件的统计

R 创建滑动窗口时间段内先前事件的统计 的相关文章

随机推荐

热门标签

R 创建滑动窗口时间段内先前事件的统计的相关文章