计算 30 天滚动窗口内的观察值

2023-11-29

我需要创建一个变量来计算每个 id 在过去 30 天内发生的观察次数。

例如，假设 id“a”发生在 1/2/2021 (d/m/y) 的观察。如果此观察是 2021 年 1 月 1 日至 2021 年 1 月 2 日期间 id“a”的第一个观察，则变量必须给出 1。如果是第二个，则为 2，依此类推。

这是一个更大的例子：

dat <- tibble::tribble(
  ~id,  ~q,   ~date,
  "a",   1,   "01/01/2021",
  "a",   1,   "01/01/2021",
  "a",   1,   "21/01/2021",
  "a",   1,   "21/01/2021",
  "a",   1,   "12/02/2021",
  "a",   1,   "12/02/2021",
  "a",   1,   "12/02/2021",
  "a",   1,   "12/02/2021",
  "b",   1,   "02/02/2021",
  "b",   1,   "02/02/2021",
  "b",   1,   "22/02/2021",
  "b",   1,   "22/02/2021",
  "b",   1,   "13/03/2021",
  "b",   1,   "13/03/2021",
  "b",   1,   "13/03/2021",
  "b",   1,   "13/03/2021")
dat$date <- lubridate::dmy(dat$date)

结果应该是：

id  q   date    newvar
a   1   01/01/2021  1
a   1   01/01/2021  2
a   1   21/01/2021  3
a   1   21/01/2021  4
a   1   12/02/2021  3
a   1   12/02/2021  4
a   1   12/02/2021  5
a   1   12/02/2021  6
b   1   02/02/2021  1
b   1   02/02/2021  2
b   1   22/02/2021  3
b   1   22/02/2021  4
b   1   13/03/2021  3
b   1   13/03/2021  4
b   1   13/03/2021  5
b   1   13/03/2021  6

非常感谢。

With sapply and between，计算当前观察之前 30 天内的观察数量。

library(lubridate)
library(dplyr)
dat %>% 
  group_by(id) %>% 
  mutate(newvar = sapply(seq(length(date)), 
                         function(x) sum(between(date[1:x], date[x] - days(30), date[x]))))

# A tibble: 16 x 4
# Groups:   id [2]
   id        q date       newvar
   <chr> <dbl> <date>      <int>
 1 a         1 2021-01-01      1
 2 a         1 2021-01-01      2
 3 a         1 2021-01-21      3
 4 a         1 2021-01-21      4
 5 a         1 2021-02-12      3
 6 a         1 2021-02-12      4
 7 a         1 2021-02-12      5
 8 a         1 2021-02-12      6
 9 b         1 2021-02-02      1
10 b         1 2021-02-02      2
11 b         1 2021-02-22      3
12 b         1 2021-02-22      4
13 b         1 2021-03-13      3
14 b         1 2021-03-13      4
15 b         1 2021-03-13      5
16 b         1 2021-03-13      6

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

tidyverse

rollingcomputation

windowing

计算 30 天滚动窗口内的观察值的相关文章

循环中的knitr模板和子文档

圣诞节前我之前问过跨多个 knitr 文档的单一样式表 https stackoverflow com questions 20370584 single style sheet across multiple knitr document
read.table 和 read.delim 函数之间的区别

两者有什么区别read table and read delim R语言中的函数当您不确定函数的作用时除了阅读帮助页面之外您还可以检查函数的实际代码例如输入read delim显示该函数包含以下代码 gt read delim f
当测试集中不存在响应变量时，h2o 预测有时会失败

当在不存在响应变量的测试集上进行预测时如果在训练中对因子变量使用一种热编码则 h2o 会以各种不同的方式失败无论是在训练 GLM 时隐式指定还是在其他方法中显式指定时 R 3 4 0 和 h2o 3 12 0 1 中存在此错误我们还
使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
对于多项式，获取其所有极值并通过突出显示所有单调部分来绘制它

有人问我这个有趣的问题我认为值得将其发布在这里因为 Stack Overflow 上还没有任何相关线程假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
从 R 到 C 处理列表并访问它

我想使用从 R 获得的 C 列表我意识到这个问题与此非常相似使用 call 在 R 和 C 之间传递数据帧 https stackoverflow com questions 6658168 passing a data frame f
kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
具有动态变量数的公式

假设有一些 data framefoo data frame想要找到目标列的回归Y由其他一些专栏为此目的通常使用一些公式和模型例如 linear model lt lm Y FACTOR NAME 1 FACTOR NAME 2 fo
R：为什么 boxplot(x,log="y") 与 boxplot(log(x)) 不同？

delme lt exp rnorm 1000 1 5 0 3 boxplot delme log y boxplot log10 delme 为什么这两个图中的胡须不同谢谢阿古斯我想说的是在您的第一个图中您只是将 y 轴更改为对
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
将 RDS 文件从网络（即 URL）直接加载到 R 中？

read csv 具有直接从 url 读取的出色能力 readRDS 才不是我想将 RDS 文件从 Internet 移动到我的 R 环境我看到有几种方法 Method 1 此方法会用下载的文件弄乱工作目录 myurl lt https
如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
rpart是自动剪枝吗？

Is rpart自动修剪生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多否但拟合函数的默认值可能会提前停止分割对于早期的某些定义 See rpart control对于您可
在 Shiny 中叠加两个 ggplot

我有一个非常大的数据集我正在使用 ggplot 在 Shiny 上绘制它我有一个与 x 轴上的值相关联的滑块我想用它对选定的数据子集重新着色并让其余数据保持原样最简单的选择是重新创建整个绘图但由于它是一个大型数据集因此这是一个
聚合日期时间以总结在特定条件下花费的时间

我很困惑我应该如何继续我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
stat_function 从函数生成平线

我有以下代码 library ggplot2 f lt function x if x gt 2 1 x 0 3 else 0 graph lt ggplot data frame x c 0 10 aes x graph lt graph
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
使用自定义渐变填充直方图箱

我想在 R 和 ggplot2 中创建一个直方图其中根据连续的 x 值填充箱大多数教程仅通过离散值或密度计数进行着色下列的这个例子 https stackoverflow com questions 40284227 how to
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
如何使用 R 中的函数 sqlSave() 将数据附加到具有 IDENTITY 主键的 SQL Server 表？

我在SQL Server中创建了一个表如下所示 CREATE TABLE testPK ID INT NOT NULL IDENTITY 1 1 PRIMARY KEY NumVal NUMERIC 18 4 现在我想使用 RODBC 函

随机推荐

drawPolygon 保持从起始（鼠标按下）位置到当前（鼠标拖动）位置的绘制线

因此我尝试从单击鼠标开始动态绘制多边形直到停止拖动并释放为止就这个问题而言当我单击向下拖动然后向右拖动然后向上拖动然后向左拖动时不会绘制方形轮廓而是会发生以下情况 https i stack imgur com QsYw
使用 Microsoft Advertising SDK for XAML 时，应用程序在认证期间不断崩溃

在我已经发布的应用程序中我尝试使用 Microsoft Advertising SDK for XAML 添加广告尝试通过 NuGet 和 msi 添加引用在我的开发机器上调试和发布版本都工作正常甚至作为打包一部分创建的 appx
React 中副作用的定义和函数式编程中的一样吗？

我正在同时学习 React 和函数式编程当我学习副作用的概念时我觉得 React 和函数式编程中副作用的定义略有不同在函数式编程中如果函数具有内部状态则更改该内部状态会产生副作用然而当内部状态被创建时useState在 Rea
Java处理大量数据

我有一个 Java 应用程序需要显示大量数据大约 100 万个数据点数据并不需要同时显示而是仅在用户请求时显示该应用程序是一个桌面应用程序不与应用程序服务器一起运行或访问任何集中式数据库我的想法是在机器上运行数据库并将数据加载到
更换字符串片段

我正在做类似Excel的事情我有这样的事情 1 2 3 A1 B1 C1 其中它替换指定内容的内容其中 A1 替换 1 的内容 B1 替换 2 的内容等等我正在使用多维数组并且我执行如下操作 int offset 0 readCh
C# MongoDB - 如何向多个嵌套数组元素添加和删除项目？

我在 MongoDB 中有一个文档如下所示 Id 123 Product test Tags Name name Categories item item Name name Categories
Matlab 保存扩展名为 m~ 的文件副本。它们有什么作用以及我可以将它们关闭吗？

Matlab 不断在同一目录中保存扩展名为 m 的 m 文件的副本这非常烦人因为我总是点击它们并且必须将它们关闭我猜这是一些安全功能或一些缓存但是有没有办法将它们关闭以便它们至少不会出现在 Matlab 文件浏览器框中或充当隐藏文
编写 WebSocket 服务器

我正在尝试用 java 和 C 编写 WebSocket 服务器但现在陷入困境使用 java 和 java net ServerSocket java net Socket 我设法获得连接并成功进行握手但 WebSocket 发送到
Material-UI Select，单击输入时如何在选择上应用 :focus-within 样式？

我在 div 组件内使用 Select div div
Angular2 - 扩展路由器和 Observable

在带有路由器模块 v 3 0 0 6alpha 的 angular2 rc2 中我扩展了 RouterOulet 以在访问管理员之前检查用户是否已登录这是代码 Directive selector router outlet expor
Application.Inputbox [LEFT] 和 [TOP] 在 Excel Vba 中不起作用。为什么？

我的 VBA 代码中有一个简单的输入框我想设置它的起始位置我知道参数 LEFT 和 TOP 应该可以做到这一点但它们不起作用这是我所拥有的 x Application InputBox MyPrompt MyTitle 50 50
需要更快的方法从 Excel 输出中的日期中删除前导零

We have an internal software that exports data reports to Excel and several of the columns contain dates in the MM DD YY
蛋糕模式：每个实现一个组件，还是每个特征一个组件？

我目前正在努力在我的应用程序中使用蛋糕图案在我在网上找到的示例中这些示例是基本的但不涉及更复杂的需求我想做的事情并不是那么奇特我想在蛋糕模式应用程序中拥有两个相同类型的服务使用不同的实现 trait UserServiceCom
在 React.js 中过滤 JSON 数据

我定义了这个状态 constructor props super props this state open false customers customer products product orders order newForm tr
使用 Parse 和 Multidex 重复条目

我的项目是一个使用 Parse 的聊天应用程序添加其他依赖项后开始出现此问题错误任务 app dexDebug 执行失败 com android ide common process ProcessException org gra
如何使用 unsat 核心的 z3 split 子句并尝试再次找出 unsat 核心

您能告诉我如何拆分 unsat 核心的子句吗这是问题2 关于找到未饱和的核心后我将尝试再次寻找您想告诉我如何做到这一点吗非常感谢如何拆分以下子句 and or lt int 1002 x1 lt int 1000 x1 and o
Python中字符串中子字符串的重叠计数

我想找到字符串中子字符串的所有计数重叠和非重叠我找到了两个答案其中一个是使用正则表达式这不是我的意图另一个答案比我需要的效率低得多我需要类似的东西 ababaa count aba 2 str count 只计算简单的子串我应
PHP Streaming CSV 总是添加 UTF-8 BOM

以下代码获取报告行作为数组并使用 fputcsv 将其转换为 CSV 一切都运行良好除了以下事实无论我使用什么字符集它都会在文件的开头放置一个 UTF 8 bom 这非常烦人因为 A 我指定了 iso B 我们有很多用户使用将
为什么自动装配 Spring 存储库不起作用？

我有一个控制器我可以在其中自动连接存储库 Controller RequestMapping account EnableJpaRepositories public class AccountController Autowired p
计算 30 天滚动窗口内的观察值

我需要创建一个变量来计算每个 id 在过去 30 天内发生的观察次数例如假设 id a 发生在 1 2 2021 d m y 的观察如果此观察是 2021 年 1 月 1 日至 2021 年 1 月 2 日期间 id a 的第一个观察

计算 30 天滚动窗口内的观察值

计算 30 天滚动窗口内的观察值 的相关文章

随机推荐

热门标签

计算 30 天滚动窗口内的观察值的相关文章