使用 data.table 查找时间戳对之间重叠的持续时间

2024-04-13

如同这个问题 https://stackoverflow.com/questions/46151452/find-overlapping-dates-for-each-id-and-create-a-new-row-for-the-overlap/46173303?noredirect=1#comment86774699_46173303，我想使用以下方法找到时间戳对之间重叠的持续时间data.table.

这是我当前的代码：

library(data.table)

DT <- fread(
  "stage,ID,date1,date2
  1,A,2018-04-17 00:00:00,2018-04-17 01:00:00
  1,B,2018-04-17 00:00:00,2018-04-17 00:20:00
  1,C,2018-04-17 00:15:00,2018-04-17 01:00:00
  2,B,2018-04-17 00:30:00,2018-04-17 01:10:00
  2,D,2018-04-17 00:30:00,2018-04-17 00:50:00",
  sep = ","
)

cols <- c("date1", "date2")
DT[, (cols) := lapply(.SD, as.POSIXct), .SDcols = cols]

breaks <- DT[, {
  tmp <- unique(sort(c(date1, date2)))
  .(start = head(tmp, -1L), end = tail(tmp, -1L))
}, by = stage]

result <- DT[breaks, on = .(stage, date1 <= start, date2 >= end), paste(ID, collapse = "+"),  
    by = .EACHI, allow.cartesian = T] %>% 
  mutate(lengthinseconds = as.numeric(difftime(date2, date1, units = "secs")))

  stage               date1               date2    V1 lengthinseconds
1     1 2018-04-17 00:00:00 2018-04-17 00:15:00   B+A             900
2     1 2018-04-17 00:15:00 2018-04-17 00:20:00 B+A+C             300
3     1 2018-04-17 00:20:00 2018-04-17 01:00:00   A+C            2400
4     2 2018-04-17 00:30:00 2018-04-17 00:50:00   D+B            1200
5     2 2018-04-17 00:50:00 2018-04-17 01:10:00     B            1200

但我只想返回用户二元组之间的重叠（即不超过两个重叠用户）。我可以想到几种巧妙的方法来实现这一目标，例如：

library(dplyr)
library(tidyr)

result %>% 
  filter(nchar(V1)==3) %>% 
  tidyr::separate(V1, c("ID1", "ID2"))

  stage               date1               date2 ID1 ID2 lengthinseconds
1     1 2018-04-17 00:00:00 2018-04-17 00:15:00   B   A             900
2     1 2018-04-17 00:20:00 2018-04-17 01:00:00   A   C            2400
3     2 2018-04-17 00:30:00 2018-04-17 00:50:00   D   B            1200

但这似乎不优雅，尤其是在处理较长的数据时ID字符串和可能数百个ID每个重叠 s。

理想情况下，我想知道是否有办法修改原始内容data.table代码直接返回它。

另一种可能性：

DT[breaks, on = .(stage, date1 <= start, date2 >= end)
   ][, if (uniqueN(ID) == 2) .SD, by = .(stage, date1, date2)
     ][, dcast(.SD, stage + date1 + date2 ~ rowid(date1, prefix = 'ID'), value.var = 'ID')
       ][, lengthinseconds := as.numeric(difftime(date2, date1, units = "secs"))][]

这使：

   stage               date1               date2 ID1 ID2 lengthinseconds
1:     1 2018-04-17 00:00:00 2018-04-17 00:15:00   B   A             900
2:     1 2018-04-17 00:20:00 2018-04-17 01:00:00   A   C            2400
3:     2 2018-04-17 00:30:00 2018-04-17 00:50:00   D   B            1200

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

datetime

dataTable

overlap

使用 data.table 查找时间戳对之间重叠的持续时间的相关文章

错误：“tidyverse”的包或命名空间加载失败：“namespace:dplyr”未导出对象“relocate”

我使用以下命令安装了 tidyverse install packages tidyverse 但是安装后当我使用以下命令调用库时 library tidyverse 我收到此错误 Error package or namespace l
使用 R 中绘制的标准误差创建条形图

我试图找到在 R 中创建条形图并显示标准错误的最佳方法我看过其他文章但我无法弄清楚与我自己的数据一起使用的代码之前没有使用过 ggplot 这似乎是最常用的方法而 barplot 不与数据框合作我需要在两种情况下使用它我为此创建
如何在 R 中执行随机森林/交叉验证

我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法因此我有一个数据集其中包含 1664 个解释变量不同的化学性质和一个响应变量保留时间我正在尝试生成一个回归随机森林模型以便能够预测给定保留时间的物质的化学性质 ID
R 中多类分类的 ROC 曲线

我有一个包含 6 个类别的数据集我想绘制多类别分类的 ROC 曲线 Achim Zeileis 给出的第一个答案非常好 R中使用rpart包的ROC曲线 https stackoverflow com questions 30818188
Rails 和 Mysql 的毫秒数

使用 Rails Mysql 时存储时间以毫秒为单位的最佳方式是什么我将使用小数和composed of 以便能够将该值作为Ruby 时间进行操作有人有更好的主意吗自从提出这个问题以来已经过去了好几年了这是更新的解决方案 ht
更改列的顺序

我正在处理一个包含 gt 40 列的大型数据框我希望能够移动列而不必指定所有列名称例如 a lt c 1 5 b lt c 4 3 2 1 1 Percent lt c 40 30 20 10 10 Labels lt c Cat D
如何对给定列和方向的数据表进行排序？

我需要在内存中使用基于来自 GridView 的列和方向的 DataTable 该函数需要如下所示 public static DataTable resort DataTable dt string colName string dire
有条件地将可选组替换为 gsub

一位用户问我如何做到这一点如何使 ggplot 图例中的选定单词变为斜体 https stackoverflow com questions 76054997 how to italicize select words in a ggplo
如何处理重叠的因子水平？（例如，生成表格和图表时）

我面临一个数据集的问题重叠因素水平我想按因素级别生成时间线条形图和统计数据但是我希望因子水平是模棱两可的这意味着属于多个级别的观察结果应该在图中出现多次这是我的数据结构的示例 head lt c ID YEAR BRAZIL G
在R中绘制3x3方形网格

我得到了一个数字列表 n 9 想将它们画在一个 3 3 的正方形网格中每个网格填充相应的数字我如何在 R 中执行此操作而不安装额外的软件包例如情节非常感谢这里有一个ggplot解决方案比我预期的要难一点 Setup the dat
geom_密度匹配geom_histogram binwitdh

我想在 ggplot2 中的分布条形图上添加一条线以显示平均分布但遇到了麻烦像这样的 ggplot 调用 ggplot x aes date received geom histogram aes y count binwidth 30
为什么 rbind 会抛出警告

这与是否有更优雅的方法将不规则的数据转换为整洁的数据框 https stackoverflow com questions 25102617 are there more elegant ways to transform ragged d
如何从类外部更改公共 R6 类方法？

我希望能够在我的 R6 类中重新定义公共方法以便它根据该类保存的数据类型进行更改如下所示 library R6 Simple lt R6Class Simple public list dt mtcars my print functi
如何在ggplot2中使用希腊符号？

我的类别需要用希腊字母命名我在用ggplot2 并且它与数据配合得很好不幸的是我无法弄清楚如何将这些希腊符号放在 x 轴上在刻度线处并使它们出现在图例中有什么办法可以做到吗更新我看了一下link https github c
R：邻接表到邻接矩阵

Bonjour 我想将邻接列表 3 列转换为邻接矩阵在这个论坛中我找到了多个有关如何将边列表转换为邻接矩阵的示例我成功地为两列列表做到了这一点我已经尝试了在网上可以找到的所有解决方案但似乎我错过了一小步我尝试过的我的变量是用
如何将 currentTimeMillis 转换为可读的日期格式？ [复制]

这个问题在这里已经有答案了我想用currentTimeMillis两次这样我就可以计算持续时间但我也想以用户可读的格式显示时间和日期我遇到了麻烦currentTimeMillis有利于计算但我看不到内置函数可以转换为合适的时间或时
PHP strtotime返回Mysql UNIX_TIMESTAMP的不同值

我在 stackoverflow 上搜索过帖子发现了一些类似的帖子但我认为这是一篇不同的帖子我的 PHP 和 Mysql 服务器的时区全部设置为 UTC 在表中我使用时间戳字段值为 2010 11 08 02 54 15 我使用这样
在多面图中用 N 注释 x 轴

我正在尝试生成一些按治疗条件和访问次数细分的数字结果的箱线图每个框中的观察次数都放在图下方并且也标记了访问次数这里有一些虚假数据可以用来说明我举了两个我尝试过但不太有效的例子 library ggplot2 library plyr
为 ggplot 定义新的尺度轴变换

我正在尝试创建一个squared使用 y 轴变换scales trans new但遇到错误 MWE data data frame x 1 10 y runif 10 z rnorm 10 10 library ggplot2 ggplot
使 matplotlib 图形默认看起来像 R？

Is there a way to make matplotlib behave identically to R or almost like R in terms of plotting defaults For example R t

随机推荐

在这种情况下是否可以创建一个最小完美哈希函数？

我想创建一个哈希映射或其他结构如果您有任何建议来存储键值对这些键将在创建地图的同时一次性插入但我不知道键是什么任意长度的字符串直到运行时当我需要创建地图时我正在解析这样的查询字符串 x 100 name bob color
Gekko优化包和numpy反函数

我使用 Gekko 为一组反应动力学选择 A 最优实验目标函数是最小化迹 inv Z Z 其中 Z 是通过将其参数周围的 ODE 线性化而计算出的尺度灵敏度矩阵正如您所看到的目标函数涉及 Z Z 的倒数我使用了 numpy 甚至 s
具有同名目标文件的静态库 (ar)

一点背景假设我有源文件它们需要最终存放在静态库中假设有两个 cpp 文件a cpp and a cpp位于两个不同的子目录中像这样的事情 foo a h foo a cpp bar a h bar a cpp 他们的内容并不冲突而
哪个 IDE 支持 Node.js 应用程序的 CoffeeScript 调试（源映射、断点和调用堆栈）？

我对整个 CoffeeScript 场景还很陌生是否有任何 IDE 支持调试在 Node js 上运行的 CoffeeScript 源代码我希望能够在 coffee 文件中设置断点并查看调用堆栈并检查变量 WebStorm 似乎还不符合
使用@Async方法的JUnit回滚事务

我正在使用编写集成测试SpringJUnit4ClassRunner 我有一个基类 RunWith SpringJUnit4ClassRunner class WebAppConfiguration ContextConfiguration
UISegmentedControl.noSegment 停止使用 Xcode 11、iOS 13 [重复]

这个问题在这里已经有答案了我将两个分段控件堆叠在一起每个控件都有两个选项因此搜索字段有一个 2x2 的过滤选项网格这工作得很好但我刚刚更新到 Xcode 11 并且UISegmentedControl noSegment当我尝试根
Windows 10 RTM OSVersion 没有返回我期望的结果

当调用 Windows 10 版本时 Environment OSVersion ToString 返回这个 Windows 8 和 8 1 版本返回 6 2 而不是 6 3 我使用 Windows 10 RTM 通过 Windows 更新
NSNotification移除观察者问题

我要么是大脑受损要么是我对 NSNotificationCenter 缺乏一些了解问题是如果我创建一个观察者并在下一行中尝试删除它如下所示 NSNotificationCenter defaultCenter addObserve
Jenkins 加 Git 在同一台服务器上

我有带有 git 存储库的家庭服务器现在我正在尝试在现有的 PHP 存储库上配置 Jenkins 我已经正常安装了 Jenkins 但在创建作业时遇到错误存储库 URL home git repositories testing git
如何在 Razor 视图页面中导入命名空间？

如何在 Razor 视图页面中导入命名空间终于找到了答案 using MyNamespace 对于 VB Net Imports Mynamespace 看一眼 ravy amiry 的回答 https stackoverflow com
....com.android.tools.aapt2.Aapt2Exception:.AAPT2 错误：检查日志以获取详细信息

错误任务 app mergeDebugResources 执行失败错误 java util concurrent ExecutionException com android tools aapt2 Aapt2Exception AAP
如何在 jQuery 中将 DateTime 值转换为 dd/mm/yyyy？

我有一个日期时间对象其值为日期 1475173800000 在 jQuery 中我希望它显示在日月年在 jQuery 中有什么办法可以实现吗您可以使用new Date 参数为通用时间变量 Date prototype toJS
如何使用 Java 访问 Kinect？

我目前正在学习计算机视觉课程对于我的期末项目我将制作一款与 Kinect 交互的小游戏现在我想用 Java 制作这个游戏因为我以前从未真正尝试过制作游戏而且我对这种语言非常满意但我似乎找不到一种方法来访问深度数据我只需要将其打
Vb.Net 编译器是否可以打开“无法访问的代码”警告？

我主要使用 VB Net 工作了一年多刚刚注意到这一点我疯了吗还是 VB Net 疯了 NOT有无法访问代码警告吗即使两个 writeline 调用之间有返回以下代码也能顺利编译没有任何警告或错误 Sub Main Cons
实体框架 - 冗余连接字符串

我在我的项目中使用实体框架 4 该框架创建了自己的连接字符串所以我的web configconnectionStrings 部分文件如下所示
在 ubuntu/linux 中使用 Xlib 或 xinput 控制多个指针

我正在创建一个在多个 xsessions 中使用多个游标指针的系统我的电脑有多个显卡用于控制不同的显示器我想在每个屏幕上有不同的光标并控制每个屏幕每个监视器都是一个不同的会话我开始使用 C 中的 xlib 库来控制我使用以下命
Criteria 查询中的数学运算符

给定映射的 hibernate 类 Entity public class MyTestClass id and stuff private Integer aValue private Integer bValue 您可以使用 HQL 执
网络安全字体 - 这到底是什么意思？

我知道哪些字体是网络安全字体但我不确定其定义网络安全字体是您的浏览器支持的字体还是操作系统上安装的字体那么如果某个字体无法在浏览器中显示是因为您的浏览器无法渲染该字体还是因为您的操作系统上没有安装该字体谢谢网络安全字体是大多数
启动 Hadoop 时出现“错误：无法找到或加载主类”

我正在尝试在我的 Windows 7 计算机上运行 Hadoop 2 2 0 是的我知道在 Linux 上运行它会更好但目前还不是一个选择我按照以下位置发布的说明进行操作http ebiquity umbc edu Tutorials
使用 data.table 查找时间戳对之间重叠的持续时间

如同这个问题 https stackoverflow com questions 46151452 find overlapping dates for each id and create a new row for the overla

使用 data.table 查找时间戳对之间重叠的持续时间

使用 data.table 查找时间戳对之间重叠的持续时间 的相关文章

随机推荐

热门标签

使用 data.table 查找时间戳对之间重叠的持续时间的相关文章