Data.table：连接 ID 和日期键，但希望第一个表中的日期键之前（或等于）最接近的日期

2024-03-11

我真的很感谢对这个问题的一些帮助，我找不到足够接近的例子。

我有两个 data.tables，第一个称为customer.table，包含特定于时间戳（AsOfDate），第二个表称为activity.table描述发送给该客户的营销活动ActivityDate.

我想找到客户数据表中每条记录的 AsOfDate 之前或当天发送给会员的最新 ActivityDate（即最大日期）。

我查看了几个问题（一个接近的问题是：处理 ID 重复的表 https://stackoverflow.com/questions/29988283/handle-a-table-with-id-repetition/29988428#29988428），但我不确定如何将条件 (ActivityDate

#libraries
library(lubridate)
library(data.table)

#data
customer.table = structure(list(CustomerID = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 
4), AsOfDate = structure(c(1435622400, 1435622400, 1435622400, 
1435622400, 1435622400, 1435622400, 1435622400, 1435622400, 1435622400, 
1435622400, 1394150400), tzone = "UTC", class = c("POSIXct", 
"POSIXt")), distance = c(2.17380476584343, 29.4024827688224, 
3.01353310956009, 18.4923143452557, 294.878606580665, 11.8870209430565, 
9.54438580030996, 24.2192034858273, 15.0069335290262, 10.4513664447137, 
18.4923143452557)), .Names = c("CustomerID", "AsOfDate", "distance"
), row.names = c("1", "5", "8", "10", "18", "28", "33", "37", 
"45", "47", "101"), class = "data.frame")

activity.table = structure(list(CustomerID = c(3, 5, 8, 10, 4, 10, 2, 2, 5, 7,
5, 8, 4, 6, 10, 6, 5, 4, 2, 5, 5, 6, 5, 5, 10, 8, 6, 4, 5, 8,
7, 1, 8, 10, 7, 8, 4, 1, 1, 10, 9, 7, 4, 6, 9, 10, 8, 3, 5, 8,
1, 4, 4), ActivityDate = structure(c(1330560000, 1368144000,
1332855900, 1337817600, 1370822400, 1365984000, 1337817600, 1368144000,
1331164800, 1331164800, 1394150400, 1394150400, 1396224000, 1393891200,
1393891200, 1398643200, 1396310400, 1399334400, 1399939200, 1403222400,
1402358400, 1404086400, 1425254400, 1426464000, 1426464000, 1426464000,
1427155200, 1429056000, 1429056000, 1429056000, 1363737600, 1332201600,
1330560000, 1433116800, 1433289600, 1433289600, 1338462000, 1366628400,
1335885300, 1427241600, 1427241600, 1427241600, 1430265600, 1430265600,
1430265600, 1430265600, 1365503400, 1338394200, 1430265600, 1430265600,
1432598400, 1433894400, 1426723200), tzone = "UTC", class = c("POSIXct",
"POSIXt")), row.index = 1:53), .Names = c("CustomerID", "ActivityDate",
"row.index"), row.names = c(NA, -53L), class = "data.frame")

 # what does the data look like
> head(activity.table)
  CustomerID        ActivityDate row.index
1          3 2012-03-01 00:00:00         1
2          5 2013-05-10 00:00:00         2
3          8 2012-03-27 13:45:00         3
4         10 2012-05-24 00:00:00         4
5          4 2013-06-10 00:00:00         5
6         10 2013-04-15 00:00:00         6
> head(customer.table)
   CustomerID   AsOfDate   distance
1           1 2015-06-30   2.173805
5           2 2015-06-30  29.402483
8           3 2015-06-30   3.013533
10          4 2015-06-30  18.492314
18          5 2015-06-30 294.878607
28          6 2015-06-30  11.887021

感谢你的协助。

看起来您正在这里寻找简单的滚动连接。首先，我们将转换为data.table对象（请注意，我正在使用 CRAN 上的最新版本来解决此解决方案（V 1.9.6+）

library(data.table) # V 1.9.6+
setDT(customer.table)
setDT(activity.table)

然后，每行customer.table我们将尝试加入最接近的值activity.table当滚动到无限远时

indx <- activity.table[customer.table, 
                       on = c(CustomerID = "CustomerID",
                              ActivityDate = "AsOfDate"), 
                       roll = Inf,
                       which = TRUE]

indx
# [1] 51 19 48 52 49 44 35 36 45 34  5

indx是日期的位置向量activity.table最接近每一行的customer.table.

现在，剩下的就是重新加入customer.table

customer.table[, MostRecentDate := activity.table[indx,ActivityDate]]
customer.table
#     CustomerID   AsOfDate   distance      MostRecentDate
#  1:          1 2015-06-30   2.173805 2015-05-26 00:00:00
#  2:          2 2015-06-30  29.402483 2014-05-13 00:00:00
#  3:          3 2015-06-30   3.013533 2012-05-30 16:10:00
#  4:          4 2015-06-30  18.492314 2015-06-10 00:00:00
#  5:          5 2015-06-30 294.878607 2015-04-29 00:00:00
#  6:          6 2015-06-30  11.887021 2015-04-29 00:00:00
#  7:          7 2015-06-30   9.544386 2015-06-03 00:00:00
#  8:          8 2015-06-30  24.219203 2015-06-03 00:00:00
#  9:          9 2015-06-30  15.006934 2015-04-29 00:00:00
# 10:         10 2015-06-30  10.451366 2015-06-01 00:00:00
# 11:          4 2014-03-07  18.492314 2013-06-10 00:00:00

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

Data.table：连接 ID 和日期键，但希望第一个表中的日期键之前（或等于）最接近的日期的相关文章

修复 ggplot 中构面中的数据顺序

我在使用 ggplot 绘制数据时遇到问题我无法使每个方面内的数据正确排序我的样本数据是 data lt structure list Parameter c 0 1 0 7 0 0 0 2 0 2 0 7 0 0 0 1 0 3 0
在嵌套 tibbles 上应用 ntile

我正在尝试申请ntile在一些嵌套的小标题上但我似乎无法让它工作你能看出我错在哪里吗 data iris iris gt group by Species gt mutate quintile ntile Petal Length 5
循环中的knitr模板和子文档

圣诞节前我之前问过跨多个 knitr 文档的单一样式表 https stackoverflow com questions 20370584 single style sheet across multiple knitr document
当测试集中不存在响应变量时，h2o 预测有时会失败

当在不存在响应变量的测试集上进行预测时如果在训练中对因子变量使用一种热编码则 h2o 会以各种不同的方式失败无论是在训练 GLM 时隐式指定还是在其他方法中显式指定时 R 3 4 0 和 h2o 3 12 0 1 中存在此错误我们还
栅格堆叠后如何写入？

我想操作几个光栅文件然后再次写入它们 rasterfiles lt list files C data envi full names TRUE d1 lt overlay stack rasterfiles fun function x
R lubridate：当地语言的工作日

如何获取本地语言的工作日和月份 My code library lubridate data lt c 10 02 2015 11 03 2015 data lubri lt dmy data wday data lubri label T
Shiny可以识别用鼠标选择的文本（突出显示的文本）吗？

我需要用户将文本片段分配给 Shiny 中的类别或代码基本上我希望用户突出显示输出中的文本在下面的示例中来自table or text输出然后按一个按钮 code 并将选定的文本分配给应用程序内的对象在下面的应用程序中所选文
将 read.csv 与符号链接文件一起使用

我正在尝试做什么我的源文件非常大我想避免将其复制到其他文件夹中我决定创建一个指向大文件的符号链接并想使用read csv读取文件文件夹结构项目1 数据源文件 csv 项目2 数据别名到源文件 csv 什么地方出了错读取源文件
ggplot2 - 添加具有不同中断和标签的辅助 y 轴

是否可以使用 ggplot2 手动向辅助 y 轴添加中断和标签 see bottom right 我希望在右侧 y 轴上有更紧凑的中断代表条形该图将作为基本情况然后我将展示如何更改辅助 y 轴上的分隔符和标签 sapply c pip
warnings() 在函数内不起作用？如何解决这个问题？

op lt options warn 0 although doesn t work for any value of warn assign last warning NULL envir baseenv thisDoesntWork l
以编程方式触发 R 传单中的标记鼠标单击事件以获得闪亮效果

我的问题与此相同在 R 传单中触发标记鼠标单击事件以获得闪亮效果 https stackoverflow com questions 56962857 trigger marker mouse click event in r leafl
使用管道语法处理模型列表

我经常喜欢拟合和检查与 R 数据框中的两个变量相关的多个模型我可以使用如下语法来做到这一点 require tidyverse require broom models lt list hp exp cyl hp cyl map df m
使用滑动窗口动画 ggplot 时间序列图

我正在寻找在不失去分辨率的情况下对长时间序列图进行动画处理的方法我希望视图能够平移数据显示从开始到结束的滑动子集假设我有以下内容 library ggplot2 library dplyr library gganimate df
从向量中删除元素在 R 中出现的时间量

我想从一个向量中删除元素在另一个向量中出现的时间就像我要减去它们一样鉴于我想要删除的元素向量中的每个元素也存在于我想要从中删除的主向量中 a lt c A B B C C C b lt c A B C C a a in b return
如何从R中的日期中提取月份

我正在使用lubridate封装并应用month从日期中提取月份的函数我在日期字段上运行了 str 命令得到了 Factor w 9498 levels 01 01 1979 01 01 1980 5305 1 1 1 1 1 1 1
如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
在 Shiny 中叠加两个 ggplot

我有一个非常大的数据集我正在使用 ggplot 在 Shiny 上绘制它我有一个与 x 轴上的值相关联的滑块我想用它对选定的数据子集重新着色并让其余数据保持原样最简单的选择是重新创建整个绘图但由于它是一个大型数据集因此这是一个
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
R data.table 连接不等式条件

我想使用 data table 包根据多个不等式条件对数据进行子集化 data table 手册中的示例展示了如何使用字符变量执行此操作但不显示数字不等式我还了解了如何使用子集函数来执行此操作但我真的很想利用 data table 二

随机推荐

如何复制cmake目标

我正在我的 cmake 项目中编写函数该函数需要从一个目标创建两个目标并稍微更改其中之一 option BORG STRIP TEST BINARIES OFF Strip symbols from test binaries to r
从旧的 Subversion 备份中恢复文件

我有一个来自旧的颠覆服务器的 tar 备份该服务器早已失效该服务器管理的所有源代码都是遗留代码永远不会再需要除了这个项目 tar 文件充满了小目录如 conf dav db 有没有办法从这个备份中提取单个项目的最终源代码您只需从
在 Laravel 中如何在查询中不带参数的 groupBy Url

下面的查询包含大量连接表和 DB raw 查询它按预期工作我想 groupBy 一个 landing 它是表中存储 URL 的字段但我想对不带参数的 URL 进行分组我怎样才能实现这个目标下面的查询尝试使用 SUBSTRING I
如何在反应导航6中分别处理两个抽屉？

我创建了两个抽屉导航器 const MenuDrawerRight createDrawerNavigator const MenuDrawerLeft createDrawerNavigator function RightDrawerS
FluentNHibernate 和枚举

我有一个名为 Permissions 的枚举可以为用户分配权限或者可以将权限分配给角色并为用户指定角色用户和角色都有这样的属性 public virtual IList
Python SQLite - 慢速更新记录

我有一个脚本可以将数据库中存储的日期从 Unix 时间纪元转换为人类可读的格式有30 000条记录从数据库中提取数据转换数据并将其打印到屏幕上的速度非常快然而从数据库中提取数据转换数据并执行更新语句来更新记录的速度非常
序列化为 json 响应时避免 hibernate 延迟初始化异常的更好方法

这是参考中的我一个月前问的一个问题 https stackoverflow com questions 13354766 avoid hibernate lazy initialization exception 在这个问题中 https
使用 Laravel 邮件类时如何设置 SwifMailer 插件？

Laravel 不会返回任何有用的信息来显示电子邮件失败的原因斯威夫邮递员记录器插件 http swiftmailer org docs plugins html logger plugin有助于发送过程中的调试当通过 Laravel
赋值运算符真的“只是”一个运算符吗？

我的问题是由this https stackoverflow com questions 63228851 does assignment precede logical operator in ruby 63230036 noredire
驱动程序如何成为操作系统的一部分？

我知道操作系统内核是由驱动程序组成的但是驱动程序是如何成为操作系统的一部分的是内核自己反编译然后添加驱动程序并重新编译自己吗或者驱动程序是内核的插件有人告诉我对于大多数操作系统驱动程序实际上成为内核的一部分但是每当我编译c程
pycharm看不到python3.7解释器

我在 Linux Mint 19 Tara Xfce 上使用 Pycharm Community 2018 1 4 它与 Python 3 5 解释器配合良好我安装了 Python 3 7 作为系统上默认的 Python 解释器 pyth
修改LD_LIBRARY_PATH

在 UNIX 中我正在尝试修改LD LIBRARY PATH为了使其包含一些库我无法添加到系统的常规库中我没有根权限它是大学服务器此时我已经使用了很多我在网络上找到的方法执行此操作但无法修改它我也看不到是什么PATH 我尝试过使
反转 ResourceManager

如果执行 ResourceManager GetString Key 则可以获得资源中项目的值有没有办法进行反向查找以从给定值的资源中获取密钥本质上是反翻译您应该能够获取 ResourceSet 并迭代它的值如果它们相等则返回键请
CUDA 标量和 SIMD 视频指令的效率

SIMD指令的吞吐量低于32位整数运算如果是 SM2 0 仅标量指令版本则低 2 倍如果是 SM3 0 则低 6 倍什么情况下适合使用它们如果您的数据已经以 SIMD 视频指令本机处理的格式打包则需要多个步骤对其进行解包以便可
如何让树视图重新考虑是否需要水平滚动条？

考虑以下非常简单的单元 Unit1 pas unit Unit1 interface uses Windows Classes Controls Forms ComCtrls type TForm1 class TForm TreeView
使用内部/外部传播包

我想在我的模拟中放置一个系统组件类似于Modelica Fluid System and Modelica Mechanics MultiBody World 所有其他组件都可以从中访问Medium包以便在整个流程图中仅设置一次工作
matplotlib 交互式绘图（在图表上手动绘制线条）

我已经使用 matplotlib 成功绘制了一组日期排序数据 X 轴是日期但是我希望能够manually在绘制的图表上从一个 date1 y1 到另一个 date2 y2 绘制线条我似乎找不到任何例子来说明如何做到这一点或者实际上是
如何为 Ionic 4（android / ios）应用程序创建 google pay？

我使用以下方法创建了 google pay for web URL Google 网络付费 https developers google com pay api web guides tutorial 我想为 ionic 4 应用程序创建
转换为 UCS2

Vb net 或C 中是否有任何函数可以对UCS2中的字符串进行编码 Thanks 使用以下函数以 UCS2 格式对 unicode 字符串进行编码 gt Used to encoding GSM message as UCS2 publi
Data.table：连接 ID 和日期键，但希望第一个表中的日期键之前（或等于）最接近的日期

我真的很感谢对这个问题的一些帮助我找不到足够接近的例子我有两个 data tables 第一个称为customer table 包含特定于时间戳 AsOfDate 第二个表称为activity table描述发送给该客户的营销活动Act

Data.table：连接 ID 和日期键，但希望第一个表中的日期键之前（或等于）最接近的日期

Data.table：连接 ID 和日期键，但希望第一个表中的日期键之前（或等于）最接近的日期 的相关文章

随机推荐

热门标签

Data.table：连接 ID 和日期键，但希望第一个表中的日期键之前（或等于）最接近的日期的相关文章