在 R 中按日期模糊匹配连接

2023-12-06

我有两个数据框，我想按日期将它们连接起来

df1 <-
  data.frame(
    day = seq(ymd("2020-01-01"), ymd("2020-01-14"), by = "1 day"),
    key = rep(c("green", "blue"), 7),
    value_x = sample(1:100, 14)
  ) %>% 
    as_tibble()

df2 <-
  data.frame(
    day = seq(ymd("2020-01-01"), ymd("2020-01-12"), by = "3 days"),
    key = rep(c("green", "blue"), 2),
    value_y = c(2, 4, 6, 8)
  ) %>% 
  as_tibble()

我希望输出是这样的

# A tibble: 14 x 3
   day        key   value_x   value_y
   <date>     <fct>   <int>     <int>
 1 2020-01-01 green      91         2
 2 2020-01-02 blue       28        NA
 3 2020-01-03 green      75         2
 4 2020-01-04 blue       14         4
 5 2020-01-05 green       3         2
 6 2020-01-06 blue       27         4
 7 2020-01-07 green      15         6
 8 2020-01-08 blue        7         4
 9 2020-01-09 green       1         6
10 2020-01-10 blue       10         8
11 2020-01-11 green       9         6
12 2020-01-12 blue       76         8
13 2020-01-13 green      31         6
14 2020-01-14 blue       62         8

我尝试执行这段代码

merge(df1, df2, by = c("day", "key"), all.x = TRUE)

我希望左表中的一天加入到 Y 表中具有值的最近一天。如果没有值，那么它应该是 NA。

Edit --

并非 df2 中的所有日期都会出现在 df1 中，尽管它们确实具有共同的 ID。这是一个例子-

df1 

day           id       key  
1 2020-01-08    A    green
2 2020-01-10    A    green
3 2020-02-24    A    blue 
4 2020-03-24    A    green
   
df2 

day            id   value 
1 2020-01-03    A       2
2 2020-01-07    A       4
3 2020-01-22    A       4
4 2020-03-24    A       6   

desired output

day           id       key    value
1 2020-01-08    A    green        4   
2 2020-01-10    A    green        4
3 2020-02-24    A    blue         4
4 2020-03-24    A    green        6

合并后可以arrange数据基于key and day and fill具有最新的非 NA 值。

library(dplyr)

merge(df1, df2, by = c('day', 'key'), all.x = TRUE) %>%
  arrange(key, day) %>%
  group_by(key) %>%
  tidyr::fill(value_y) %>%
  arrange(day)

#          day   key value_x value_y
#1  2020-01-01 green      40       2
#2  2020-01-02  blue      45      NA
#3  2020-01-03 green      54       2
#4  2020-01-04  blue      11       4
#5  2020-01-05 green      12       2
#6  2020-01-06  blue       7       4
#7  2020-01-07 green      72       6
#8  2020-01-08  blue      76       4
#9  2020-01-09 green      52       6
#10 2020-01-10  blue      32       8
#11 2020-01-11 green      69       6
#12 2020-01-12  blue      10       8
#13 2020-01-13 green      63       6
#14 2020-01-14  blue      84       8

对于更新的数据，您可以使用以下内容：

df1 %>%
  left_join(df2, by = 'id') %>%
  mutate(diff = day.x - day.y) %>%
  group_by(id, key, day.x) %>%
  filter(diff == min(diff[diff >= 0])) %>%
  arrange(day.x) %>%
  select(day = day.x, id, key, value)

#   day        id    key   value
#  <date>     <chr> <chr> <int>
#1 2020-01-08 A     green     4
#2 2020-01-10 A     green     4
#3 2020-02-24 A     blue      4
#4 2020-03-24 A     green     6

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

tidyverse

在 R 中按日期模糊匹配连接的相关文章

如何从 data.frame 中删除列？

不是你怎么但更多的是你怎么如果有人给你一个包含 200 列的文件并且你想将其减少到分析所需的少数列你会如何做呢一种解决方案是否比另一种解决方案更有优势假设我们有一个包含列 col1 col2 到 col200 的数据框如果
合并的 xts 对象未对齐

请尝试以下代码 library quantmod getSymbols SPY from 1950 01 01 SPY lt to monthly SPY temp lt xts Cl SPY index SPY 您将获得一个xts具有相同
单击 hPlot 图表中闪亮的数据点时打印组名称

我有一个闪亮的应用程序它使用 rCharts 中的 highcharts 库显示一些图表在某些情况下我在单个图表上有多个图表这些图表是使用 hPlot 中的组选项创建的我希望在单击图表时打印单个数据点的所有参数 x y 和组值我
基于两列对数据框中的行进行求和[重复]

这个问题在这里已经有答案了我想添加一列的值将它们按两列分组我找到了如何在一列上执行此操作但无法弄清楚如何在两列上执行此操作例如如果我有以下数据框 x c a a b b c c a a b b c c a a b b c c y
计算横截面积作为高度的函数

我试图弄清楚如何计算不同水位的河流横截面的充满水的面积对于横截面我有 5 m 宽河流上每 25 cm 的深度并且可以根据之前很好回答的问题来计算面积计算不同高度的横截面积 https stackoverflow com questio
将 Excel 数字日期重新格式化为 R 日期

希望将从 Excel 中提取的列重新格式化为包含数字 Excel 格式例如 40182 的数据框 as date 40182 origin 1899 12 30 format b Y Returns 1 2070 年 1 月 5 日我正
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
将 SAS sas7bdat 数据读入 R

R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如包含以此格式保存的大量数据文件存储库为了具体起见让我们集
最新的 Windows 10 更新后 R 将无法运行

我已经更新了我的 Windows 但 R 无法运行因此 R studio 也无法运行当我运行 R GUI 时它只是冻结并且没有响应我已允许防火墙豁免铬我正在使用 Windows Insider 计划并且刚刚更新到 Windows
如何使用“downloadHandler”在闪亮的可反应内部创建下载按钮？

我创建downloadlinksa 的行内reactable 我这样做是为了DT datatable and a reactable reactable 我还创建了相应的output downloadHandler在 ids 上使用 app
R：交换两个变量而不使用第三个变量

我有两个变量即 a lt 1 b lt 2 我想交换他们的价值观是否有任何内置的 R 函数能够执行该操作或者是否有其他优雅的方式而不使用第三个临时变量 Note 如果可能的话适用于字符串或其他数据类型有一个通用的解决方案或技
数据框中按行相关

我正在尝试计算大型数据帧的所有行之间的相关性到目前为止已经提出了一个有效的简单 for 循环例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4
ggplot2中的两列分组

是否可以按两列分组于是叉积就画出来了经过geom point and geom smooth 例如 frame lt data frame series lt rep c a b 6 sample lt rep c glass wate
将多个函数应用于一个向量

我正在寻找一种将多个函数应用于一个向量的选项我认为这对于逆应用函数来说是一种仁慈其中一个函数应用于许多向量或列有没有办法指定两个或多个函数例如 min 和 max 并将其应用于向量与 CathG的评论类似但没有get v lt
‘!’ 对于 R 中的因子没有意义

我需要从数据框中排除变量 PABI 所以我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
R闪亮：基于checkboxgroupinput的子集数据

我想根据复选框输入动态选择的列对数据进行子集有什么方法可以使我的输入文件在我的代码中全局可用以便可以方便地进行进一步的操作以下是我的代码 Server R library shiny shinyServer function inpu
闪亮的仪表板侧边栏中的可折叠菜单项

我的侧边栏中有两个菜单项目前如果我单击任何菜单项则会显示所有菜单项的选项卡项我想让它可折叠如果我单击多个名称菜单单个分析应该折叠如果我单击单个分析多个分析应该折叠目前的设计是相同的可重现代码是 library shiny
省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色以便在我的 ggplot 条形图中使用然而我却做不到帮助下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
缩放geom_密度以将geom_bar与y上的百分比相匹配

因为我对数学感到困惑上次我尝试问这个问题 https stackoverflow com questions 32412805 ggplot2 histogram with density curve that sums to 1 这是另一
了解日期并使用 R 中的 ggplot2 绘制直方图

主要问题当尝试使用 ggplot2 制作直方图时我无法理解为什么日期标签和中断的处理无法像我在 R 中预期的那样工作我在找我的约会频率的直方图刻度线位于匹配条下方的中心日期标签在 Y b format 适当的限制最小化网格空

随机推荐

jenkins 未将“节点”识别为内部或外部命令错误

我正在尝试在 jenkins v1 592 的帮助下设置持续代码集成我有一个 android 混合代码我正在尝试用 jenkins 构建它我已经为ANT HOME JAVA HOME ANDROID HOME设置了环境变量然后分别添
如何编码并传递（对 std::vector 的引用）？

我似乎无法弄清楚这一点 class Tree Node root vector dict class Node vector dict char cargo Node left Node right 我希望 Tree 的每个实例都有自己的字
Spring Boot 多部分/相关 mime 类型支持

我需要使用内容类型为多部分相关的请求请求将包含图像 json 负载和二进制内容我试图找到一些关于如何在 Spring boot 应用程序中处理此类请求的示例我找到了一些关于如何处理 multipart form data 请求的参考
为 mysql 中的每个对话选择对话的最后一条消息

我的查询 SELECT FROM messages status mst INNER JOIN messages msg ON mst msg id msg id WHERE mst user id 1 AND mst status NOT
无法使用类型为“System.Data.Entity.Core.Objects.ObjectQuery”的实例进行调用

我想通过 userId 查找用户名这个代码片段工作 Discussion CreateBy db AspNetUsers Find discussion CreatedBy UserName 这一次在以下控制器类中不起作用 Comment
在 R ggplot2 中将 gtable 转换为 ggplot

虽然 gtable 可以转换为 ggplot 使用ggplotify as ggplot 输出与原始 ggplot 不同例如 library ggplot2 p lt ggplot mtcars aes wt mpg geom point
提交后如何更改iPhone应用程序的主要类别？

我不小心将我的应用程序提交到了错误的主要类别中该应用程序现已提交到应用程序商店如何更改主要类别有更新
删除构建记录时是否应该删除与构建记录关联的工件？

我正在使用带有本地构建代理的新 VSO 可编写脚本的构建系统该构建将以下资产发布到内部文件共享 Install 我们内部符号存储的符号当手动或基于保留策略删除构建时相关资产将被删除not已删除我是否应该期望在删除关联的构建记录时资产
在父 div 外部时剪辑 div

我有一个小项目here我正在努力目前我对此还不太了解但这不是重点这是 CSS 因为如果我提供链接我需要发布代码 body background FF4D4D background webkit radial gradient cir
EclipseLinke：没有名为 META-INF/services/javax.persistence.spi 的资源文件：找不到 PersistenceProvider

我正在使用 EclipseLink 即使我已经使用 maven 导入了所有必需的 jar 文件我仍然遇到异常线程 main 中的异常 javax persistence PersistenceException 否资源文件名为 MET
使用应用脚本从表格创建 Google 地图 URL 时显示错误？

我在 Google 表格中有纬度和经度值我想使用应用程序脚本绘制 Google 地图 URL 我有付费的 Google 地图 API 密钥但找不到将其与脚本编辑器中的应用程序脚本代码集成的方法执行代码时它显示错误消息 Google
initMap 不是 Google 地图 Javascript 函数

我知道这个问题已经被问过但我还是过不去我只是想在 js fiddle 中加载 googlemaps API 我无法克服错误 initMap 不是函数我的jsfiddle在这里 jsfiddle My code function ini
我可以使用 API 获取 stackdriver 策略的事件吗？

我在 stackdriver 仪表板上查看发现以下 http 请求 https app google stackdriver com api alerting violation project project id page 0 pag
Android、Robotium - 截屏时出现问题

我正在尝试使用 Robotium 截取我的 Android 应用程序的屏幕截图我正在使用我发现的以下函数here public static String SCREEN SHOTS LOCATION sdcard public stati
在 tumblr 中对类别使用不同的样式？

我希望能够将带有不同标签例如汽车摩托车船舶的照片发布到 tumblr 然后在帖子中每个标签应显示不同颜色的水平线例如汽车为蓝色摩托车为红色船舶为绿色如果我将照片与其他标签例如自行车或飞机放在一起它应该显示一条灰线
列表如何使用 Apache poi 将映射值写入 Excel 文件

我得到列表哈希映射键和值例如 1 ACSS Description1 ACSS Description2 ACSS Description3 SACSS Description4 2 11 1 4 12 我想这样设置 Excel 单元格值
查找用户的“我的文档”路径

我有这个小程序它需要在我的文档文件夹中创建一个小 txt 文件这是我的代码 textfile open C Users MYNAME Documents w lines stuff goes here textfile writel
CLIPS 模式匹配中的数字相等测试失败？

我的 CLIPS 文件中有以下规则 defrule check final declare salience 12 scnt lt set count value v class c test v total gt printout T t
BlackBerry 上的 HTTP Post 请求

我正在尝试将 json 字符串从我的 BlackBerry OS String httpURL http ip of my server phpServer receiver2 php jsonString try HttpConnecti
在 R 中按日期模糊匹配连接

我有两个数据框我想按日期将它们连接起来 df1 lt data frame day seq ymd 2020 01 01 ymd 2020 01 14 by 1 day key rep c green blue 7 value x sam

在 R 中按日期模糊匹配连接

在 R 中按日期模糊匹配连接 的相关文章

随机推荐

热门标签

在 R 中按日期模糊匹配连接的相关文章