R data.table 按组和条件连接/子集/匹配

2024-01-02

我正在尝试按 2 个 data.tables 中的组对数据进行子集/匹配，但无法弄清楚这在 R 中是如何实现的。我有以下 data.table，其中包含 City_ID 和时间戳（列名称=时间）。

Library(data.table)  
timetable <- data.table(City_ID=c("12","9"),
                        Time=c("12-29-2013-22:05:03","12-29-2013-11:59:00"))

我有第二个 data.table，其中包含对城市和时间戳的一些观察（以及附加数据）。该表如下所示：

DT = data.table(City_ID =c("12","12","12","9","9","9"),
                Time= c("12-29-2013-13:05:13","12-29-2013-22:05:03",
                        "12-28-2013-13:05:13","12-29-2013-11:59:00",
                        "01-30-2013-10:05:03","12-28-2013-13:05:13"), 
                Other=1:6)

现在我需要找到 DT 中每个城市在另一个 data.table“时间表”（基本上是匹配表）中时间 >= 时间的观察结果。仅应保留那些记录（包括不用于计算的列；在示例中为“其他”列）。我想要的结果是这样的：

desiredresult = data.table(City_ID=c("12","9"),
                           Time= c("12-29-2013-22:05:03","12-29-2013-11:59:00"),
                           Other=c("2","4"))

我已经尝试过以下方法：

setkey(DT, City_ID, Time)  
setkey(timetable, City_ID)  
failedresult = DT[,Time >= timetable[Time], by=City_ID]  
failedresult2 = DT[,Time >= timetable, by=City_ID]

顺便说一句：我知道另外分割日期和时间可能会更好，但这可能会使示例变得更加复杂（当我测试通过 data.table 找到时间戳中的最小值时，它似乎有效）。

这是完成此任务的方法：

# 1) transform string to POSIXct object
DT[ , Time := as.POSIXct(strptime(Time, "%m-%d-%Y-%X"))]
timetable[ , Time := as.POSIXct(strptime(Time, "%m-%d-%Y-%X"))]

# 2) set key
setkey(DT, City_ID)
setkey(timetable, City_ID)

# 3) join tables
DT2 <- DT[timetable]

# 4) extract rows and columns
DT2[Time >= Time.1, .SD, .SDcols = names(DT)]

#    City_ID                Time Other
# 1:      12 2013-12-29 22:05:03     2
# 2:       9 2013-12-29 11:59:00     4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

match

dataTable

subset

R data.table 按组和条件连接/子集/匹配的相关文章

ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
使用自定义渐变填充直方图箱

我想在 R 和 ggplot2 中创建一个直方图其中根据连续的 x 值填充箱大多数教程仅通过离散值或密度计数进行着色下列的这个例子 https stackoverflow com questions 40284227 how to
将所有分号替换为空格 pt2

我尝试对 2000 多行关键字的列表运行文本分析但它们的列出方式如下战略管理风格组织所以当我使用 tm 删除标点符号时它就变成了组织的战略管理风格我认为这在某种程度上破坏了我常用术语的分析我尝试过使用 vector lt
改进R中从google获取股票新闻数据的功能

我已经编写了一个函数来从 Google 获取和解析给定股票代码的新闻数据但我确信有一些方法可以改进它对于初学者来说我的函数返回一个 GMT 时区的对象而不是用户当前的时区如果传递的数字大于 299 它就会失败可能是因为 goog
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
根据 row_number() 过滤 data.frame

更新自从提出这个问题以来 dplyr 已经更新现在按照 OP 的要求执行我正在尝试获取第二行到第七行data frame using dplyr 我正在这样做 require dplyr df lt data frame id 1 1
RStudio 不会通过 rPython 调用加载所有 Python 模块

我从 Bash 和 RStudio 中运行相同的脚本时出现一些意外行为请考虑以下事项我有一个文件夹 rpython 包含两个脚本 test1 R library rPython setwd rpython python load tes
通过 R 中的数据子集执行计算

我想对数据框的 PERMNO 列中的每个公司编号进行计算其摘要可以在此处查看 gt summary companydataRETS PERMNO RET Min 10000 Min 0 971698 1st Qu 32716 1st Qu
R 多元一步预测和准确性

我想使用 R 来比较两个预测模型的 RMSE 均方根误差第一个模型使用 1966 年至 2000 年的估计值来预测 2001 年然后使用 1966 年至 2001 年的估计值来预测 2002 年依此类推直至 2015 年第二个模型使
使用 ggplot 构面时增加闪亮的绘图大小

有没有办法增加绘图窗口的大小shiny取决于在一个中使用的面的数量ggplot图也许使用垂直滚动例如使用下面的示例当输入为 A 有三个方面情节看起来不错当选项 B 选择绘图数量会增加但绘图窗口保持相同大小导致绘图太小是否有
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
使用 RDCOMClient 搜索 Outlook 收件箱

我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题然后获取附件我在一封电子邮件上进行了这项工作但由于主题包含日期元素我需要搜索成为一个类似的子句但不太清楚这适合我的下面的查询 outlook
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
C# 数据表来保存表格（无限嵌套）

我相对较新C 但来自C C 背景我需要一个类似于的数据类型类 DataTable 但允许存储的列保存简单类型 int float boolean string 以及相同类型的数据以便一个列可以保存另一个表该表也具有存储表等的列
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
从 R 中的方差分析 (glm) 中提取残余偏差

我在 R 中安装了一个 glm 模型并采用了方差分析表我需要提取残余偏差列但它会产生错误以下是代码创建数据 counts lt c 18 17 15 20 10 20 25 13 12 outcome lt gl 3 1 9 t
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本

随机推荐

为什么 PostgreSQL 的 \dt 仅显示公共模式表？

我使用 psql 在 PostgreSQl 数据库中创建了一个新架构 CREATE SCHEMA my schema 但是当我发出 dt命令我只看到其中的表public架构但是我可以访问中的所有表my schema with my s
更新到 gradle 7 后，方法 com.android.build.gradle.internal.core.MergedFlavor#setSigningConfig 的方法重载不明确

我刚刚将 gradle 从 6 更新到 7 将 AGP 从 4 更新到 7 我的 gradle 设置的一部分停止了编译 applicationVariants all variant gt if variant getName contai
在 Piston2d 中渲染文本的函数中的 GlyphCache 类型是什么

我正在尝试编写一个单独的函数来使用piston2d 渲染文本采取你好世界 rs https github com PistonDevelopers piston examples blob master src hello world r
`font-weight` 在 Chrome 上不起作用？

刚刚测试了一些在 Firefox 上完美运行的东西而 chrome 则没有任何效果font weight bold bolder财产我试图查找另一个可能会覆盖它的 CSS 属性但没有谷歌也没有给我答案 position absolu
在 T-SQL 中反序列化 XML 数据对象 [重复]

这个问题在这里已经有答案了可能的重复在 T SQL 中反序列化 XML 对象 https stackoverflow com questions 13562635 deserialize xml object in t sql 我有一个
“bin\Debug\Daemon.exe.manifest;bin\Release\Daemon.exe.manifest”对于 * 任务的“InputManifest”参数来说是无效值

Error Error 1 bin Debug Daemon exe manifest bin Release Daemon exe manifest 是一个无效值 InputManifest 参数生成应用程序清单任务多个项目不能传递
以编程方式向 Mac 添加/删除工作区

我有一个相当简单的问题我如何以编程方式添加删除任务控制中找到的工作区我看过这个帖子here https stackoverflow com questions 6250864 change to other space macosx
如何在MySQL数据库中显示日期和价格并在PHP中以各种格式显示

我是 php mysql 新手所以我一直以我通常在页面上显示日期的任何格式插入日期例如 Saturday June 19 2010 直接以纯文本形式存入数据库但我见过人们以其他方式输入它然后使用某些 php 函数以各种格式显示相同的
audio.currentTime invalidStateError IE11、JS、HTML5

我在 IE11 中收到此错误我临时更改了一个数字上的所有变量但我无法摆脱此错误 audio currentTime 10 错误看起来像 SCRIPT5022 InvalidStateError 该脚本在 Chrome 和 Firefox
sql fiddle 可以处理的内容有限制吗？ sql fiddle 不编译任何内容并且不返回任何错误消息

我最近创建了一个查询该查询成功编译并返回所需的结果当我在 stackoverflow 上的用户为我提供的另一段代码中使用该代码作为子查询时我遇到了一些问题但最终得到了解决我尝试将此查询用作给我的那段代码中的子查询但是 sql f
Tornado：stream_request_body 输出的 mime 类型

我在用着tornado web stream request body tornado v4 0 1 保存发布数据但似乎保存的文件的 mime 类型仍然是application octet stream 我需要知道上传文件的 mime 类
上传到 iTunes Connect 时如何解决“应用程序未通过协同设计验证”？

我遇到了一个问题无法通过在不同资源中进行深入搜索来解决因为大多数类似指出 Icon png 大小等错误我在验证后尝试上传我的应用程序在我的设备上正确构建并运行我的证书安装正确我的证书个人资料没有过期 Icon png 具有
使用代码禁用黑莓的睡眠模式

如何使用 J2ME 防止黑莓应用程序进入睡眠模式我看到这个建议要做一个密钥注入 http supportforums blackberry com t5 Java Development Prevent BlackBerry From G
Angular 8 和导入 Json

我读过一些文章指出从 type script 2 9 开始您现在可以直接导入 json 所以我修改了我的tsconfig json文件如下 compileOnSave false compilerOptions baseUrl outD
测试依赖于静态方法的方法有哪些方法？

我需要测试一些依赖于 Spring Security 的安全相关类这段代码利用了SecurityContextHolder getContext 这是静态的如何在不设置整个安全上下文的情况下测试调用方法我们将 JUnit 4 与 Mo
使用 Spring Data Embedded Mongo 在 Mongo db 中导入 JSON 文件

我正在尝试编写一些与需要从 MongoDB 提取数据的方法相关的集成测试详细来说我正在使用嵌入式蒙古 http docs spring io spring boot docs 1 3 2 RELEASE reference html b
Android - 查询是否检查同步帐户是否同步

如何查询同步帐户是否已检查同步用户无法控制是否account选择进行同步而是选择 acount contentAuthority 对例如可以检查您的 Gmail 帐户以同步联系人但不能检查日历事件以下代码用于检查第一个输入的 c
Java：实例化没有默认构造函数的泛型类

我正在尝试这样做 public class BaseTable
Spring集成错误“没有可用的输出通道或replyChannel标头”

我不知道为什么我会得到例外 Caused by org springframework messaging core DestinationResolutionException no output channel or replyChan
R data.table 按组和条件连接/子集/匹配

我正在尝试按 2 个 data tables 中的组对数据进行子集匹配但无法弄清楚这在 R 中是如何实现的我有以下 data table 其中包含 City ID 和时间戳列名称时间 Library data table time

R data.table 按组和条件连接/子集/匹配

R data.table 按组和条件连接/子集/匹配 的相关文章

随机推荐

热门标签

R data.table 按组和条件连接/子集/匹配的相关文章