具有两个 data.table 的类似合并的场景

2023-12-08

我有两个数据框(实际上是 data.tables)。

set.seed(123)
dt1 <- data.table(P=rep(letters[1:3],c(4,2,3)),X=sample(9))
dt1
   P X
1: a 3
2: a 7
3: a 9
4: a 6
5: b 5
6: b 1
7: c 2
8: c 8
9: c 4

and:

dt2 <- data.table(P=rep(letters[1:5],length=10),D=c("X","Y","Z","G","F"))
dt2
    P D
 1: a X
 2: b Y
 3: c Z
 4: d G
 5: e F
 6: a X
 7: b Y
 8: c Z
 9: d G
10: e F

现在我想向 dt1 添加一个新列,其中 dt2 的“D”列,其中 P 在 dt1 和 dt2 中具有相同的值。它应该看起来像这样:

dt_new
   P X D
1: a 3 X
2: a 7 X
3: a 9 X
4: a 6 X
5: b 5 Y
6: b 1 Y
7: c 2 Z
8: c 8 Z
9: c 4 Z

我会做一个data.table join以这种方式:

setkey(dt1, P)
dt1[unique(dt2),nomatch=0]

   P X D
1: a 3 X
2: a 7 X
3: a 9 X
4: a 6 X
5: b 5 Y
6: b 1 Y
7: c 2 Z
8: c 8 Z
9: c 4 Z
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

具有两个 data.table 的类似合并的场景 的相关文章

  • 为什么 ggplot2 图例不结合手动填充和缩放值?

    预期行为 如果我用 ggplot2 创建一个绘图并使用单独的形状和填充比例来描绘数据 我希望图例会在 白色 填充点 看起来是空心的 和 黑色 填充点 看起来不空洞的 在下面的示例代码中 Windows 的图例项应为白色空心点 Linux 的
  • 保存/加载 data.table 的最快方法

    我想做的实际上是使用最快的可用方法来存储data table以便进一步处理 大致如下 从 CSV RDS 读取原始数据 将其转换为data table 将其保存为针对重新读取而优化的格式 RDS 似乎不适用于data table 是对的吗
  • 循环遍历列并将字符串长度添加为新列

    我有一个包含多列的数据框 并且希望为每个列输出一个单独的列 其中包含每行的长度 我试图迭代列名称 并为每列输出一个附加有 length 的相应列 例如 col1 col2 将转到 col1 列2 col1 长度 列2 长度 我正在使用的代码
  • 在闪亮仪表板中显示/隐藏菜单项

    当进入应用程序时 我需要隐藏一个菜单项 当用户选择某个值时 菜单项必须出现 我努力了shinyjs功能hidden 并且它隐藏了一个 menuItem 但是当使用show or toggle 菜单项不会出现 我发现了Rshinydashbo
  • R 中具有 NA 值的聚合栅格

    我在 R 中有一个分辨率为 1 公里的栅格 其 NA 值分布广泛 但位置不规则 即 包含数据的单元格不连续 并且 NA 值分散 我正在尝试使用用户定义的平均圆角函数 包括在下面 以 5 公里分辨率 因子 5 聚合此栅格 使用 raster
  • data.frame 按列分组[重复]

    这个问题在这里已经有答案了 我有一个数据框 DF 说 DF 是 A B 1 1 2 2 1 3 3 2 3 4 3 5 5 3 6 现在我想将 A 列的行组合在一起 并得到 B 列的总和 例如 A B 1 1 5 2 2 3 3 3 11
  • 使用 geom_bar 和 stat="identity" 绘制平均值的 hline

    我有一个条形图 其中确切的条形高度位于数据框中 df lt data frame x LETTERS 1 6 y c 1 6 1 6 1 g rep x c a b each 6 ggplot df aes x x y y fill g g
  • 为 PDF 输出添加 natbib 选项

    有没有办法指定natibib输出 PDF 时的选项bookdown 我希望 tex 输出具有命令 usepackage sort compress natbib 但似乎没有任何方法可以在 YAML 中指定它 我无法将命令添加到我的序言中 因
  • 是否可以使用像“tz=NULL”这样的东西?...“as.POSIXct”默认为依赖于语言环境的时区(与“as.Date”不同),这会导致问题

    我知道这是一个长期存在 根深蒂固的问题 但这是我经常遇到的问题 而且我看到初学者R经常与此斗争 我希望有一个令人满意的解决方案 到目前为止 我的谷歌和 SO 搜索都是空的 但如果在其他地方重复 请指出正确的方向 TL DR 有没有办法使用类
  • 什么是 data.frame 可以做而 data.table 不能做的事情?

    我刚刚开始使用 R 并遇到了 data table 我发现它很棒 一个非常天真的问题 我可以忽略 data frame 来使用 data table 以避免两个包之间的语法混淆吗 来自数据表常见问题解答 http datatable r f
  • 不同的分位数:箱线图与小提琴图

    require ggplot2 require cowplot d iris ggplot2 ggplot d aes factor 0 Sepal Length geom violin fill black alpha 0 2 draw
  • 在 RStudio 控制台中显示西里尔字母

    我在 Rstudio 控制台中显示俄语字符时遇到问题 我使用 readxl 包加载带有俄语的 Excel 文件 西里尔字母在数据框中正确显示 但是 如果我运行一个输出包含变量名称的函数 RStudio 控制台将显示符号而不是正确的西里尔字符
  • R:使用 as.formula 修复模型中的模型调用

    我有一个gls模型 其中我将公式 来自另一个对象 分配给模型 equation lt as formula aic obj row model gt equation temp avg I year 1950 mod1 lt gls equ
  • R 中整数向量的大小

    我原以为 R 有一个用于存储对象的标准开销 看起来是 24 字节 至少对于整数向量而言 但一个简单的测试表明它比我意识到的要复杂 例如 采用长度为 100 的整数向量 使用随机采样 希望避免任何可能存在的偷偷摸摸的序列压缩技巧 https
  • 根据感兴趣的特定单词绘制高度相关的单词[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我正在尝试绘制一个单词的最高相关性 例如 我想绘制 鲸鱼 一词的最高十个相关性的图表 有人可以帮我执行类似的命令吗 如果有帮助的话我已经安装
  • 对 R/Sweave 进行编程以获得正确的 \Sexpr 输出

    我在为 Sweave 进行 R 编程时遇到了一些问题 rstats twitter 小组经常指出这里 所以我想我应该把这个问题向大家提出 我是一名分析师 而不是程序员 所以在我的第一篇文章中请放轻松 问题是 我正在使用 R 在 Sweave
  • 将一个大的 xlsx 文件导入到 R 中?

    我想知道是否有人知道从 大 xlsx 文件 20Mb 导入数据的方法 我尝试使用 xlsx 和 XLConnect 库 不幸的是 两者都使用 rJava 我总是收到相同的错误 gt library XLConnect gt wb lt lo
  • ggplot2:图例中的斜体

    我正在尝试编辑图例中的标签 以便第一个标签 WT 为纯文本 而后续 7 个标签为斜体 我一直在使用element text face c plain rep italic 7 但这导致没有任何标签被转换为斜体 我有点困惑为什么它不起作用 因
  • 在 R 中高效加载稀疏矩阵

    我在将数据有效加载到 R 中的稀疏矩阵格式时遇到问题 这是我当前策略的 不完整 示例 library Matrix a1 Matrix 0 5000 100000 sparse T for i in 1 5000 a1 i idxOfCol
  • R 中的微秒时间戳

    在 CSV 文件中 我有几列 其中一列有时间戳 其中每个时间戳是今天午夜经过的微秒 每个 csv 文件仅包含一天内的数据 因此这并不含糊 我的问题是 如何将这些微秒时间戳解析为 R 多谢 我的 CSV 文件的一部分 34201881666

随机推荐

  • 基于 Eclipse JSDT 的编辑器的内容辅助

    在 Eclipse 中 内容辅助通常由某个类实现implements IContentAssistProcessor JavaDoc example 如何实现同样的CompletionProposals 用于基于 JSDT 的编辑器 我知道
  • 如何在整个应用程序中禁用 iOS 11 拖动?

    出于安全原因 我想在整个应用程序中禁用新的 iOS 11 拖放功能 更具体地说是拖动部分 在 iOS 11 中 默认情况下 所有可以选择文本的地方 弹出窗口 文本视图 网页视图等 的文本都会发生这种情况 我不知道有什么方法可以完全禁用拖动功
  • 使用提交消息中的主题标签在 Jenkins/Hudson 中触发构建

    仅当提交消息中出现特定字符串时 是否可以触发 Hudson Jenkins 构建 例如 我想触发一个构建 通过编写如下提交消息来将我的应用程序推出到开发环境 MYPROJECT 123 修复了 MyClass java 中的 NPE 部署
  • 如何检测 iOS 应用程序是否已重新安装(从 XCode)或升级(从 AppStore)

    我们正在开发的应用程序使用应用程序包中包含的二进制文件 由于需要处理该文件 并且在某些情况下需要重写该文件 因此应用程序会在首次启动时或每当应用程序支持中缺少该文件时 都会将此文件复制到 库 应用程序支持 目录中 然后 应用程序每次启动时都
  • 如何在开始滚动之前为 LazyColumn/ViewPager 设置阈值?

    我正在使用实验性浏览器Jetpack compose 是基于LazyColumn Row 我想做的是设置一些阈值 确定在开始滚动到下一页之前我需要移动手指多少 默认行为是 只要我移动手指 它就会开始滚动 但我希望有一个更大的阈值 即在发生任
  • Terraform 生命周期忽略更改

    我正在尝试对资源资源 aws servicecatalog provisioned product 中的参数应用生命周期ignore changes规则 如下所示 resource aws servicecatalog provisione
  • 如何递归地“扩展”XML/XSD 中的所有内容?

    是否有任何应用程序可以使用带有某些包含的 XML 文件 实际上是 wsdl 作为输入 并递归地浏览这些包含以生成最终的 XML 确实很大 并将目标包含合并到其中 说明 BDS 2006 WSDL 导入程序无法处理包含内容 并且导入的 xsd
  • 接受 POST 请求的 Node.js 服务器

    我正在尝试允许 javascript 与 Node js 服务器进行通信 POST 请求 网络浏览器 var http new XMLHttpRequest var params text stuff http open POST http
  • 空手道启动功能

    需要在所有测试用例执行之前执行 健康检查 测试 功能 这就像执行一堆测试用例之前的初步测试 如果任何预检查失败 则需要退出平台的解决方案 执行您的健康检查功能karate config js using karate call karate
  • 如何使用正则表达式删除末尾可能存在或不存在的模式

    我想在不包含字符串末尾可能存在或不存在的特定模式 括号中的任何内容 的情况下进行捕获 我想捕获以下 3 个示例中除字符串 排除 之外的所有内容 aaaaaa bbbbbb exclude cccccc 我尝试了以下正则表达式 0 1 您可以
  • 将Google结果对象(纯js)转换为Python对象

    所以我尝试使用 Google Map suggest API 来请求地名建议 不幸的是我找不到这方面的文档 下面是一个 URI 示例 返回 suggestion query London 我想在 python 2 5 中使用它 现在 在正确
  • 如何在angularjs中设置范围滑块中的时间?

    我正在使用具有可拖动范围的滑块 https jsfiddle net ValentinH 954eve2L 在 Angular js 中用于时间选择 我想在这个滑块中设置时间 所以我的时钟是从 00 00 到 24 00 但我想设置时间间隔
  • 如何在 Objective C iPhone 编码中播放声音

    我正在开发一个应用程序 它使用一些硬件传感器在屏幕上提供数据 有一个标签随数字更新 我希望每当数字超过 100 或其他值时就播放声音 例如 假设它正在读取数字 然后突然它找到了一个好位置 或其他什么 然后我想要播放声音或点亮灯光 我是一个绝
  • 通过Java找出系统RAM

    我正在编写一个程序 需要在其中进行最小系统 RAM 验证 我如何计算在 JVM 中执行代码的机器的 RAM 我认为纯java根本不可能 在 JVM 中 您只能测量 JVM ram 而不能测量系统 RAM http docs oracle c
  • 在网格上编写随机路径从哪里开始比较合适?

    我不知道从哪里开始 我不是要求别人为我做这件事 但我不知道如何做 所以如果有人能指出我正确的方向 那就太好了 我无法使用谷歌找到任何东西 这就是我需要的 我需要创建一条从网格一侧到另一侧的路径 但不是以随机方式最短 我需要确保如果路径与路径
  • 如何在 Kivy/Python 中从一个屏幕引用另一个屏幕中的 TextInput?

    我正在尝试制作一个可以计算圆锥体积的应用程序 到目前为止 我有一个名为 ConeVolumeScreen 的屏幕 其中有两个 TextInput 小部件
  • MySQL'user_id'在where子句中不明确的问题

    我怎样才能纠正我从下面的代码中不断遇到的问题 其中指出 user id in where clause is ambiguous 我在这里先向您的帮助表示感谢 这是mysql表 SELECT user user info FROM user
  • 正则表达式不是运算符

    正则表达式中是否有 NOT 运算符 就像那个字符串一样 2001 asdf dasd1123 asd 21 01 2011 zqge dzqge name 20019 我想删除所有 0 9a zA z 但不是一年的那个 2001 所以正则表
  • 将文件关联从 Visual Studio 2005 移至 2008

    我的电脑上安装了 Visual Studio 2005 和 Visual Studio 2008 但是当我从资源管理器中打开 aspx 或 master 文件时 它会在 2005 年打开 我希望它们在 2008 年打开 我可以手动更改文件关
  • 具有两个 data.table 的类似合并的场景

    我有两个数据框 实际上是 data tables set seed 123 dt1 lt data table P rep letters 1 3 c 4 2 3 X sample 9 dt1 P X 1 a 3 2 a 7 3 a 9 4