根据不同的列名连接表

2023-12-10

我正在观看 Greg Reda 制作的关于 Pandas 的视频[1],看看 Pandas 可以做什么,与 data.table 相比如何。我很惊讶地发现在 data.table 中连接表是多么困难。如果您观看视频,特别是 @49:00 到 @52:00 分钟,您会发现 Pandas 允许您根据不同的列名称连接表,并且您可以为左表和右表选择不同的后缀。我了解 setkey 用于优化目的[2],并了解如何使用相同的列名连接表[3]。我尝试了 data.table 的合并,但设置时遇到很大困难by=使用不同列名的关键字参数。这是我的问题。

在 data.table 中,是否可以根据不同的列名连接表?如果是这样,怎么办?如果没有,为什么不呢?另外,更有用的是,这个功能不是很有用吗?我感到惊讶的是这个问题没有更早地出现。如果之前已经讨论过这个问题,请原谅我(请指出他们)。

顺便说一句,Greg 所说的数据可以在他的 github 上找到[4]。

  1. https://www.youtube.com/watch?v=1uVWjdAbgBg
  2. https://stackoverflow.com/a/13686768/3892933
  3. 在 R data.table 中连接具有相同(非键控)列名的表
  4. https://github.com/gjreda/pydata2014nyc

Update:下面列出的所有功能均已实现并在当前稳定版本的 data.table 中可用v1.9.6在克兰上。


data.tables 中的联接至少可以进行这些改进。

  • merge.data.table取得by.x and by.y论据

  • Using 辅助键使用上面讨论的两种形式加入,无需设置键,而是通过指定列x and i.

最简单的原因是我们还没有做到这一点。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

根据不同的列名连接表 的相关文章

  • 如何在不指定数据集的情况下调整函数

    我有一个函数 基本上可以过滤SPV行 如下所示 请注意 我这样做return coef lt function df1 idd dmda CategoryChosse 然而 我不希望df1作为函数的参数 而是函数的属性df1数据集 在本例中
  • 您使用 Attach() 或按名称或切片调用变量吗?

    许多介绍 R 的书籍和指南都是从附加一个 R 语言的实践开始的 data frame这样您就可以通过名称调用变量 我一直发现用以下方式调用变量是有利的 符号或方括号切片 2 这样我就可以使用多个data frames 而不混淆它们和 或使用
  • 如何找到对象的创建位置?

    我目前正在努力改进对其他脚本有不同调用的代码 我想知道在哪里创建对象 对于其中一些人来说 只需使用文本编辑器的搜索选项即可 只要看看是否obj lt or obj 有什么结果 但这不适用于使用assign功能 在加载的脚本中创建的也不是 T
  • R 中具有 NA 值的聚合栅格

    我在 R 中有一个分辨率为 1 公里的栅格 其 NA 值分布广泛 但位置不规则 即 包含数据的单元格不连续 并且 NA 值分散 我正在尝试使用用户定义的平均圆角函数 包括在下面 以 5 公里分辨率 因子 5 聚合此栅格 使用 raster
  • 中断、保存并稍后继续循环的最佳方法

    事情是这样的 我有一个需要几天时间才能运行的循环 我想中断循环 检查进度 然后稍后继续 目前 我正在使用以下内容 for i in 1 100000 Sys sleep i 2 5 print i write csv i i csv 我检查
  • 在 R 中将本地日期时间转换为 UTC

    如何将本地日期时间转换为以下格式 12 31 2014 6 42 52 PM R 中的 UTC 我试过这个 as POSIXct as Date 12 31 2014 6 42 52 PM format m d Y H M S tz UTC
  • 为 PDF 输出添加 natbib 选项

    有没有办法指定natibib输出 PDF 时的选项bookdown 我希望 tex 输出具有命令 usepackage sort compress natbib 但似乎没有任何方法可以在 YAML 中指定它 我无法将命令添加到我的序言中 因
  • 有没有办法将字母扩展到超过 26 个字符,例如 AA、AB、AC...?

    我大部分时间都使用字母来表示我的因素 但今天我尝试超过 26 个字符 LETTERS 1 32 期待有自动递归因式分解 AA AB AC 但很失望 这只是字母的限制还是有办法使用其他函数来获取我正在寻找的内容 702够吗 LETTERS70
  • R 在 Ubuntu 中通过代理连接

    我在 Ubuntu 12 04 上安装了 RStudio 0 97 168 当我尝试安装 gstat 库时出现以下错误 install packages gstat dependencies TRUE Warning in install
  • corr.test 与 cor.test p 值

    我正在尝试使用 psych 包 psych 1 6 9 中的 corr test 但在使用 method spearman 时 它似乎给出了与 cor test 不同的 p 值 相关系数相同 但 p 值不同 我整理了一些示例代码和输出 如下
  • 使用 roxygen2 记录数据集

    我正在尝试使用 roxygen2 记录 R 包中的一些数据集 仅考虑其中之一 I have mypkg data CpG human GRCh37 RDa 其中包含一个名为的对象CpG human GRCh37 和一个名为 mypkg R
  • 如何使用 ggplot 绘制矩阵图

    我想可视化一个矩阵 MAT lt matrix c 100 7 0 0 49 0 0 0 49 nrow 3 ncol 3 gt MAT 1 2 3 1 100 7 0 2 0 49 0 3 0 0 49 然而 标准方法不能正确地对小数字进
  • 为什么 quosures 在 group_by() 中起作用,但在 filter() 中不起作用?

    我正在构建一个函数 我将根据字符串操作数据框 在该函数中 我将根据字符串构建一个列名称 并使用它来操作数据框 如下所示 library dplyr orig df lt data frame id 1 3 amt c 100 200 300
  • Sweave 缓存包

    我正在尝试编写一份报告 我的问题是每次我编译 R 时都会加载我在报告中使用的包 如 ggplot2 MASS cubature 这是非常耗时的 有没有办法查包裹 I found 缓存编织但它不起作用 这是我在 sweave 文件中添加的块
  • 根据感兴趣的特定单词绘制高度相关的单词[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我正在尝试绘制一个单词的最高相关性 例如 我想绘制 鲸鱼 一词的最高十个相关性的图表 有人可以帮我执行类似的命令吗 如果有帮助的话我已经安装
  • 整理包中的字段说明

    我很抱歉 因为我知道这个答案可能出现在编写 R 包的手册中 但在我阅读和查看其他包的整理字段时 我无法 100 弄清楚该字段的用途 用简单的语言 我的是英语 来看 包的描述文件中的整理字段有什么作用 人们想在那里放什么 我认为这来自于某个时
  • 如何对plot_ly()图表进行分面?

    Using ggplot2 and plotly制作交互式散点图facet wrap library ggplot2 library plotly g lt iris gt ggplot aes x Sepal Length y Sepal
  • 通过排列进行多组测试

    我有一个 df 其中包含与两个实验相关的两组值 value 1 和 value 2 一个实验包含两组 0 和 1 另一个实验包含三组 0 1 2 test group Value 1 Value 2 AA 0 15 1 11 2 AA 0
  • 在ggplot2中添加水平线到绘图和图例

    这段代码创建了一个漂亮的图 但我想在 y 50 处添加一条水平黑线 并让图例显示一条黑线 并在图例中显示文本 cutoff 但在图例中保留源点 我可以使用 geom line 添加该行 但无法在图例中获取该行 library ggplot2
  • 用于检查和批量线性模型的数据表选项

    我想知道是否有data table用于从数据集中批量处理线性模型并首先进行检查的选项 我需要对每个唯一标识符运行一堆线性模型 但首先我需要进行检查 对于每个唯一的 id 和年份 我需要检查是否有至少 24 个月的先前每月数据 但不超过 60

随机推荐

  • 是否有任何“DOM 更改”事件? [复制]

    这个问题在这里已经有答案了 可能的重复 检测 DOM 中的变化 我需要设置一个事件处理程序 每当在 DOM 上添加 更改 删除某些内容时 该事件处理程序就会触发 这个答案在我的情况下不起作用 第三方开发人员可以修改 DOM 每次 DOM 更
  • 使用文件字段保存节点

    我正在为 Drupal 站点创建批量上传功能 使用 flash 我可以将文件上传到特定的 url 然后由该 url 处理这些文件 我想要做的不仅仅是上传文件 而是创建一个特定类型的节点 并将文件保存到已使用 CCK 设置的文件字段中 由于这
  • 将事件绑定到文本节点

    这是我的 HTML 我需要将点击事件绑定到 someText div someText a href A link a div someText 可以是任何文本字符串 使用 jQuery 将文本节点包裹起来 span 单击该位置 试试看 h
  • c-ares 指定 DNS 解析的网络接口

    有没有办法可以设置 DNS 请求绑定到的网络接口 我们有一个项目 需要使用高优先级流会话通过一个接口 而所有其他请求通过第二个接口传递 示例 设置 eth0 以便所有 ares 请求将通过 eth0 而不是 wlan0 我无法在 c are
  • pyqtgraph中子图大小不等

    我试图解决在 pyqtgraph 布局中为子图设置不同大小比例的问题 但没有成功 代码如下所示 from pyqtgraph Qt import QtGui QtCore import pyqtgraph as pg import pyqt
  • 如何处理 puppeteer 中 ajax 请求后加载的元素

    我正在尝试使用 puppeteer 进行网页抓取 我最近需要处理负载的元素 当我单击搜索按钮时 结果会在 AJAX 中加载 并且我需要选择我尝试选择的元素位于搜索结果中 但不在页面的初始加载中 它生成的页面屏幕截图也包含搜索结果 如果它输出
  • 如何在c#中将ascii字符转换为byte

    您好 我在从 ASCII 转换为字节时遇到问题 我有代码 byte M Convert ToByte M 但这会从 UTF 16 转换为字节 我不想要 在我的问题中 我想发送带有 ASCII 代码的字节 只需告诉编译器将 char 转换为
  • 延迟共享元素转换以完成状态列表动画

    我一直在尝试 Lollipop 上的共享元素转换 我有一个回收器视图 它加载一些卡片 单击一下该卡片就会在下一个活动中展开到其详细信息 我在卡上设置了涟漪效果和 StateListAnimator 但这些是不可见的 因为过渡在这些效果完成之
  • 如何使用 C# Ado.Net 在 sql 查询中查找参数

    我得到了用户在运行时输入的查询 SELECT FROM Reports WHERE ReportDate gt DATEADD d Days getdate AND ReportCode cast Reportcode as int C N
  • 已初始化结构体的指定初始化

    我知道我可以使用指定的初始化程序来初始化 C99 中的结构 如下所示 typedef struct char a char b int c MyStruct MyStruct s a 1 b 2 c 3 该代码在我的 C 编译器中不起作用
  • 根据另一列的值是否在另一个数据帧的列中更新值

    假设我正在向一班学生教 Java 而一位同事正在教他们数学 前几天班级考试了 下面是java的成绩 data 0110200026 50 0110200057 55 0110200079 80 df pd DataFrame data co
  • MATLAB 中的贝叶斯网络

    有没有例子或者工具箱MATLAB我可以在哪里应用贝叶斯网络 我正在解决一个有 8 个变量的问题 但不知道如何开始 有人依赖于某些变量 有的是贝叶斯网络工具箱可通过 Google 代码获取 并附有介绍和示例 希望这可以帮助
  • xhtml2pdf 在创建 pdf(html 到 pdf)时不应用 css

    转换 html template render context resultFile open filepath w b pdf pisa CreatePDF html encode utf 8 dest resultFile encodi
  • Android Publisher Google Console API 未返回评论列表

    基于谷歌文档 我正在调用端点来获取所有评论 如下所示 curl https androidpublisher googleapis com androidpublisher v3 applications com questionpro r
  • 使用node.js观察文件变化

    我有以下用例 A 创建聊天并邀请 B 和 C 在服务器上 A 创建 文件 A B 和 C 将消息写入此文件 A B C 读了这篇文章 文件 我想要在服务器上创建一个文件 并观察该文件 如果其他人向该文件写入内容 则使用 websockets
  • Pandas:如何根据另一列的值创建一列?

    我需要在数据框的末尾创建一个新列 其中该新列中的值是应用某些函数的结果 该函数的参数基于其他列 具体来说 来自另一列 但不同的行 例如 如果我的数据框有两列 包含值x i y i分别 我的第三栏是f x i 1 y i 1 我知道要创建一个
  • 哪些存储不完整类型的STL数据结构可以用作类成员?

    据我所知 从 C 17 开始 某些 STL 数据结构可能 存在 并且以不完整的类型作为描述存储类型的模板参数 例如 我可以使用std unique ptr
  • 在编译的pdf中的文档文本和knitr代码块之间添加空格

    我正在使用 RStudio 0 98 501 编译 Rnw将 R 代码块合并为 pdf 在生成的 PDF 中 文档文本和 R 代码块之间没有空格 我还没有遇到过任何knitr块或包选项 让我指定文本和代码块之间的垂直空间 我想在文本和代码块
  • 如何使用应用程序脚本获取有权访问 Google 共享云端硬盘的所有用户的列表

    我使用 getEditors 获取电子表格的编辑者列表 返回的列表包括共享云端硬盘用户 但是 对共享云端硬盘具有 内容管理员 访问权限的用户不包含在列表中 出现这种情况有什么原因吗 我还发现 getAccess 可用于获取特定用户对驱动器文
  • 根据不同的列名连接表

    我正在观看 Greg Reda 制作的关于 Pandas 的视频 1 看看 Pandas 可以做什么 与 data table 相比如何 我很惊讶地发现在 data table 中连接表是多么困难 如果您观看视频 特别是 49 00 到 5