data.table 与 data.frame 的 group_by 的不同行为

2024-03-20

当 dplyr::mutate 用于分组的 data.table 时,分组随后会丢失。 data.frame 不会发生此行为。这是一个错误吗?我正在使用 dplyr_0.4.1 和 data.table_1.9.4。

require(data.table)
require(dplyr)

by_cyl_df <- group_by( mtcars, cyl ) %>%
    dplyr::mutate( . , 
        maxmpg = max( mpg )
    )
groups( by_cyl_df )

[[1]] 缸

by_cyl_dt   <- group_by( as.data.table(mtcars), cyl ) %>%
    dplyr::mutate( . , 
        maxmpg = max( mpg )
    )
groups( by_cyl_dt )

NULL


这是一打开 dplyr 问题 https://github.com/hadley/dplyr/issues/919。之后mutate,组被丢弃。如果您查看课程,您可以看到这种情况的发生。

by_cyl_dt_gg   <- group_by( as.data.table(mtcars), cyl )

class(by_cyl_dt_gg)
# [1] "grouped_dt" "tbl_dt"     "tbl"        "data.table" "data.frame"
class(by_cyl_dt_gg %>% mutate(max=max(mpg)))
# [1] "tbl_dt"     "tbl"        "data.table" "data.frame"

由于它不再分组(groups_dt类被丢弃),groups对于这种类型的对象,函数返回 NULL

> dplyr:::groups.tbl_dt
function (x) 
{
    NULL
}
<environment: namespace:dplyr>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

data.table 与 data.frame 的 group_by 的不同行为 的相关文章

  • 在 R 中读入原始二进制数据并将其转换为整数

    我有一个二进制文件 其中包含编码为不同长度 主要是 2 4 字节 的有符号或无符号整数的数值 为了处理这些数据 我将文件的所需部分读取为raw向量与readBin 然后尝试将其转换为十进制 问题是 R的内置函数有限制 我不太明白 比如没有l
  • R 中舍入到下一个数量级的算法

    如果标题不清楚 我很抱歉 但我无法简洁地解释它 给定一个浓度向量 我想将最大值四舍五入到下一个数量级 即 345 到 1000 另外 我想将最小值四舍五入到较低的数量级 即 3 2 到 1 这些浓度也可能低于 1 因此例如 0 034 需要
  • 如何编写固定宽度的文件?

    我应该编写一个基于固定宽度列的特定格式的 txt 文件 例如 第 1 8 列中的第一个变量 第 9 15 列中的第二个变量 原始数据有不同的长度 它们必须放在指定列的右侧 例如 值 15 96 和 12 489 必须写入第一行和第二行的第1
  • 为特定 ID 重新编码列中的观察结果

    我有一个数据集 称为 调查 其中有行是个人 ID 列中有许多问题 我需要将 1 列中的值重新编码为 NA 并将观察结果移至另一列 例如 ID Fruit Vegetable aaa NA grape bbb NA tomato ccc ap
  • 关于在 LyX 中生成和交叉引用 knitr 图的意见

    我的目标是在 LyX 中包含一个knitr图 我可以在我的文档中交叉引用 我 插入了浮动图像 添加了标题和标签 在浮动图像中插入了 ERT 而不是图像 我所做的图片如下 我在这里检查过类似的问题 但没有人做我所做的事情 所以我在这里问 有没
  • k折交叉验证 - 如何自动获得预测?

    这可能是一个愚蠢的问题 但我只是找不到一个包来做到这一点 我知道我可以编写一些代码来获得我想要的东西 但如果有一个函数可以自动完成它那就太好了 所以基本上我想对 glm 模型进行 k 倍交叉验证 我想自动获取每个验证集的预测和实际值 因此
  • 如何自动替换多个文件的文本内容中的字符?

    我有一个文件夹 myfolder包含许多乳胶表 我需要替换其中每个字符 即替换任何minus sign by an en dash 只是为了确定 我们正在替换连字符INSIDE该文件夹中的所有 tex 文件 我不关心 tex 文件名 手动执
  • R中的for循环和if函数

    我正在用 R 中的 if 函数编写一个循环 表格如下 ID category 1 a 1 b 1 c 2 a 2 b 3 a 3 b 4 a 5 a 我想使用 for 循环和 if 函数添加另一列来计算每个分组的 ID 如下所示的计数列 I
  • 从 SpatialPolygons 和其他 sp 类中提取要素坐标

    Package sp为不同的空间概念 点 线 多边形 提供了许多类 对于某些类 访问要素坐标很简单 例如SpatialLines 所有示例均取自相应课程的帮助页面 l1 cbind c 1 2 3 c 3 2 2 l1a cbind l1
  • 通过 boot.ci 函数获取多个统计数据的 Bootstrap 置信区间

    我想通过以下方式获得多个统计数据的引导置信区间boot ci功能 这是我的 MWE 我有两个统计数据out并想要找到这两个统计数据的引导置信区间 然而 boot ci函数仅为第一个统计量 t1 提供引导置信区间 但不为第二个统计量 t2 提
  • r 闪亮下载过滤数据表(DT)

    我正在尝试做一个shiny应用程序下载过滤后的Datatable 过滤与search 通过删除行进行过滤delete button 下载部分按预期工作 问题 当我第一次使用数据表中的搜索区域进行过滤时 如果我使用按钮删除一行 它会重置第一个
  • 在没有 OneDrive API 的情况下,无法在 Power BI 中使用 R 脚本在安全的 OneDrive 文件夹上写入 csv 文件

    我正在使用 R 在 Power BI 服务中编写一个脚本 该脚本会自动将特定数据集下载到 OneDrive 上的文件中 但是 我不断收到此错误 只能打开 URL 进行读取Error in file file ifelse append a
  • 如何在时间序列的中途更改ggplot2中的线属性?

    取以下两个时间序列的简单图 economics ggplot2 dataset require dplyr require ggplot2 require lubridate require tidyr economics gt gathe
  • ggplot2错误:美学必须是长度一,或者与数据长度相同问题:颜色、字母

    我收到此错误 错误 美学必须是长度一 或者与数据长度相同问题 颜色 字母 当我将 ggplot 与数据框一起使用时Z如图所示 Z lt data frame Name c A G C T T T AG AG GC GC CT CT AT A
  • 如何与 R 包 sf 进行“完整”联合

    我尝试使用三个多边形之间的并集sf st union 下图中显示了 ArcGIS Overlay Union All 的结果 我希望通过使用 R 中的 sf 包获得与 OUTPUT 中五个不同多边形类似的结果 library sf a1 l
  • 如何将表输出复制到剪贴板?

    我试图通过单击按钮将表输出复制到剪贴板 我尝试查看 rclipboard 包 但以我有限的理解 它似乎无法复制输出 我添加了一个actionButton屏幕截图中带有一个图标来显示我想要实现的目标 现在按钮没有任何作用 Code libra
  • 根据R中的行差异对行进行分组[重复]

    这个问题在这里已经有答案了 我有一组具有不同采样间隔的动物位置 我想要做的是采样间隔符合特定标准 例如低于特定值 的组和序列 让我用一些虚拟数据来说明 start lt Sys time timediff lt c rep 5 3 20 r
  • 有条件地为 R 中置信带之外的数据点着色

    我需要对下图中置信带之外的数据点与带内的数据点进行不同的着色 我是否应该在数据集中添加一个单独的列来记录数据点是否在置信区间内 您能举个例子吗 示例数据集 Dataset from http www apsnet org education
  • R数据表:将行值与组值进行比较,有条件

    这是问题的延伸 R数据表 将行值与组值进行比较 https stackoverflow com questions 33285050 r data table compare row value to group values 我现在有了
  • 如何使用 gvisMotionChart 处理 POSIXlt 格式时间?

    The googleVisR软件包出奇的好 然而 我对一个问题感到困惑gvisMotionChart关于 timevar 因为我的数据集中的时间是POSIXlt格式 例如 2009 07 02 19 00 00 2009 07 02 20

随机推荐

  • Gravatar:如何知道用户是否拥有真实图片

    我已经在我的网站上使用了头像服务 但我想知道用户是否上传了他们的照片 有办法知道这一点吗 构造URL时 使用参数d 404 如果用户未设置图片 这将导致 Gravatar 返回 404 错误而不是图像 如果您使用从 gravitar 站点链
  • 将整数转换为单词

    为了设计数据可视化样式 我希望能够使用单词显示整数 例如 两千一十七 而不是数字 例如2017 作为我正在寻找的示例 这里有一个适用于小标量整数的快速函数 int to words lt function x index lt as int
  • AppFabric 缓存 - 对象的序列化和反序列化要求是什么?

    问题 当缓存类的实例并立即将其从缓存中取出时 我取回了对象 它不为空 但其所有属性 字段均为空或默认值 cacheHelper PutInCache testModuleControlInfoOne mci mci has populate
  • 在 JavaScript 中解析 ISO 8601 日期

    我需要有关将具有以下结构的 ISO 8601 日期转换为 JavaScript 的帮助 提示 CCYY MM DDThh mm ssTZD 我想像这样设置日期格式 January 28 2011 7 30PM EST 我想让这个解决方案尽可
  • Jquery UI 自动完成图像

    我在这段代码中遇到错误 有谁能够帮助我 h4 search h4
  • 使用平均成本基础法计算成本

    我有这个 pandas 数据框 我按 股票代码 升序排列 然后按 日期 和 类型 排序 它表示相对于 股票代码 列中股票的交易 Type Ticker Qty Price Amount TotalQty Date 2020 03 01 Bu
  • 操作员之间的气流和数据传输

    我是 Airflow 新手 对 Airflow 及其处理器有疑问 当处理器产生输出时 如何将该输出作为输入移动到下一个处理器 有一个名为 nifi 的软件 它将中间输出存储到流文件中 据我所知 airflow 中没有这样的软件 那么这是怎么
  • 如何在自己的自定义解串器中使用一些 Jackson 解串器?

    我正在努力解决问题中提到的问题 我需要创建一些自定义反序列化器 它或多或少是从标准反序列化器进行类型转换的 原因是ZonedDateTime正在为我的输入工作 但我不想将类型更改为ZonedDateTime 但保留LocalDateTime
  • keras 指标在训练期间不同

    我已经实现了一个基于 SIM 的自定义指标 当我尝试代码时它可以工作 我已经使用张量和 np 数组实现了它 并且都给出了相同的结果 然而 当我开始拟合模型时 返回的值比加载训练生成的权重并应用相同函数时得到的值要高得多 我的职能是 def
  • 通过 SSH 隧道的 PostgreSQL

    我想使用 RazorSQL 连接到在远程服务器上运行的数据库 我使用以下命令在本地主机上创建 SSH 隧道 ssh L 1111 remote server com 5432 email protected cdn cgi l email
  • 是否可以将目录从 Google Compute Engine 实例复制到我的本地计算机?

    使用 scp 我可以添加 r标志通过 ssh 将目录下载到我的本地计算机 使用时 gcloud compute scp r 它说 r 不是可用的选项 如果没有 r 我会收到一条错误消息 指出我的源路径是一个目录 这意味着我只能下载单个文件
  • 如何通过按钮选择或不选择剑道网格

    我有一个网格 在网格定义中启用了选择模式 selectable true 我需要通过按钮使网格不可选择 我尝试了这个 但它不起作用 disableKendoGrid click function var grid myGrid data k
  • 带有 VB6/asp 错误的 C# COM 对象

    我正在尝试通过 COM 公开 C 类库 以便我可以在经典的 ASP 网站中使用它 我用过 sn k regasm 和 gacutil 我现在能做的就是回显字符串 以类变量作为输入的方法对我不起作用 即我的测试方法 EchoPerson Pe
  • 如何编写一个单元测试,其中每个测试用例都有不同的输入但执行相同的操作?

    我需要为一些 python 类创建一个单元测试 我有一个输入和预期结果的数据库 这些输入和预期结果应该由 UUT 为这些输入生成 这是我想要做的伪代码 for i 1 to NUM TEST CASES Load input for tes
  • PowerShell模块,从另一个NestedModule调用NestedModule中的函数

    我有一个 Powershell 模块 在清单中我声明了主模块和两个嵌套模块 模块结构如下 dir Pivot DockerAdmin manifest Pivot DockerAdmin psd1 main module file Pivo
  • 在 Eclipse 中进行 ProGuard 混淆后,Google 地图未加载

    我正在开发一个使用谷歌地图的应用程序 该应用程序工作正常 直到我导出签名的应用程序包 代码被混淆后 地图不再加载 我对 ProGuard 还很陌生 我尝试过修改 proguard cfg 但到目前为止没有任何效果 以下是我尝试过的一些不同的
  • React JS:在 onChange 下拉菜单中传递事件(Ant Design)

    我的表格中有一个下拉菜单 https ant design components select https ant design components select 在此选择下拉列表中 我有 onChange 来调用函数 在 onChang
  • Instagram Graph API,获取关注者的关注者

    我正在尝试想办法 由于大多数 旧 API 已被关闭 我查看了 Graph API 我想检索特定用户的关注者列表 我一辈子都想不通 这真的不可能了吗 Business Discovery API 仅限于企业帐户 目前整个 Graph API
  • Java规则引擎的优缺点[关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 采用 Java 规则引擎的优点和缺点是什么JESS http www jessrules com and Drools http www jbo
  • data.table 与 data.frame 的 group_by 的不同行为

    当 dplyr mutate 用于分组的 data table 时 分组随后会丢失 data frame 不会发生此行为 这是一个错误吗 我正在使用 dplyr 0 4 1 和 data table 1 9 4 require data t