使用列表列对 data.table 进行分组

2024-05-06

我有一个非常大的问题，循环遍历 data.table 来做我想做的事情太慢了，所以我试图绕过循环。假设我有一个 data.table 如下：

a <- data.table(i = c(1,2,3), j = c(2,2,6), k = list(c("a","b"),c("a","c"),c("b")))

> a
  i j   k
1: 1 2 a,b
2: 2 2 a,c
3: 3 6   b

我想根据 k 中的值进行分组。所以像这样：

a[, sum(j), by = k]

现在我收到以下错误：

 Error in `[.data.table`(a, , sum(i), by = k) : 
 The items in the 'by' or 'keyby' list are length (2,2,1). Each must be same length as rows in x or number of rows returned by i (3).

我正在寻找的答案是首先对 k 列中具有“a”的所有行进行分组并计算 sum(j)，然后计算具有“b”的所有行，依此类推。所以期望的答案是：

k V1 
a 4
b 8
c 2

有什么提示如何有效地做到这一点吗？我无法通过重复行来融化 K 列，因为 data.table 的大小对于我的情况来说太大了。

我认为这可能有效：

a[, .(k = unlist(k)), by=.(i,j)][,sum(j),by=k]

   k V1
1: a  4
2: b  8
3: c  2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

使用列表列对 data.table 进行分组的相关文章

相对于时间求平均值

我有以下带有日期时间和相应值的数据集时间间隔为每10分钟一次我需要以 15 分钟的间隔生成新行例如 15 40 的值为 599 15 50 的值为 594 因此需要在两者之间生成一个新行即 15 45 的平均值为 599 和 594
使用条件求 R 中的累积和

我需要创建一个新变量其中包含每个 ID 过去三年金额的总和如果没有三年的数据则应显示 NA 举个例子 ID YEAR AMOUNT 1 2010 5 1 2011 2 1 2012 4 1 2013 1 1 2014 3 2 2013
将时间值转换为数字，同时保留时间特征

我有一个数据集其中包含不同事件发生的间隔时间我想要做的是将数据转换为数字向量以便更容易操作和运行摘要制作图表等同时保持其时间特征这是我的数据片段 data lt c 03 31 12 17 16 29 09 52 04 01 0
在模块中使用shiny的renderUI

这是我在 stackoverflow 上的第一个问题我在闪亮 1 0 5 中遇到模块和 renderUI 的问题当我在中使用 renderUI 时 Main Part ui lt bootstrapPage uiOutput Dynam
使用循环（或向量化）按向量中的多个元素对列表进行子集化

我有3个清单data frames my list lt list a data frame value c 1 5 class c letters 1 3 a b b data frame value c 6 1 class c lett
如何从线性模型 (lm) 预测 x 值

我有这个数据集 x lt c 0 40 80 120 160 200 y lt c 6 52 5 10 4 43 3 99 3 75 3 60 我使用计算了一个线性模型lm model lt lm y x 我想知道的预测值x如果我有新的y值
移动 sf 对象的经度

我有一张国家地图 sf 对象我想改变俄罗斯东部的经度以便它不与俄罗斯其他地区隔离看图片 https i stack imgur com NBjyK jpg 我找到了后端代码st shift longitude https github
如何有条件地选择一列，并从 R 中另一个有条件选择的列中的行中减去这些行中的值？

我知道我的问题标题很冗长可能很难理解所以我会尽力在这里解释一下这是一些示例数据 transactions lt tibble id seq 1 7 day paste rep day each 7 seq 1 7 sep sent t
如何使用ggplot2在轴标签上显示层次结构？

I would like to create a plot like this with ggplot2 我在这里犯了一个小错误导致并非所有标签都显示出来显然我确实希望所有标签都显示然而我的谷歌搜索没有找到任何结果我得到的最接近的
当隐含 ID 列时，如何合并 csv 文件中的多个数据框？

我想将一堆数据框合并在一起因为如果您只处理一个数据框则许多操作似乎会更容易但如果我错了请纠正我目前我有一个像这样的数据框 ID var1 var2 A 2 2 B 4 5 Z 3 2 每个 ID 位于单行上并带有多个单个测量值
merge.zoo 删除时区

的结果merge zoo与其输入的时区不同考虑下面的例子 library zoo zoo a zoo data frame a 1 5 seq as POSIXct 2014 01 01 00 00 01 tz UTC as POSIXc
从 R 中的因子记录创建变量

我有点迷失了我有一个如下所示的数据框 tract ageClass count 1 0 4 71 2 0 4 192 3 0 4 81 1 5 8 9 2 5 8 86 3 5 8 42 我想要这样的结果 tract 0 4 5 8 1
R data.table 按组创建列表列

我有一个data table下面我想将一个函数应用于列v2通过分组v1 and order 结果列v3应该是下面的向量列表如何编写这个函数以便它为每个组的第一行返回一个 0 向量 order 1 v1 in c 1 2 对于组中的每
dplyr::case_when 与 if_else 对于需要两个条件的摘要列

df lt data frame id c 1 6 start date c Mar 22 Feb 22 Jan 22 Dec 21 Nov 21 Oct 21 Jan 22 c NA NA 1 0 0 1 Feb 22 c NA 1 1
如何使用 2 个不同的 y 轴进行绘图？

我想在 R 中叠加两个散点图以便每组点都有自己的不同的 y 轴即在图上的位置 2 和 4 中但这些点看起来叠加在同一个图上是否可以这样做plot Edit显示问题的示例代码 example code for SO question
如何从 R 中的嵌套 json 数据中提取数据

我需要能够从这个包含许多 json 条目的文件中提取这些字段 sender Hostname mem used p cpu user p load load 5 cat tmp txt senderDateTimeStamp 2016 04
mutate rowSums 排除一列

我有一个像这样的数据框 gt df Source local data frame 4 x 4 a x y z 1 name1 1 1 1 2 name2 1 1 1 3 name3 1 1 1 4 name4 1 1 1 想要通过添加 x
如何在变成因子的变量中保留原始值？

这是一些工作代码来说明我的问题 Categorical variable recorded as numeric integer df1 lt data frame group c 1 2 3 9 3 2 9 1 9 3 2 我有一个分类变
即使设置了语言环境，data.frames中的藏文字符也无法在R控制台中显示（中文可以，矩阵中的藏文可以）

在 R 中藏文字符位于 data frames 中时无法正确显示 gt Sys setlocale LC CTYPE Tibetan 1 Tibetan China 950 gt data frame a a 1
泛化 R %in% 运算符以匹配元组

前几天我花了一段时间寻找一种方法来检查行向量是否包含在 R 中的某些行向量集中基本上我想概括 in 运算符来匹配元组而不是向量中的每个条目例如我想要 row vec c A 3 row vec 1 A 3 data set rbin

随机推荐

NSImage 到 NSBitmapImageRep

如何将 NSImage 转换为 NSBitmapImageRep 我有代码 NSBitmapImageRep bitmapImageRepresentation NSBitmapImageRep ret NSBitmapImageRep s
Eclipse 调试模式下的 GDB 找不到 stdlib/rand.c

我试图让 gdb 在 ubuntu 上与 eclipse cdt 一起运行以开始调试一些简单的程序所以我做了我认为必要的步骤来让它运行 1 创建可执行项目 2 Compile 3 Run 4 创建文件 gdbinit 并将其放在主项目文
ASP.NET/ADO.NET：处理 .NET 对象内的许多数据库连接？

我们有一个 NET 对象它对数据库进行大量读写操作在该对象或使用它的 ASP 页的整个生命周期中它可能会通过查询更新来访问数据库 1 到 10 次它不是在每次对象需要访问数据库时打开和关闭数据库连接而是只是在实例化期间打开
如何在 SnakeYaml 中解析 YAML 文件的一部分

我是 YAML 新手并且解析了一个 YAML 配置文件如下所示 applications authentication service version 2 0 service url https myapp corp auth app
如何防止图像被裁剪

我正在尝试创建一个包含很多图层的动画图片为了在不同的屏幕上获得正确比例的图像我使用covercss 属性值我已经尝试过object fit对于图像和background size用于背景图像这就是为什么我的宽屏幕图像被浏览器裁剪的原
将文件存储在文件系统上或在 SQL Server 中存储为 varbinary(MAX)

我知道对于将文件作为 blob 存储在数据库中是否是不好的做法存在很多争议但我只是想了解这对于我的情况是否有意义我正在创建一个 ASP NET 应用程序在一家大公司内部使用用户需要能够将文件附加到系统中的作业这些文件通常是 P
简化巨大的 if 语句 - 设计模式？

我可能有一组如下所示的 if 语句 if a and b and c and d do stuff else a and b and c and d do something else else a and b and c and D do
将 Datagrid 组件与自定义查询结合使用 - react-admin

将 Datagrid 组件与自定义查询一起使用时收到以下错误下面的代码适用于反应管理版本 3 3 1 但不适用于版本 3 8 1 类型错误无法读取未定义的属性包含浏览器的控制台信息列表组件必须在内部使用依赖 props 而不
TSLint ：变量名必须是驼峰或大写

我有一些以下划线开头的变量名称更新 tslint json 后我仍然收到此警告 tslint json extends tslint recommended rules variable name true ban keywords ch
不要使用android内置的org.json

我写了一个使用的库org json http json org A 来自 json org 假设 Android 使用相同的在 android 中也称为org json B 只是它遗漏了一些相对关键的功能现在我想做的是设置我的 grad
Android 回调监听器 - 将 SDK 中的 pojo 的值发送到应用程序的 Activity

我有一个深埋在 SDK 中的 java 类它执行一个操作并返回一个布尔值它不知道应用程序的主要活动但我需要主要活动来接收该布尔值我见过很多关于回调广播和监听器的问题但他们似乎都了解该活动我的 pojo 确实有一个 Activi
无法加载文件或程序集“SharpSvn”或其依赖项之一。尝试加载格式不正确的程序

我刚刚在这里下载了 64 位版本的 SharpSVNthe link http sharpsvn open collab net files documents 180 5570 SSvn 1 7002 1998 x64 zip 当我运行我
创建每 5 分钟刷新一次的物化视图

我创建了一个每 5 分钟刷新一次的物化视图但是当我在物化视图上插入并执行选择时我会得到相同的旧数据吗需要手动刷新吗 CREATE MATERIALIZED VIEW MVW TEST REFRESH FORCE ON DEMAND S
System.Globalization.CultureInfo 不包含 Name 的定义

我对 System Globalization CultureInfo 类和 System Globalization 命名空间有这个特殊问题我从具有 CultureInfo 属性的 API 调用返回一个对象语言我能够成功地将其在客户
我应该在 laravel 5.1 中将模型保存事件监听器放在哪里

Laravel 文档说我应该将模型事件放在EventServiceProvider boot 像这样的方法 public function boot DispatcherContract events Raisefund saved fun
在容器中运行多个相似的进程有意义吗？

提供有关该问题的背景的简要背景目前我和我的团队正在将微服务迁移到 k8s 以减少维护多个部署工具和管道的工作量我们计划迁移的微服务之一是 ETL Worker 它监听 SQS 上的消息并执行多阶段处理它是使用 PHP Laravel
如何使用 html 敏捷包获取自定义标签？

需要创建摘要索引为此我有标签
liquibase中如何设置自增主键字段的起始值

我有一个要求比如我的 mysql 表的主键以 0 开头我应该如何在 liquibase xml 中指定它我在创建表时尝试了 startWith 参数但没有成功
如何使用 np.newaxis？

What is numpy newaxis https numpy org doc stable reference constants html numpy newaxis我什么时候应该使用它在一维数组上使用它x产生 gt gt gt
使用列表列对 data.table 进行分组

我有一个非常大的问题循环遍历 data table 来做我想做的事情太慢了所以我试图绕过循环假设我有一个 data table 如下 a lt data table i c 1 2 3 j c 2 2 6 k list c a b c

使用列表列对 data.table 进行分组

使用列表列对 data.table 进行分组 的相关文章

随机推荐

热门标签

使用列表列对 data.table 进行分组的相关文章