如何按多列对data.table进行分组？

2024-03-20

我正在使用data.table包以加速数据集上的一些汇总统计收集。

我很好奇是否有一种方法可以按多个列进行分组。我的数据如下所示：

  purchaseAmt        adShown        url
   15.54            00001         150000001
    4.82            00002         150000001
  157.99            05005         776300044
   ...               ...            ...

我可以做这样的事情：

adShownMedian <- df1[,median(purchaseAmt),by="adShown"]

获取每个广告的中位数。我将如何做一些结合的事情adShown and url?

我试过这个：

adShownMedian <- df1[,median(purchaseAmt),by=c("adShown","url")]

但没有运气。

有什么建议么？

Use by=list(adShown,url)代替by=c("adShown","url")

Example:

set.seed(007) 
DF <- data.frame(X=1:20, Y=sample(c(0,1), 20, TRUE), Z=sample(0:5, 20, TRUE))

library(data.table)
DT <- data.table(DF)
DT[, Mean:=mean(X), by=list(Y, Z)]


     X Y Z      Mean
 1:  1 1 3  1.000000
 2:  2 0 1  9.333333
 3:  3 0 5  7.400000
 4:  4 0 5  7.400000
 5:  5 0 5  7.400000
 6:  6 1 0  6.000000
 7:  7 0 3  7.000000
 8:  8 1 2 12.500000
 9:  9 0 5  7.400000
10: 10 0 2 15.000000
11: 11 0 4 14.500000
12: 12 0 1  9.333333
13: 13 1 1 13.000000
14: 14 0 1  9.333333
15: 15 0 2 15.000000
16: 16 0 5  7.400000
17: 17 1 2 12.500000
18: 18 0 4 14.500000
19: 19 1 5 19.000000
20: 20 0 2 15.000000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

groupby

dataTable

如何按多列对data.table进行分组？的相关文章

获取所有参数作为列表

R 是否提供对象函数方法关键字来获取所有函数参数使用一个例子 function a b default 会提供a and b也在函数环境内有没有类似的说法list 这还包括a and b在结果中或者换一种方式简写list a
递归累积函数

我需要在 R 中编写一个累积求和函数但我一直碰壁该函数具有以下结构 a x1 a x2 a 2 x1 a x3 a 2 x2 a 3 x1 a x4 a 2 x3 a 3 x2 a 4 x1 等等 cumsum 似乎不适用于此类功能有
R 中的聚类分析：确定最佳聚类数

如何选择最佳的聚类数量来进行 k 均值分析绘制以下数据的子集后多少个簇比较合适如何进行聚类树突分析 n 1000 kk 10 x1 runif kk y1 runif kk z1 runif kk x4 sample x1 lengt
为什么 as.character() 返回日期列表中的整数？

我惊讶地发现 R 中出现以下行为 as character c Sys Date gt 1 2018 02 05 as character list Sys Date gt 1 17567 为什么会出现这种情况也就是说显然 17567
使用 ggplot 未完全填充等值线图

我正在尝试使用以下方法绘制我的第一个填充等高线图ggplot 根据我的数据我期待类似的结果但我的结果是 a lt c 1 1 1 1 1 3 1 2 2 2 2 2 2 5 2 1 3 3 3 3 1 3 2 b lt c rep c
R源代码.调用函数[重复]

这个问题在这里已经有答案了我正在查看R中cov的source code 并遇到了一段我不太明白的代码协方差的数学定义goes http en wikipedia org wiki Covariance here if method pe
用于不规则时间序列的滚动窗口函数，可以处理重复项

我有以下数据框 grp nr yr 1 A 1 0 2009 2 A 2 0 2009 3 A 1 5 2009 4 A 1 0 2010 5 B 3 0 2009 6 B 2 0 2010 7 B NA 2011 8 C 3 0 2014
获取行名以 ABC111 开头的所有行

我们有以下数据框 col1 col2 col3 ABC111001 12 12 13 ABC111002 3 4 5 ABC000111 7 6 1 ABC000112 9 23 1 如何获取行名以开头的所有行ABC111 如下 ABC1
R：install.packages 中出现错误：无法打开连接

我试图安装 RINDSEL 包但无法安装它并且不断收到以下错误 install packages 中出错无法打开连接我从以下位置下载了该软件包 rindsel 1 0 2 zip 综合养殖平台 http old ibpdev net
如何在主图区域之外的 ggplot2 中添加多个标题

我想为页脚添加两个标题但 ggplot 似乎只需要 1 是否有解决方法可以将注释或 geom text 添加到左下角和右下角 library ggplot2 p lt ggplot mtcars aes x wt y mpg geom p
如何在 R 树形图中省略标签？

我一直在使用R 树形图包 http cran r project org web packages treemap treemap pdf我有一个 2 层深的树形图我希望打印第二级标签但不打印第一级标签使用手册页中的示例 tmPlot
为什么 data.table `:=` 的 knit 缓存失败？

这在精神上与this https stackoverflow com q 15267018 1900520问题但机制上一定不同如果您尝试缓存knitr包含一个块data table 分配然后它的行为就好像该块尚未运行并且后面的块看不到
dmvnorm MVN 密度 - RcppArmadillo 实现比 R 包慢，包括一些 Fortran

The solution现已上线RCPP画廊 http gallery rcpp org articles dmvnorm arma 我从 RcppArmadillo 中的 mvtnorm 包重新实现了 dmvnorm 我有点喜欢犰狳但我
mclapply 调用应该嵌套吗？

正在筑巢parallel mclapply是个好主意吗 require parallel ans lt mclapply 1 3 function x mclapply 1 3 function y y x unlist ans Outpu
读取并绘制从大文件中读取的数据

我们有相当大的文件大约为 1 1 5 GB 主要是日志文件其中包含易于解析为 csv 的原始数据随后应该将其绘制成图表以生成一组图形图像目前我们正在使用 bash 脚本将原始数据转换为 csv 文件其中仅包含需要绘制图表的数字
使用 gtable 排列 ggplot 绘图（具有相同宽度的 grobs）以创建 2x2 布局

我正在尝试使用 grobs 和 gtable 将 4 个 ggplot2 图排列成 2x2 网格我不知道如何设置宽度也不知道如何设置非 1xn 或 nx1 排列使用此代码 data iris a lt ggplot iris aes
如何管理和处理 R 包中的补充数据

我想在我的 R 包中添加补充数据我知道关于LazyData true in DESCRIPTION 但不想使用它因为示例数据相当大所以我创建了一个目录 data 其中包含两个 RData文件和一个datalist 我添加使用tools
根据另一个向量替换向量中的值

我想替换向量中的值 x 与另一个向量 y 陷阱 22 方法需要是动态的以适应向量中不同数量的级别 x 例如考虑向量x x lt sample c 1 2 3 4 5 100 replace TRUE gt x 1 2 4 1 1 3
Rstudio 命令历史记录

这些天我经常使用 Rstudio 但最近注意到我的命令不再存储在历史记录中我不知道这是从什么时候开始的但可能是在安装最新版本时发生的关于问题可能是什么的任何想法吗 Thanks 这是我们在 v0 93 73 中引入并在 v0 93 7
如何融合颜色和形状？

当我有一个超过 6 个值的变量时我的麻烦就开始了因为这是 ggplot2 中 scale shape 函数的当前最大值由于这个问题我尝试使用另一个变量来解决这个问题我只是将原始变量的长度包裹起来这是我的示例代码 dataf lt

随机推荐

如何在 Storybook 6.0 中自定义深色和浅色主题

我正在使用浅色和深色主题制作 PWA 我想创建我的 Storybook 浅色和深色主题来反映这些主题因此我创建了一个函数如果我向它传递 Material UI 主题和基本名称它将返回一个新的 Storybook 主题对象但是我如何
仅当配置中的enableSessionState设置为true时才能使用会话状态

我正在使用 vs 2010 使用 c 开发 Asp net MVC 2 应用程序当我在调试模式下本地运行我的应用程序时出现下面提到的错误错误信息图片如下错误消息文本如下仅当enableSessionState设置为true时才能使
Linq to SQL 存储库是否应该实现 IDisposable

在过去的几天里我一直在使用 Linq 谷歌搜索大量有关存储库模式的信息那里有很多信息但它们往往是矛盾的我仍在寻找明确的来源我仍然不确定的一件事是存储库是否应该实例化它自己的 DataContext 并具有 SubmitChange
如何实现气泡只有在完全缩放的情况下才可点击 d3js

我这里有一个小问题我正在使用这个例子 http bl ocks org mbostock 7607535 http bl ocks org mbostock 7607535 并且我修改了 flare json 文件如下 name flar
自定义勺边框样式 - 响应式、自定义和动态边框样式 - 适合高度、自定义边框角 - 双描边 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案有没有办法在 CSS 或 jQuery 中制作自定义勺子边框样式就像下图一样这里有一个小提琴 http jsfiddle net
如何手动设置全息视图颜色条的限制？

当我尝试输入自己的股票代码时在较早的牢房中 ticker FixedTicker ticks range 0 10 在下面的单元格中 opts HeatMap colorbar True colorbar opts ticker tick
错误：与nodejs程序连接时连接ECONNREFUSED 127.0.0.1:5432 [重复]

这个问题在这里已经有答案了我在 CentOS 8 机器上设置了一个 postgresql 服务器并在同一台机器上运行了一个 js 程序使用pg图书馆 const Pool require pg const pool new Pool
如何更改 Android 的点击叠加标记？

我制作了一个应用程序当用户单击它时我需要更改覆盖项目的可绘制对象我正在使用以下代码来实现此效果 protected boolean onTap int index OverlayItem item mOverlays get inde
OBJLoader 的异步问题 - 等待 XHR 完成加载

如何使 OBJLoader 简单地返回对象而不是将其添加到场景中我遇到了同步问题我的代码没有等待 XHR 请求完成从而引发错误以下示例显示了该问题 var loader new THREE OBJLoader return a me
为“x < y <- z”定义“<<-”时存在歧义

g grothendieck 的回答这个问题 https stackoverflow com questions 53744379 assigning a value to a list item using assign 53745177
为什么 Floor 不返回整数？ [复制]

这个问题在这里已经有答案了刚才我偶然发现了一个事实即 C 函数floor返回与您传递给它的类型相同的类型无论是float double或诸如此类根据这个参考 http www cplusplus com reference cmat
如何通过java编码生成Jmeter仪表板报告。（不是 Windows 或 shell 命令）

我必须通过java编码生成Jmeter仪表板报告在java代码下面我用来生成正常的jmeter报告我必须生成一个通过java的仪表板报告 public class JMeterFromExistingJMX public stati
SSIS-通过单个 SQL 任务设置多个变量

我正在尝试将多个变量设置为返回具有多列的单行的 SQL 查询的结果 SQL语句的格式为 SELECT top 1 a b c x y d FROM tablename WHERE aSwitch 1 因此我希望使用执行 SQL 查询任
以编程方式清除 WPF ComboBox 中的选择

我在 WPF 中有一个 ComboBox 其 ItemsSource 以编程方式设置为列表我将如何清除事件处理程序中的选择我试过了 comboBox SelectedIndex 1 comboBox SelectedItem null
在 Xamarin.Forms ScrollView 中水平滚动

我正在使用 Xamarin Forms 并创建了一个 ScrollView 其中包含一个水平 StackLayout 我希望能够水平滚动所以我设置 Orientation ScrollOrientation Horizontal 但我没有
如何解决“错误：错误：0308010C：数字信封例程::不支持”Nodejs 18错误[重复]

这个问题在这里已经有答案了我的 NuxtJS 应用程序需要帮助最近在我离开应用程序一段时间 2 个月而没有更新后应用程序中出现了 ESLint 冲突因此在我开始研究它之后尝试解决 ESLint 问题提出了挑战然后我必须将项
即使上一步失败，但作业仍然失败，如何运行下一个 github 操作步骤？

这个问题类似于即使上一步失败如何运行 github actions 步骤同时作业仍然失败 https stackoverflow com questions 58858429 how to run a github actions st
正确使用

在我的网站中已登录的用户可以更改其个人资料图片此过程包括将上传的图像保存到网站根目录中的文件夹中当我测试它时我收到一个错误我应该使用权限授予对此特定文件夹的访问权限我无法控制控制面板控制面板的人说他确实授予了Images文件夹
如何在 R 中运行 PowerShell 命令？

例如此 PowerShell 命令返回目录中前 5 个最大的文件 gci r sort Length desc select fullname f 5 是否可以在 R 中运行它并将其分配给变量我试过这个 system gci r sor
如何按多列对data.table进行分组？

我正在使用data table包以加速数据集上的一些汇总统计收集我很好奇是否有一种方法可以按多个列进行分组我的数据如下所示 purchaseAmt adShown url 15 54 00001 150000001 4 82 00002

如何按多列对data.table进行分组？

如何按多列对data.table进行分组？ 的相关文章

随机推荐

热门标签

如何按多列对data.table进行分组？的相关文章