按多列聚合，对一列求和并保留其他列？根据聚合值创建新列？ [复制]

2024-03-05

我有一个包含销售的数据框。我需要将 df 聚合 2 列ProductID and Day并对不同列中每个聚合组的值求和Amount现在它显示总数。我希望保留也可以分组的其他列（行之间的值相同），在这种情况下只是Product。最后一栏Store不会保留，因为分组行内的值可能会有所不同。但是，我需要添加一列UniqueStores，它计算每组相同 ProductID 和 Day 的唯一商店数量。例如，ID=1 且 Day=Monday 的第一个组将有 1 个唯一商店“N”，因此值将为 1。

我尝试在此处以文本形式起草表格，但无法正确格式化它，因此这里是聚合之前的外观图像：

我尝试过使用 group_by + summarize 和 df[sum,by] 进行聚合，但它们不会保留未作为索引给出的变量。是否有解决方法，而无需手动插入剩余的每一列？

预先感谢，我希望我说清楚了。

输入值：

df <- data.frame("ProductID" = c(1,1,1,1,2,2,2,2), "Day"=c("Monday","Monday", "Tuesday", "Tuesday","Wednesday", "Wednesday", "Friday", "Friday"), "Amount"=c(5,5,3,7,6,9,5,2), "Product"=c("Food","Food","Food","Food","Toys","Toys","Toys","Toys"), "Store"=c("N","N","W","N", "S","W", "S","S"))

我们可以通过操作进行分组dplyr and summarise与sum“金额”和n_distinct（“Store”的不同元素的数量）

library(dplyr)
df %>% 
  group_by(ProductID, Day, Product) %>%
  summarise(Amount = sum(Amount), 
       UniqueStores = n_distinct(Store), .groups = 'drop')
# A tibble: 4 x 5
#  ProductID Day       Product Amount UniqueStores
#      <dbl> <chr>     <chr>    <dbl>        <int>
#1         1 Monday    Food        10            1
#2         1 Tuesday   Food        10            2
#3         2 Friday    Toys         7            1
#4         2 Wednesday Toys        15            2

如果有多列，并且只想对部分列进行子集化，同时保留其余列，则可以选择mutate在数据集中，然后使用distinct得到第一行

df %>% 
  group_by(ProductID, Day, Product) %>%
  mutate(Amount = sum(Amount), 
       UniqueStores = n_distinct(Store), .keep = 'all') %>%
  ungroup %>%
  distinct(ProductID, Day, Product, .keep_all = TRUE)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

按多列聚合，对一列求和并保留其他列？根据聚合值创建新列？ [复制] 的相关文章

通过 R 中的数据子集执行计算

我想对数据框的 PERMNO 列中的每个公司编号进行计算其摘要可以在此处查看 gt summary companydataRETS PERMNO RET Min 10000 Min 0 971698 1st Qu 32716 1st Qu
更改 pander 中的默认对齐方式 (pandoc.table)

我目前正在切换到pander对于我的大部分时间knitr markdown格式化因为它提供了如此出色的pandoc支持我不太满意的一件事是默认的居中对齐营销人员可能会喜欢它但对于技术报告来说这是一个可怕的事情使用的最佳选择Hmis
使用 ggplot 构面时增加闪亮的绘图大小

有没有办法增加绘图窗口的大小shiny取决于在一个中使用的面的数量ggplot图也许使用垂直滚动例如使用下面的示例当输入为 A 有三个方面情节看起来不错当选项 B 选择绘图数量会增加但绘图窗口保持相同大小导致绘图太小是否有
R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
R 编程常用工具

如果已经以不同的方式问过这个问题我深表歉意但我找不到任何达到我想要的东西我真的是从其他软件包 SPSS 开始接触 R 的当我了解真正可以做什么时我意识到我还需要其他工具这让我想到了我的问题您有哪些用于开发 R 代码的设置我
如何在 R 中绘制一列与其余列的关系图

我有一个数据集其中 1 是时间接下来的 14 个是幅度我想在一张图表上散布所有大小与时间的关系其中每个不同的列都是网格化的分层在另一个之上我想使用原始数据来制作这些图表并单独制作它们但只想执行此过程一次数据集A 唯一的自变
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head
如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
R、Rcpp 与 Armadillo 中矩阵 rowSums() 与 colSums() 的效率

背景来自 R 编程我正在扩展到 C C 形式的编译代码Rcpp 作为循环交换以及一般的 C C 效果的实践练习我实现了 R 的等效项rowSums and colSums 矩阵的函数Rcpp 我知道它们以 Rcpp 糖的形式存在并
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我

随机推荐

Javascript：类属性在拖动事件期间变得未定义

我对 Javascript 中的类还很陌生我已经被困了几天试图理解为什么我的属性在我的所有方法中都变得未定义我试图复制this https www kirupa com html5 drag htm到一个类中但不成功因为每次调用方法
在C中，如何使用X11获取屏幕内活动监视器的几何形状（x，y，宽度，高度）

我所有的搜索都得到了关于如何使用 C 获取 X11 中活动屏幕的几何形状的答案但该屏幕可能包含许多显示器并且通常只有一个屏幕除非有许多用户同时使用同一台计算机关于获取屏幕几何形状的那些答案已经过时因为它们没有考虑多个显示器那么
从 mysql 时间戳字段中选择不同的月份和年份，并在 php 中回显它们

我的mysql表有一个createdOn列其filedtype timestamp 的格式为2011 10 13 14 11 12 我需要的是显示与createdOn列不同的月份年份我已经搜索了堆栈溢出并能够使用以下代码回显几个月 s
Codeigniter上传路径无效

下面的人给出了代码和文件夹结构任何人都可以帮助我为什么会出现上传路径似乎无效错误如何解决此错误文件夹结构 Application System Upload 414208 代码点火器代码 config upload path up
中传递多个变量' aria-label='使用 PHP 和 $_GET[''] 在中传递多个变量'> 使用 PHP 和 $_GET[''] 在中传递多个变量

我正在使用 PHP 根据变量创建链接目前我有这行代码我已经使用过多次并且工作完美 echo a href value2 a 以上全部在一行在接收页面我有 assignmentName GET assignName 它从 URL 中检索
C#.net 中具有不同间隔的多个计时器

我想要输入不同间隔的不同计时器例如如果我输入 4 则 4 个计时器创建并在 4 个标签中显示时间其中第一个计时器的时间在 1 秒内变化第二个计时器的时间在 2 秒内变化第三个计时器的时间在 3 秒内变化4tn 计时器的时间在 4
在 Azure 应用服务中部署前端和后端应用程序的最佳方法是什么？

我们正在分别使用 Reactjs 开发前端应用程序和使用 Nodejs 开发后端应用程序但我不太熟悉 Azure 应用服务后端的部署工作方式我已经成功部署了我们的前端它现在已在应用程序服务 URL 中启动并运行但我不确定如何处理后端
在android帮助中翻转位图？

我想为我的游戏节省内存我想问你因为我找不到任何东西上次我在这里问问题时我得到了很好的答案我可以在 Eclipse 中翻转位图这样我就可以节省精灵的内存吗我发现的所有教程都是关于旋转而不是翻转翻转位图的教程仅适用于 open G
通过 Websocket 传输视频

我正在尝试构建可以从双方传输视频的移动应用程序即视频通话之类的东西我研究了 webrtc 但这还没有为移动本机应用程序做好准备无论如何 webrtc 正在做的是允许浏览器直接捕获相机和音频而不需要插件等但在本机移动应用程序中捕获相机
SyntaxError：JSON 输入意外结束 - 这是为什么？

这是我使用express和node js编写的代码 const express require express const https require https const app express app get function req
我应该在哪里存储 jwt 令牌以在服务器端进行身份验证

在我的 Nodejs 应用程序中我使用 jwt 令牌进行身份验证现在在创建令牌后将对其进行验证为此它应该存储在某个地方以供验证之用所以我的问题是我应该将其存储在针对相关用户 ID 的单独数据库模式中还是应该将其存储在其他
using 语句和await 关键字在c# 中表现得很好吗

我有一种情况我正在做一个async调用一个返回和的方法IDisposable实例例如 HttpResponseMessage response await httpClient GetAsync new Uri http www goo
GLib-GObject-CRITICAL ...断言“夸克> 0”失败

我对 Gtk 编程相当陌生我正在使用 Gtkmm 库为我的应用程序编写一个简单的 GUI GUI 是一个更大的应用程序的一部分它实际上编译为两个单独的可执行文件但我不认为这是相关的因为这个问题只涉及两个可执行文件之一无论如何我在
python：重新启动循环

i have for i in range 2 n if something do something else do something else i 2 restart the loop 但这似乎不起作用有没有办法重新启动该循环 Th
ajax发布请求到php $_POST vars为空

我有一个 nginx 重写规则它将 img src 属性重定向到 php 页面在此 php 页面中我尝试发出 GET 请求成功后会向同一页面发出 POST 请求将从 GET 请求返回的数据作为数据发送为什么php脚本中 POST
Hadoop 中的分割大小与块大小

Hadoop 中的分割大小和块大小之间有什么关系当我读到this http willddy github io 2012 08 25 Hadoop Split and Block html 分割大小必须是块大小的n倍 n是整数并且n gt
iOS - iBeacon - iOS 7.1 更新后在后台作为信标进行广告（广播）

我正在尝试使用 iBeacon 制作一个应用程序其中一台设备将用作信标广播器另一台设备将用作接收器我经历了类似的事情在后台将 iPhone 作为 iBeacon 运行 https stackoverflow com q 1894432
保存小部件的屏幕截图

我想保存 Qt 中小部件的屏幕截图我创建了以下应该可以工作的代码 QWidget activeWidget getActiveWidget a function that returns the current widget if act
jQuery on click 不适用于 iPhone（触摸设备）

谁能向我解释一下为什么这在浏览器中有效但在苹果 iPhone 等移动设备上却无效在 iPhone 上我从来没有得到过hello来自警报为什么 div class close Click here div JS document on
按多列聚合，对一列求和并保留其他列？根据聚合值创建新列？ [复制]

这个问题在这里已经有答案了我有一个包含销售的数据框我需要将 df 聚合 2 列ProductID and Day并对不同列中每个聚合组的值求和Amount现在它显示总数我希望保留也可以分组的其他列行之间的值相同在这种情况下只是Pr

按多列聚合，对一列求和并保留其他列？根据聚合值创建新列？ [复制]

按多列聚合，对一列求和并保留其他列？根据聚合值创建新列？ [复制] 的相关文章

随机推荐

热门标签