根据另一列的聚合将非聚合列添加到聚合数据集中

2024-01-14

是否可以使用聚合函数从原始数据框中添加另一列，而不实际使用该列来聚合数据？

这是一个非常简化的数据版本，将有助于说明我的问题（我们称之为数据）

name      result.1    result.2    replicate    day     data.for.mean
"obj.1"   1           "good"      1            1        5
"obj.1"   1           "good"      2            1        7
"obj.1"   1           "great"     1            2        6
"obj.1"   1           "good"      2            2        9
"obj.1"   2           "bad"       1            1        10
"obj.1"   2           "not good"  2            1        6
"obj.1"   2           "bad"       1            2        5
"obj.1"   2           "not good"  2            2        3

"obj.2"   1           "excellent" 1            1        14
"obj.2"   1           "good"      2            1        10
"obj.2"   1           "good"      1            2        11
"obj.2"   1           "not bad"   2            2        7
"obj.2"   2           "bad"       1            1        4
"obj.2"   2           "bad"       2            1        3
"obj.2"   2           "horrible"  1            2        2
"obj.2"   2           "dismal"    2            2        1

您会注意到 result.1 和 result.2 是绑定的，如果 result.1 == 1，则 result.2 是好/很棒，如果 result.1 == 2，则 result.2 == bad/不好。我需要聚合数据集中的这两列，并且聚合数据时选择 result.2 中的哪个值并不重要，我只需要信息来确定 result.1 列的 1 值是好还是坏， result.2 类似。因此它可能具有与 result.1 的所有值 2 相对应的所有“dismal”值。

问题是，由于 result.2 使用不同的名称来识别好/坏，我无法将它用作聚合的列。

目前我的聚合函数看起来像这样......

aggregated.data <- aggregate(data[c("data.for.mean")], 
            by=data[c("name", "result.1", "day") ],
            FUN= mean }
        );

这会给出一行输出，如下所示......

name     result.1    day    data.for.mean
"obj.1"  1           1      6

（obj.1 的所有重复，第 1 天的 result.1 == 1 已被平均。它们的值为 5 和 7，是我的模拟数据集中的前两行。）

我想要的会产生一行这样的输出

name     result.1    result.2    day    data.for.mean
"obj.1"  1           "good"      1      6

同样，对于与 result.1 的值“1”相对应的所有值，“好”可以替换为“很棒”、“不错”、“优秀”。

从 result.2 捕获信息并将其添加到aggregate.data（聚合函数的输出）的最佳方法是什么？

谢谢。

这是base中的一个解决方案，它使用merge随后是另一个aggregate:

agg.2 <- merge(aggregated.data, data[,names(data) != 'data.for.mean'])
aggregate(result.2 ~ name+result.1+day+data.for.mean, data=agg.2, FUN=sample, size=1)
##    name result.1 day data.for.mean  result.2
## 1 obj.2        2   2           1.5    dismal
## 2 obj.2        2   1           3.5       bad
## 3 obj.1        2   2           4.0       bad
## 4 obj.1        1   1           6.0      good
## 5 obj.1        1   2           7.5     great
## 6 obj.1        2   1           8.0  not good
## 7 obj.2        1   2           9.0   not bad
## 8 obj.2        1   1          12.0 excellent

这是它的工作原理：

合并添加了result.2值，但会在有多个此类值的情况下创建多行。然后aggregate用于选择这些行之一。

正如你所说，你不在乎哪个相关result.2你得到的标签，我随机得到一个sample.

返回第一个result.2标签、用途head with n=1反而：

aggregate(result.2 ~ name+result.1+day+data.for.mean, data=agg.2, FUN=head, n=1)

同样，要获取最后一个这样的标签，请使用tail with n=1.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Aggregate

根据另一列的聚合将非聚合列添加到聚合数据集中的相关文章

加载 plyr 包时出现问题

我使用 R 2 13 1 但未能成功尝试在 R 中加载包 plyr 1 6 我已将其手动安装到目录 R library 中我的代码是 libPaths R library library plyr 我收到消息库 plyr 中的错误 pl
将一个数据框中的行（带有行名称）与另一个数据框中的匹配列名称相乘

我有两个数据框 df1 lt data frame Values c 0 01 0 05 row names c X Y df1 Values X 0 01 Y 0 05 df2 lt data frame c 0 1 1 c 1 0 0
通过另一个函数将数据和列名称传递给 ggplot

我将直接跳到一个示例并在后进行评论 cont lt data frame value c 1 20 variable c 1 20 1 20 1 5 1 20 2 group rep c 1 2 3 each 20 value variab
如何禁用“保存工作区图像？” R 中的提示？

当我退出交互式 R shell 时它每次都会显示一个烦人的提示 gt gt Save workspace image y n c n 我总是对此回答不因为如果我想保存我的工作我就会这么做before试图退出如何去掉这个提示呢 No
R：从本地 tar.gz 安装 R 软件包时找不到“make”

R 包ConvCalendar不再位于 Cran 存储库中请参阅here https cran r project org web packages ConvCalendar index html 然而因为我在之前的项目中大量使用了这个
使用两列数据分割数据帧并对结果数据帧列表应用通用转换

我想根据两列中的值将一个大数据帧拆分为一个数据帧列表然后我想对结果列表中的所有数据帧应用通用数据转换滞后转换我知道 split 命令但只能让它一次处理一列数据您需要将所有想要分割的因素放在一个列表中例如 split mtcar
使用不同的阈值替换多列中的值

我有一个包含多个列的数据集其中包含我想要转换为二进制的定量数据为此我想使用每列不同的阈值 Example Input antigen1 antigen2 antigen3 antigen4 1 215 421 2 12 2 1524
使用shinyjs通过javascript在闪亮的应用程序中操作现有的Leaflet地图

我有一个闪亮的应用程序其中包含现有的传单地图我希望能够在渲染后使用自定义 javascript 通过shinyjs包裹一个最小的例子如下 app R packages library dplyr library leaflet lib
使用 ggplot 绘制函数，相当于 curve()

是否有使用绘制函数的等效方法ggplot to the curve 基础图形中使用的命令我想另一种选择是创建一个函数值向量并绘制一条连接线但我希望有更简单的东西 Thanks 您可以使用以下命令添加曲线stat function ggp
如何测试字符串中的前三个字符是r中的字母还是数字？

下面给出了我拥有的数据集的示例请注意总数据集中我有超过两列 ID X 1 MJF34 2 GA249D 3 DEW235R 4 4SDFR3 5 DAS3 我想测试 X 中的前三个字符是否是字母如果是那么我想替换该值以仅显示前三个字
拆分并保存在新的 data.frames 中

我有一个大 data frame 144 列我想将其分成每组 3 列子文件或子 data frame 然后将子 data frame 保存在单独的文件中换句话说 file1 将包含从 1 到 3 的列 file2 将包含从 6 到 9
闪亮的本地部署错误：输入字符串 1 无效 UTF-8

我很惊讶地发现一个突然的错误我的 ShinyApp 停止工作并出现未知错误提示输入字符串 1 无效 UTF 8 即使在昨天该应用程序也可以正常运行但是突然停止了下面是我运行时的错误描述runApp gt runApp Liste
如果我有一个包含计数的表格，如何获得直方图/摘要统计数据？ [复制]

这个问题在这里已经有答案了我习惯了像这样的观察向量c 1 1 1 3 4 我可以在上面看到汇总统计数据和绘制直方图等但现在我发现自己拥有相同的数据但采用如下压缩格式 value numObs 1 3 3 1 4 1 当数据以data
挖泥机子集 (MuMIn) - 如果存在主效应，则必须包括交互作用

我正在使用 dredge MuMIn 进行一些探索性工作在此过程中我想将两个变量设置为仅当它们之间存在相互作用时才允许一起出现即它们不能仅作为主要效果一起出现使用样本数据我想挖掘模型 fm1 尽管它可能没有意义如果变量 GNP
如何为 nls 函数找到良好的起始值？

我不明白为什么我不能对这些数据使用 nls 函数我尝试过很多不同的起始值但总是出现相同的错误这是我一直在做的事情 expFct2 function x a b c a 1 exp x b c vec x lt c 77 87 87 7
列表列表中出现的频率

我有一个列表列表其中每个列表都已排序我想调查的是某个元素在特定位置出现了多少次例如 pnc 曾两次出现在第二位一次出现在第三位我的数据结构如下 dput degree l list c schwab 0 pnc 0 0344827
使用 ggplot 将条形图的列与线图的点对齐

当线图的点与条形图的条具有相同的 x 轴时有什么方法可以使用 ggplot 将它们对齐这是我尝试使用的示例数据 library ggplot2 library gridExtra data data frame x rep 1 27 e
重叠并固定小平面中的 x 尺度（尺度=“自由”）以制作电影

在另一篇文章中 Justin 的帮助下我用以下方法绘制了模拟结果facet gridggplot2 中的选项包含数据和答案的帖子在这里使用facet grid选项通过ggplot2绘制数据框的列 https stackoverflow
将从数据透视表包生成的数据透视表转换为数据帧

我正在尝试制作一个数据透视表pivottabler包裹我想将数据透视表对象转换为数据框以便我可以将其转换为数据表带有 DT 并在 Shiny 应用程序中渲染它以便可以下载 library pivottabler pt qpvt mt
R中的引用调用（使用函数修改对象）

我刚刚接触 R 很惊讶地发现函数不会修改对象至少看起来这是默认的例如我编写了一个函数只是为了在表格中的一个标签上粘贴一个星号它在函数内部工作但表本身没有改变我主要来自Ruby 那么在 R 中使用函数更改对象的正常可接受的方

随机推荐

防止 PHP date() 默认为 12/31/1969

我正在使用 MySQL 数据库和 PHP 我使用以下命令将日期值存储在数据库中DATETIME field 我正在使用此 PHP 代码将输入的日期转换为适合 MySQL 的格式 date Y m d H i s strtotime inpu
水平扩展的微服务实例是否应该共享数据库？

给定一个拥有关系数据库并需要水平扩展的微服务我看到两种配置数据库服务器的方法为服务的每个实例提供其自己的数据库服务器实例并具有耦合的流程生命周期 OR 让实例连接到共享由同一服务的相同实例独立数据库服务器或集群使用事件驱动架构和
NotificationCompat.Builder 中出现 NoClassDefFound 错误

这个概念是在特定时间收到通知显然我做到了直到我添加了对低于以下版本的支持HoneyComb并在其上方我已经设置了最小 SDK 版本 8 和目标 SDK 17 由于类编码要大得多我仅显示存在问题的核心区域 int currentap
为什么最好将 script 标签放在 body 标签的末尾？

有两个与浏览器网页初始化相关的事件 DOMContentReady document object 解析 HTML 文档并构建 DOM 树 load window object HTML 文档的所有元素都被渲染显示根据我的理解浏览器无
无法找到捆绑的 Java 版本。 MacBook Air M1

我在配备 intel 的 MacBook Pro 上使用 flutter 一切正常现在我改用配备 M1 芯片的 MacBook Air 我收到错误无法找到捆绑的 Java 版本请问我该如何解决它扑动医生 v Flutter 频道稳定
在 Apps 脚本中设置数据验证显示样式

是否可以在应用程序脚本中设置下拉列表显示样式检查文档后发现 API 只允许您在箭头和纯文本之间进行选择应用程序脚本文档 https developers google com apps script reference spre
无法以编程方式在 C:\inetpub\wwwroot 中创建文件

我在 ASP NET 网页的代码后面有一个函数它创建一个文件然后使用 JavaScript 命令打开它这在 IDE 中有效它会创建文件询问我要在哪里保存文件我可以保存它等等但是当我安装网站并测试它时我在尝试创建网站时收到
Internet Explorer 8 原型和 XMLHttpRequest

这部分是对解决方法的请求部分是试图表明 Internet Explorer 的原型实现仍然有缺陷以下代码在 Internet Explorer 上不起作用 XMLHttpRequest prototype old XMLHttpRequ
如何关闭 Safari 的预取功能？

Safari 有一个功能可以在您输入网址时预加载页面现在对于大多数用户来说这确实是一个功能可以加快页面加载速度但对于 Web 开发人员来说它可能会带来麻烦特别是当它自动加载您之前使用过但当前无意运行的脚本例如导入程序或后台
根据 Celery 任务状态更新 Django 模型字段

在我的模型中我有一个status默认值为处理的字段在 Django 管理界面中用户单击保存按钮后表单输入将传递给仅休眠 30 秒的 celery 任务 30 秒后我该如何判断celery任务是否成功更新模型的statu
如果浏览器不是 Internet Explorer 9 或更高版本，则显示一条消息

我想向我的用户展示一个如下所示的栏如果浏览器不是IE 或者浏览器为 IE 但版本为 8 或更早请注意屏幕截图仅用于说明 IE 9is支持我的网站我发现了这个不错的 jQuery 插件但我不想使用弹出窗口 http jrejec
x 轴刻度日期格式和位置

我尝试使用 matplotlib 复制最初使用 flotr2 创建的绘图图以进行 pdf 输出我必须说 flotr 更容易使用但除此之外我目前一直在尝试将 x 轴上的日期时间格式化为所需的格式即小时分钟每 2 小时间隔一次如
如何恢复 .condarc 中 env_prompt 参数的默认行为？

如果你创建一个python环境conda with prefix标记并激活它激活后环境将通过其整个路径显示这可能是一条很长的路因此conda 文档 https docs conda io projects conda en lates
Spark 中的任务不可序列化

我有这样的转变 JavaRDD
WPF 本机 Windows 10 Toast

使用 NET WPF和Windows 10 有没有办法使用c 将本地toast通知推送到操作中心我只看到人们为此制作自定义对话框但必须有一种方法可以通过 os 您可以使用NotifyIcon from System Windows Fo
使用 YAML 和过滤器登录 python

想要使用 YAML 设置带有过滤器的记录器 YAML 配置文件config yaml如下 version 1 formatters simple format asctime s name s message s extended form
swift 中的默认初始化器

我创建了一个带有字符串选项字符串的 swift 类并在另一个 swift 文件中实例化了该类但出现了编译错误当我在同一文件中实例化该类时没有错误我做错了什么吗我仔细检查了该行为并且该行为即使与 swift 文档中给出的类定
无法在android中调用REST API

我正在尝试从手机调用 REST Web 服务我正在使用以下代码来完成此操作我只有一项具有按钮和文本视图的活动每当我单击按钮时它都会出现以下错误logcat AndroidRuntime at android os Handler d
当我尝试运行 Yesod 书中的第一个示例时，出现“无法找到模块‘Yesod’”

我知道这似乎重复找不到模块 Yesod https stackoverflow com questions 14589358 could not find module yesod 但与该用户不同的是 ghc pkg list不显示Yeso
根据另一列的聚合将非聚合列添加到聚合数据集中

是否可以使用聚合函数从原始数据框中添加另一列而不实际使用该列来聚合数据这是一个非常简化的数据版本将有助于说明我的问题我们称之为数据 name result 1 result 2 replicate day data for mean

根据另一列的聚合将非聚合列添加到聚合数据集中

根据另一列的聚合将非聚合列添加到聚合数据集中 的相关文章

随机推荐

热门标签

根据另一列的聚合将非聚合列添加到聚合数据集中的相关文章