使用 dplyr 包中的 group_by 和 mutate 通过 id 变量创建新的因子变量

2024-01-24

我有一个长格式的分层数据框，其中每一行代表关系，其中许多关系可以属于一个人。以下是一个小型示例数据集的代码：

df <- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4)),
             partner = c(1,2,3,1,2,1,1,2),
             kiss = as.factor(c("Yes", "No", "No", "No", "No", "Yes", "Yes", "No")))

  id partner kiss
1  1       1  Yes
2  1       2   No
3  1       3   No
4  2       1   No
5  2       2   No
6  3       1  Yes
7  4       1  Yes
8  4       2   No

我想在此数据集中创建一个新的因子变量，该变量指示该人（由“id 变量表示”）是否从未亲吻过他们的任何“伴侣”。换句话说，如果这个人与任何伴侣接吻，新变量将表示“是”——他们从未与任何伴侣接吻。我认为它应该是这样的：

  id partner kiss neverkiss
1  1       1  Yes        No
2  1       2   No        No
3  1       3   No        No
4  2       1   No       Yes
5  2       2   No       Yes
6  3       1  Yes        No
7  4       1  Yes        No
8  4       2   No        No

理想情况下，我想找到一种方法来创建此变量而不重塑数据集。我也更喜欢使用 dplyr 包。到目前为止，我已经考虑过使用此包中的 group_by 和 mutate 函数来创建此变量。但是，我不确定可以使用哪些辅助函数来创建特定变量。我对 dplyr 包之外的其他想法持开放态度，但这对我来说将是一等奖。

这应该可以做到

require(dplyr)

df <- data.frame(id = as.factor(c(1,1,1,2,2,3,4,4)),
             partner = c(1,2,3,1,2,1,1,2),
             kiss = as.factor(c("Yes", "No", "No", "No", "No", "Yes", "Yes", "No")))

df_new <- df %>% 
   group_by(id) %>% 
   mutate("neverkiss" = {if (any(kiss == "Yes")) "No" else "Yes"})

df_new

如果新列应包含您必须的因素ungroup first

df_new <- df %>% 
   group_by(id) %>% 
   mutate("neverkiss" = {if (any(kiss == "Yes")) "No" else "Yes"}) %>% 
   ungroup() %>% 
   mutate("neverkiss" = as.factor(neverkiss))

class(df_new$neverkiss)
[1] "factor"

原因是因素不能结合：

a <- as.factor(c("Yes", "Yes", "Yes"))
b <- as.factor(c("No", "No", "No")) 

c(a, b) # meaningless

由于分组仍处于活动状态mutate基本上是构建向量neverkiss作为每个向量的组合id（组），这会产生一个只有一个级别的向量（在本例中为“否”）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

使用 dplyr 包中的 group_by 和 mutate 通过 id 变量创建新的因子变量的相关文章

将 R 中的 arules 生成的规则应用于新交易

我的目标是使用 R 包生成的规则arules来预测topic每个事务每个事务有 1 个主题其中每个事务是文档中的一组单词我有一个训练集trans train 用于创建规则和测试集trans test 我想预测它的主题我还希望能够
将多个对齐的绘图放置在一页上时避免浪费空间

我想将四个图放在一个页面上轴标签应仅打印在最边缘即x仅用于底部图表的轴标签以及y仅左图的轴标签这既适用于整个轴的名称也适用于各个刻度线我可以使用以下代码生成一些内容 pdf file ExampleOutput pdf widt
R 提交到 CRAN：构建包的 R 版本？

我想向 CRAN 提交一个包裹在里面CRAN 存储库政策 http cran r project org web packages policies html它指出当发布新的 R x y 0 版本时 R CMD 检查给出错误的包将被
如何在闪亮中使用带有reactiveValues的debounce

我知道我可以像这样将 debounce 与reactive 结合使用这就是我需要的行为但我想改用reactiveValues ui lt fluidPage textInput inputId text label To see how
在 R 中将列表列表转换为数据帧：Tidyverse 方式

我正在寻找将列表列表转换为 R 中的数据帧的 Tidyverse 方法 Create a list of lists a lt seq 1 10 1 b lt seq 1 20 2 Function to calculate the sum
如何调整ggplot2中的标题位置

这是代码 require ggplot2 require grid pdf a pdf png a png a lt qplot date unemploy data economics geom line opts title A b l
在字符串中每个字母后面添加数字

我有几个具有固定格式的字符串格式为一个字母后跟一个数字例如 A3B1C7D1 但是如果字母后面的数字为 1 则字符串将写为 A3BC7D 我想做的是插入数字 1 然后将字符串转换为A3BC7D to A3B1C7D1 我的示例数据是
R：data.table 与 merge(aggregate()) 性能

或者更一般地说它是DT SD by versus merge aggregate 话不多说这里是数据和示例 set seed 5141 size 1e6 df lt data table a rnorm size b paste0 sa
在 R 中使用 randomforest() 进行分类？

我最初有一个由 N 行 12 列组成的数据框最后一列是我的班级 0 或 1 我必须将整个数据框转换为数字 training lt sapply training temp as numeric 但后来我认为我需要将类列作为因子列来使用 r
如何在 sqlSave() 命令中跳过主键？

我正在尝试使用 RODBC 在 MySQL 数据库中插入 data frame 我正在使用的命令如下 sqlSave channel dbData tablename table name append TRUE safer TRUE fa
RStudio 在临时目录中从 Rmarkdown 创建 PDF 文件

我使用 RStudio 和 Rmarkdown 来创建报告由于某种原因使用 Knit 按钮会导致它仅在某个临时目录中创建从命令输出来看似乎 pandoc 本身被指示这样做我觉得这很奇怪 usr lib rstudio bin pa
r : 直方图上的 ECDF

在 R 中与ecdf我可以绘制经验累积分布函数 plot ecdf mydata 与hist我可以绘制数据的直方图 hist mydata 如何在同一图中绘制直方图和 ecdf EDIT 我尝试做类似的东西 https mathemati
计算级别内的值

我在 R 中生成了一组级别cut 例如假设 0 到 1 之间的小数值分为 0 1 个区间 gt frac lt cut c 0 1 breaks 10 gt levels frac 1 0 001 0 1 0 1 0 2 0 2 0 3
反转默认比例梯度ggplot2

我是新手我正在尝试设计热图这是我的代码 ggplot gd aes Qcountry Q6 1 Q6d order TRUE geom tile aes fill prob colour white theme minimal labs
单击并按住 R 中的按钮闪亮？

我希望能够通过单击 R 闪亮按钮来更改参数的值所以我需要按钮一个用于增加值一个用于减少值我想在按住按钮的同时保持值以一定的速度减少增加通过释放按钮的点击动作应该停止到目前为止我还没有找到这个选项actionButtons在
从 R 主题模型中的 DocumentTermMatrix 中删除空文档？

我正在使用 R 中的 topicmodels 包进行主题建模我正在创建一个 Corpus 对象进行一些基本的预处理然后创建一个 DocumentTermMatrix corpus lt Corpus VectorSource vec
在 Shiny 中使用 readlines(prompt = )

我有一个代码使用以下方式获取输入readlines prompt 功能您能告诉我 Shiny 中的哪个输入函数足以将此代码适应 Shiny 应用程序吗我需要一个交互功能我无法使用简单的输入selectInput 因为我有很多read
包检查时如何有效处理未压缩的保存？

在最近开发一个包的过程中我将数据集包含在data 我的包的文件夹在我的具体情况下我有 5 个数据集所有这些数据集都位于data table格式尽管我在下面描述的问题仍然存在如果我将它们保留为data frame 我已将每个人单独
R比例置信区间因子

我正在尝试总结家庭调查的数据因此我的大部分数据都是分类因子数据我想用对某些问题的回答频率图来总结它例如回答某些问题的家庭百分比的条形图误差线显示置信区间我发现了这个很棒的教程我认为它是我祈祷的答案 http www coo
有效地将环境从内部功能转移到全局环境

我有一个在其中创建环境的函数我希望将该环境分配给全局环境目前我通过将环境分配给来做到这一点globalenv 作为最后一步如下 funfun lt function inc 1 dataEnv lt new env dataEnv d

随机推荐

我应该怎么做才能从 eclipse - Android 连接到服务器？

大师们我对这个话题有点迷失这是我正在尝试做的事情的细分用户 Android 设备将位置信息发送到服务器 gt 服务器 server 返回已使用 sql 排序的项目列表 gt db 服务器获取表信息并返回给用户 gt 用户 Andr
以编程方式配置 p2 更新存储库

Eclipse wiki 中有一篇文章如何通过向您的产品添加静态conf 文件来配置 RCP 应用程序的用户 p2 默认存储库 Equinox p2 向 RCP 应用程序添加自我更新配置用户的默认存储库 http wiki eclipse
Angular 2 单元测试 - @ViewChild 未定义

我正在编写 Angular 2 单元测试我有一个 ViewChild组件初始化后我需要识别的子组件在这种情况下它是一个Timepicker来自 ng2 bootstrap 库的组件尽管具体细节并不重要之后我detectChange
如何覆盖 Angular 5 中的组件？

我有一个组件
有没有办法从 Angular 2+ 中删除未使用的导入和声明？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有一些 Visual Studio Code 插件或其他方法可以帮助我们快速有效地整理和组织导入和
NodeJs、Mocha 和 Mongoose

我有以下结构 server db mongooseTest js test userModel test js user userModel js 用他们的代码猫鼬测试 js var mongoose require mongoose m
解析 Javascript 中自定义格式的“日期和时间”字符串

我必须解析格式为 2015 01 16 22 15 00 的日期和时间字符串我想将其解析为 JavaScript 日期对象对此有什么帮助吗我尝试了一些jquery插件 moment js date js xdate js 还是没有运气
Grails 打包和命名约定

包装控制器服务等IE com company controllers com company services 这是一个好的做法还是应该避免我遇到的另一个值得一提的问题是命名服务示例 SomthingGatewayService gro
在 Android ContentProvider 中连接表和通知 ContentObservers 的最佳实践

我有一个 ContentProvider 来处理与我的应用程序相关的所有数据插入和检索我遵循 Virgil Doobjanschi 在 Google I O 上建议的模式我正在使用第一种模式我的问题是我有一个由数据库中的多个表表示的逻
动画结束后的 CSS 过渡

我有一个 css 过渡可以在悬停时移动元素还有一个动画可以在悬停时旋转元素动画上有一个等于过渡持续时间的延迟因此在过渡到正确位置后动画就会开始它工作得很好但是当我们将鼠标移开时动画会停止但不会向下过渡是否可以在鼠标移
从 TypeScript->CommonJS 模块导出带有字体资源的全局样式

我有一个 TypeScript React 项目组织如下 tsconfig json package json yarn lock lerna json node modules packages ui library package j
从 rfft2 数组创建 fft2 结果

我试图通过操作 rfft2 的结果来重新创建完整 fft2 的结果该文档指出 rfft2 仅计算正系数因为当输入为实数时负系数与正系数具有对称性这对于大型数组非常有用因为计算 rfft2 比完整的 fft2 快得多所以下面的代码
如何处理 MySQL 多边形重叠查询？

例如我有一个用户表每个用户都是地图上的一个正方形或圆圈我想找到这样的用户overlap地图上的另一个广场 MySQL 5 6 目前支持此功能吗 MySQL 的开发版本怎么样请注意我不是在寻找查找在该正方形内有一个点的用户我
小负数四舍五入后保持符号

即使舍入结果为零 MATLAB 似乎也会记住原始符号由于小负值已四舍五入为零因此该信号不再有意义代码示例 a 0 001 ar round a 2 fprintf a 2f a rounded 2f Zero 2f n a ar 0
将 MILOC 与 Fortran 结合使用：赋值中的等级 0 和 1 不兼容

给出错误消息的版本 program hello integer a 9 integer index note no dimension here a 1 3 4 5 6 7 8 9 10 index MINLOC a MASK a gt 5
如何知道动画为什么会卡顿？

我有一些相当简单的动画移动文本移动椭圆等并在全屏 1920x1080 减去任务栏下运行 WPF Performance Suite 报告整个动画的帧速率约为 50 FPS 脏矩形加法约为 300 矩形秒 SW 帧在 0 到 4 之
神经网络：连续输出变量的 Sigmoid 激活函数

好吧所以我正处于中间Andrew Ng 在 coursera 上的机器学习课程 https www coursera org course ml并希望调整作为作业 4 的一部分完成的神经网络特别是我在作业中正确完成的神经网络如下 S
谷歌地图根据窗口调整大小设置不同的缩放

继我之前的问题之后谷歌地图响应式调整大小 https stackoverflow com questions 18444161 google maps responsive resize我想根据窗口调整大小实现不同的缩放级别调整大小时因
在 perl 或 awk 中将每 4 列打印到一行

您能帮助我如何将每 4 个连续行转换为一个制表符分隔的列吗 convert A 1 2 3 3 3 4 1 to A 1 2 3 3 3 4 1 执行此操作的一个简单方法是使用xargs xargs n4 lt file A 1 2 3 3
使用 dplyr 包中的 group_by 和 mutate 通过 id 变量创建新的因子变量

我有一个长格式的分层数据框其中每一行代表关系其中许多关系可以属于一个人以下是一个小型示例数据集的代码 df lt data frame id as factor c 1 1 1 2 2 3 4 4 partner c 1 2 3 1

使用 dplyr 包中的 group_by 和 mutate 通过 id 变量创建新的因子变量

使用 dplyr 包中的 group_by 和 mutate 通过 id 变量创建新的因子变量 的相关文章

随机推荐

热门标签

使用 dplyr 包中的 group_by 和 mutate 通过 id 变量创建新的因子变量的相关文章