R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素

2024-01-04

假设我有以下 data.framedf患者家乡和一项任意临床指标（心率）：

id          <- c(rep(1:3, each = 2), rep(4, 3))
pt_hometown <- c("Atlanta", NA, 
                 NA, "San Diego", 
                 NA, NA, 
                 "San Francisco", "Seattle", NA)
pt_heartrate <- c(NA, 82,
                  NA, NA,
                  76, 76,
                  90, 93, NA)

df <- data.frame(id = id, 
                 pt_hometown = pt_hometown,
                 pt_heartrate = pt_heartrate,
                 stringsAsFactors = FALSE)
df

这使

id   pt_hometown pt_heartrate
 1       Atlanta           NA
 1          <NA>           82
 2          <NA>           NA
 2     San Diego           NA
 3          <NA>           76
 3          <NA>           76
 4 San Francisco           90
 4       Seattle           93
 4          <NA>           NA

正如我在这里学到的 https://stackoverflow.com/questions/28509462/how-to-collapse-many-records-into-one-while-removing-na-values, summarise_each可以将一个或多个函数应用于分组数据框，以将记录折叠为每组一个。最简单的情况可能是从所有变量中选择第一个非 NA 值df并将它们折叠成每组一个。

  df1 <- df %>%  
    group_by(id) %>%
    summarise_each(funs(first(.[!is.na(.)]))

df1

id   pt_hometown pt_heartrate
 1       Atlanta           82
 2     San Diego           NA
 3            NA           76
 4 San Francisco           90

当然，对于实际应用，人们可能希望以更具体的方式折叠。我知道如何分组df按类型划分的变量，例如，选择max每心率id并折叠成一条记录，但是我不知道该怎么做是有条件地将字符变量折叠为每组一个记录，因为只有一个唯一的非 NA 值.

更具体地说，考虑患者id数字 4。它们有两个独特的值pt_hometown、“旧金山”和“西雅图”。显然两者都不可能都是正确的。所以我想折叠只有一个非 NA 值的每个组的记录，但保留存在多个非 NA 元素的行然后引起我们小组的注意，以决定如何纠正原始数据集中的错误。

所以我想df1看起来像这样：

id   pt_hometown pt_heartrate
 1       Atlanta           82
 2     San Diego           NA
 3          <NA>           76
 4 San Francisco           90
 4       Seattle           93

这是我尝试过的：

df1 <- df %>%  
  group_by(id) %>%
  summarise_each_(funs(first(.[!is.na(.)])), df[length(unique(.[!is.na(.)])) == 1])

我有点不清楚你想要什么边缘情况，但这适用于OP：

library(data.table)
dt = as.data.table(df) # or convert in place using setDT

unique(dt, by = c('id', 'pt_hometown'))[, lapply(.SD, na.omit), by = id]
#   id   pt_hometown pt_heartrate
#1:  1       Atlanta           82
#2:  2     San Diego           NA
#3:  3            NA           76
#4:  4 San Francisco           90
#5:  4       Seattle           93

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素的相关文章

将第 N 行上的 NA 行插入 data.frames 列表，其中 N 来自列表

经过几个小时后我发现自己无法解决以下问题我有一个数据框列表我想分别向每个 DF 插入而不是替换一行或多行 NA 始终至少一行要插入的 NA 数量存储在单独的列表中为了说明这一点我有以下两个列表 list of datafra
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
R、Rcpp 与 Armadillo 中矩阵 rowSums() 与 colSums() 的效率

背景来自 R 编程我正在扩展到 C C 形式的编译代码Rcpp 作为循环交换以及一般的 C C 效果的实践练习我实现了 R 的等效项rowSums and colSums 矩阵的函数Rcpp 我知道它们以 Rcpp 糖的形式存在并
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
使用officer R导出时如何提高ggplots的分辨率

我想将图表导出到 PPT 并使用Officer 包来实现相同的目的但是图表的默认分辨率较低我想更改它我目前正在使用以下电话 ph with gg p1 type chart res 1200 其中 p1 是 ggplot 对象运行
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch
将列表中的每个元素转换为数据框中的一列

假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
闪亮的应用程序包：css 和所有 www/ 目录内容

我正在尝试将 Shiny 应用程序转换为 R 包但我在处理有关 www 目录以及松散文件的所有问题时遇到了问题我闪亮的应用程序运行得很好但是当我尝试打包它时它不起作用我闪亮的应用程序目录 my shiny app R ut
在 Shiny 中显示反应式 htmlTable 表格

我正在制作我的第一个 Shiny 应用程序但找不到任何有关如何显示使用 htmlTable 包创建的表格的示例我基本上想在按下按钮时创建一个表格并显示它 Shiny 显示 html 代码而不是表格我不知道用什么替换服务器部分中的 re
在包加载之前如何知道 R 中特定函数属于哪个包？

例如我知道许多流行的功能例如tbl df 我通常不记得它属于哪个包即data table or dplyr 所以我必须始终记住并加载一个包但我做不到 tbl df除非我加载了正确的包在 R 控制台本身加载或安装包之前有没有办法知
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
dplyr：连接中的 NSE (by)

我很难弄清楚如何使用 dplyr left join 和 NSE 连接两个表问题是我无法为 by 提供正确的值我想我现在已经找到了解决方案但感觉我正在以一种额外复杂的方式来做因此如果您知道更简单更优雅的解决方案请告诉我这就是
R中IF函数的使用

我正在短跑ifR 中的函数但收到以下警告消息 In if runif 50 0 1 lt 0 69 the condition has length gt 1 and only the first element will be used
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
case_when 与部分字符串匹配和 contains()

我正在使用一个数据集其中有许多名为 status1 status2 等的列在这些列中它表示某人是否豁免完整注册等不幸的是豁免投入并不一致这是一个示例 library dplyr problem lt tibble perso

随机推荐

Google OR 工具：如何评估复杂或多级布尔约束

Set up 我使用 google OR 工具作为约束编程求解器 from ortools sat python import cp model 我定义了以下 BoolVars model cp model CpModel a model
IntelliJ 和 JSP/JSTL 无法解析 tomcat7 中 JSTL 的 taglib [重复]

这个问题在这里已经有答案了首先我的 JSTl 代码可以在我的服务器上运行因为我在 tomcat7 的 Lib 文件夹中有正确的 Jar 文件这实际上只是一个 IDEA 问题我的问题归结为我将相同的 jar 文件放在 Intelli
隐藏盒子阴影的部分

免责声明我已经看到以下问题尽管它们的情况非常相似但它们的解决方案并不适用于我在除一侧以外的所有面上创建 CSS3 框阴影 https stackoverflow com questions 1429605 css3 box shad
如何通过 Terraform 将 Iceberg 表部署到 AWS

尝试确定将一些 Iceberg 表部署到我们的 AWS 环境中的最佳方法有人通过 Terraform 取得成功吗我有以下配置但当我查询我创建的表时 Athena 抱怨缺少元数据位置或者将永远旋转如果有更好的方法可以自动化部署请告
如何知道 uitableview 是否有选定的单元格

我正在开发一个应用程序有时我有几个 uitableview 我想知道委托方法之外的操作例如表视图是否有选定的单元格以及是哪个单元格我尝试使用 NSIndexPath indexPathForSelectedRow但它不起作用因为如果
通过选项选择更新 SVG

我正在尝试获取 SVG 中的文本元素以通过选项更改进行更新搜索后我已经能够到达在控制台中在页面初始加载期间以及选项更改时看到选项更改的位置但我未能成功更改数字任何帮助将不胜感激
VIM 中更好的自动完成功能

All 我使用 vim 已经有一段时间了并且喜欢它的一切我真正怀念 RubyMine 这样的 IDE 中只有一件事那就是高级自动完成功能作为参考这是我的标准 VIM 设置 https github com wrwright vim
如何在 spring mvc 中提供静态内容？

我在当前的项目中使用 spring mvc 框架 ROOT文件夹有很多包含html jsp css js等的web文件夹我的spring mvc配置如下
UIScrollView 如何更改框架而不更改边界？ UIScrollView 是如何工作的？

我理解框架和边界之间的区别我认为边界是视图的本地坐标系而框架是超级视图然而对于滚动视图我有点困惑当我在 UIScrollView 中有一个 UIImageView 并将其放大时似乎框架变大宽度和高度也会增加相应 UIIm
在 google 地图中查找给定点 5 公里半径范围内的位置

嘿我只是想收集谷歌地图数据库中给定点 5 公里半径以下的位置我会将它们存储在数据库中以供以后处理这可以完成吗谢谢如何获取所需圆内点的经度和纬度您可以使用地点搜索 http code google com intl fr apis
有没有办法通过作业名称获取 Quartz 中的作业密钥

现在我正在寻找在 Quartz 库中通过作业名称获取作业密钥的功能我看到Scheduler有方法通过组名称获取作业密钥GroupMatcher
Android 中是否有 API 支持以编程方式进行电话会议？

我想通过从我的应用程序中选择一些联系人来进行电话会议可以吗电话会议中的设备数量是否有限制有没有 Android SDK 支持任何版本都适合我吗请提供一些意见提前致谢您无法使用智能手机管理会议您需要一个可以为您完成此操作的中间
django 脆皮形式内联表单

我正在尝试采用脆形式和引导程序并尽可能多地使用它们的功能而不是一遍又一遍地发明一些东西有没有一种方法可以像 django admin 表单那样使用 Cripy forms bootstrap 来实现内联表单功能这是一个例子 clas
如何在 Perl 中连接两个散列而不使用循环？

如何在 Perl 中将哈希 a 附加到哈希 b 而不使用循环如果您的意思是合并他们的数据只需执行以下操作 c a b
如何在Python中用单反斜杠替换双反斜杠？ [复制]

这个问题在这里已经有答案了我有一根绳子该字符串中有双反斜杠我想用单反斜杠替换双反斜杠以便可以正确解析 unicode 字符代码 Pdb p fetched page p style text align center align c
在 Android Studio 中导入 Facebook 库：找不到属性“ANDROID_BUILD_SDK_VERSION”

我想将库项目导入到我的应用程序中但每当我尝试这样做时 Android Studio 都无法识别它它还在 build gradle 中给了我错误该库是 PagerSlidingTabStrip 以下是一些图片到目前为止我已经尝试了三天
.NET StringBuilder 在前面添加一行

我知道System Text StringBuilder在 NET中有一个AppendLine 方法但是我需要在 a 的开头预先附加一行StringBuilder 我知道你可以使用Insert 附加一个字符串但我似乎无法用一行来做到这
@Scheduled 方法内部的 Spring @Async 方法调用

我正在使用 Spring boot EnableScheduling and EnableAsync 我有一个注释为的方法 Scheduled 我还有几个方法注释为 Async 现在我称这些为 Async中的方法 Scheduled方法并
在Powershell中使用Import-CSV，忽略注释行

我认为我一定错过了一些明显的东西因为我正在尝试使用 Import CSV 导入已在文件顶部注释掉行始终以作为第一个字符开头的 CSV 文件因此文件看起来像这样 SpecialCSV Version 1 0 0 Table Head
R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素

假设我有以下 data framedf患者家乡和一项任意临床指标心率 id lt c rep 1 3 each 2 rep 4 3 pt hometown lt c Atlanta NA NA San Diego NA NA San Fr

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素 的相关文章

随机推荐

热门标签

R，dplyr：如果每组只有一个唯一的非 NA 元素，则按组折叠字符变量元素的相关文章