按组保留行，直到列中值第一次出现为止。不允许存在值的组

2024-05-05

我有一个像这样的数据框：

我想保留每个组（id）的所有行，直到类型列中第一次出现值“b”为止。对于没有类型“b”的组，我想保留他们的所有行。

生成的数据框应如下所示：

> dfnew
  id type
1  1    a
2  1    a
3  1    b
4  2    a
5  2    a
6  2    b
7  3    a
8  3    a

我尝试了以下代码，但它保留了除第一次出现“b”之外具有值“a”的其他行，并且仅排除了“b”的其他出现，这不是我想要的。请看下面的第 4 行。我想摆脱它。

> df %>% group_by(id) %>% filter(cumsum(type == 'b') <= 1)
Source: local data frame [7 x 2]
Groups: id

  id type
1  1    a
2  1    a
3  1    b
4  1    a
5  2    a
6  2    a
7  2    b
8  3    a
9  3    a

你可以结合match or which with slice或（如@Richard所述）which.max

library(dplyr)
df %>% 
  group_by(id) %>% 
  slice(if(any(type == "b")) 1:which.max(type == "b") else row_number())    
# Source: local data table [8 x 2]
# Groups: id
# 
#   id type
# 1  1    a
# 2  1    a
# 3  1    b
# 4  2    a
# 5  2    a
# 6  2    b
# 7  3    a
# 8  3    a

或者你可以尝试一下data.table

library(data.table)
setDT(df)[, if(any(type == "b")) .SD[1:which.max(type == "b")] else .SD, by = id]
#    id type
# 1:  1    a
# 2:  1    a
# 3:  1    b
# 4:  2    a
# 5:  2    a
# 6:  2    b
# 7:  3    a
# 8:  3    a

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

按组保留行，直到列中值第一次出现为止。不允许存在值的组的相关文章

按不规则时间间隔对数据进行分组求和（R语言）

我正在看这里的 stackoverflow 帖子 R 计算一组内的观察次数 https stackoverflow com questions 65366412 r count number of observations within a
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
无法部署 ShinyApp：readTableHeader 在“raw”上发现不完整的最后一行（使用默认值：en_US）

我已经拼命尝试部署我的闪亮应用程序大约一周了但不幸的是我无法停止收到以下消息 Warning message Error detecting locale Error in read table file file header head
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本
如何使用 xpath 检查某个对象在网页中是否可见？

我正在 R 中使用 RSelenium 包来进行网络抓取有时加载网页后需要检查某个对象在网页中是否可见例如 library RSelenium open a browser RSelenium startServer remDr lt
从 df 中提取具有两列的重叠行对

我想找出这两个表之间哪些对重叠 gt dput data1 structure list Name x c MDH1 MDH1 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 SCOALB SCOALB CSY4 CS
ubuntu中R的igraph包的安装

我使用以下命令在 ubuntu 中安装 R 的 igraph 包 install packages igraph 但我收到一条错误消息警告无法访问存储库的索引 http ftp iitm ac in cran src contrib h
如何使用 R 将每个文件的数据添加为附加行，从而将不同的 .csv 文件合并为一个完整的文件？

我有几个不同的文件夹它们都包含一个 csv 文件所有这些 csv 文件都有一个单独的列其中包含实验的一种条件的数据我想以将每个文件的数据添加为新列的方式合并这些 csv 文件目前它看起来像这样 C1 csv 102 106 15
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
从日期变量创建月末日期

我有一个包含日期变量的大型数据框它反映了该月的第一天有没有一种简单的方法来创建代表该月最后一天的新数据框日期变量以下是一些示例数据 date start month seq as Date 2012 01 01 length 4 by
如何添加链接以从我的 R闪亮应用程序在新窗口中打开 pdf 文件？

我可以使用 a 从我的 Shiny 应用程序添加到外部站点的超链接 a google href http www google com 但如何创建一个链接来打开 pdf 或类似文件看起来应该很简单但我找不到任何例子我的问题与此类似
如何对数字进行四舍五入并使其显示零？

R 中将数字四舍五入到小数点后 2 位的常用代码是 gt a 14 1234 gt round a digits 2 gt a gt 14 12 但是如果该数字的前两位小数位为零则 R 会在显示中抑制零 gt a 14 0034 gt
在 R 传单中添加不透明度滑块

如何在 R leaflet 应用程序中添加滑块来控制特定图层的不透明度对于这个应用程序我不想使用闪亮这里建议在 R 传单应用程序中添加滑块 https stackoverflow com questions 37682619 add
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI

随机推荐

如何完全禁用 VS Code 的网络请求（遥测、更新等）

由最新来源构建我试图阻止 vs code 发出任何网络请求检查更新遥测等我试过这个 config telemetry enableCrashReporter false telemetry enableTelemetry false
为什么 Firefox 对“select”标签上的“click”事件的反应与 Webkit 和 IE 不同？

我意识到 Firefox 对待click事件于
帮助测试人员的最佳方法是什么？

我的公司很小只有一名全职测试人员而且我们主要做网络应用程序所以我很高兴我们有测试人员因为我认为在调试我自己的代码时我可能会有偏见或懒惰而且我们的测试人员实际上位于另一个国家因此通常我们仅通过即时消息或电子邮件进行交流通常我会尝
如何在 Ubuntu 上通过 pip 安装 python3 版本的软件包？

我两者都有python2 7 and python3 2安装在Ubuntu 12 04 符号链接python链接到python2 7 当我输入 sudo pip install package name 它将默认安装python2的版本pa
如何在 python 中将 selenium webelement 转换为字符串变量

from selenium import webdriver from time import sleep from selenium common exceptions import NoSuchAttributeException fr
将 XML 转换为 Java 对象 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
选择返回动态列

我有两个表标准和服务产品一个标准可以有多个服务产品每个标准可以有不同数量的与其关联的服务产品我需要做的是编写一个视图该视图将返回一些常见数据然后在一行上列出服务产品例如 Standard Id Description SO 1
Zuul -> Eureka Server，基本身份验证问题

如果流程不包含基本授权我就可以访问该服务如果我使用基本授权它会抛出消息访问此资源需要完全身份验证以下是我的观察在 ZuulFilter 的 run 方法中我得到了值 request getHeader 授权 gt 基本 c2
TTTAttributedLabel可以检测链接，但无法正确按下

我正在使用 TTTAttributedLabel 来检测链接这是我初始化标签的代码 TTTAttributedLabel getLinkLabelWithSize CGSize size text NSString text TTTAtt
函数 isAssignableFrom 在服务器启动期间返回 false

实施oauth2系统我在使用以下代码时遇到一些问题 import org springframework security oauth2 provider endpoint FrameworkEndpointHandlerMapping
在 Codeigniter 中使用/嵌入 Ember js

我即将开始开发一个 Web 应用程序使用 Ember js 作为前端技术使用 Codeigniter 作为后端我遇到的问题是如何在 codeigniter 中嵌入或使用 ember js 可以通过 Web 服务从 codeignite
JVM 是否会内联对象的实例变量和方法？

假设我有一个非常紧密的内部循环每次迭代都会访问和改变一个簿记对象该对象存储有关算法的一些简单数据并具有用于操作它的简单逻辑簿记对象是私有的和最终的并且它的所有方法都是私有的最终的和 inline 下面是一个示例 Scala 语法
使用java服务中的Zxing库从单个图像文件中读取多个条形码

您好我已经创建了一个java服务用于从此处的图像中读取条形码我使用Zxing库来解码此处的文本挑战是如果一个带有单个条形码的文件工作正常如果有多个条形码它会产生不相关的结果我在下面给出了我的代码 pom xml
dataframe KeyError，尽管它存在

鉴于数据 rows x 1 y 2 z 3 x 2 y 2 z 3 如果我尝试构建这样的数据框 frame pd DataFrame from records rows index x 效果很好然而这 frame pd DataFram
如何在 Selenium 中定位具有特定文本的跨度？（使用Java）

我在使用 java 查找 Selenium 中的 span 元素时遇到问题 HTML 看起来像 div class settings padding span Settings span div 我尝试了以下方法但没有成功 By xpath
将 $lookup 结果合并到现有数组

我是 mongo 新手我需要你的帮助我有收藏学习计划这是示例文档 id dGFY garranti typ sk garant en Chairman of study board id 1025769 typ sk predseda
Bootstrap 3 网格，一行中有多少列“真的”重要吗？

我有一个表单布局上面有 Bootstrap 3 表单组我希望这些表单组在我显然让它工作得很好但是在这里阅读了一些内容后我所做的似乎违反了假设的规则即一行中的每一列加起来必须等于 12 但是我能找到的每个教程和文档总是使用诸如应
尝试将过滤器添加到 Grizzly+Jersey 应用程序时出现问题

我有这个服务器初始化类 package magic app main import org glassfish grizzly http server HttpServer import org glassfish jersey grizz
在 Objective-C 中从异步块增加变量

我在 Objective C 中开发的服务遇到了一些难题该服务的目的是解析核心数据实体列表并为每个对象下载相应的图像文件该服务的原始设计因太多同时下载请求而阻塞了我的网络服务器为了解决这个问题我将负责执行下载请求的代码移至递归方法中
按组保留行，直到列中值第一次出现为止。不允许存在值的组

我有一个像这样的数据框 gt df id type 1 1 a 2 1 a 3 1 b 4 1 a 5 1 b 6 2 a 7 2 a 8 2 b 9 3 a 10 3 a 我想保留每个组 id 的所有行直到类型列中第一次出现值 b 为止

按组保留行，直到列中值第一次出现为止。不允许存在值的组

按组保留行，直到列中值第一次出现为止。不允许存在值的组 的相关文章

随机推荐

热门标签

按组保留行，直到列中值第一次出现为止。不允许存在值的组的相关文章