如何在 R 组内的两个变量的组合上选择具有特定值的行

2024-05-07

这是我之前提出的 R 问题的扩展：如何在R中选择组内具有特定值的行 https://stackoverflow.com/questions/55853841/how-to-select-rows-with-certain-values-within-a-group-in-r

我在这个问题上得到了很大的帮助，但现在变得有点复杂了，我希望收到如何处理这个问题的建议。

我的数据如下所示：

dd <- read.table(text="
    event.timeline.ys     ID     year    group  outcome
                 1                   2     800033 2008    A  3
                 2                   1     800033 2009    A  3
                 3                   0     800033 2010    A  NA   
                 4                  -1     800033 2011    A  2  
                 5                  -2     800033 2012    A  1  
                 15                  0     800076 2008    B  2
                 16                 -1     800076 2009    B  NA
                 17                  5     800100 2014    C  4     
                 18                  4     800100 2015    C  4  
                 19                  2     800100 2017    C  4  
                 20                  1     800100 2018    C  3   
                 30                  0     800125 2008    A  2   
                 31                 -1     800125 2009    A  1   
                 32                 -2     800125 2010    A  NA
                 33                  2     800031 2008    A  3
                 34                  1     800031 2009    A  3
                 35                  0     800031 2010    A  NA   
                 36                 -1     800031 2011    A  NA  
                 37                 -2     800031 2012    A  1", header=TRUE)

我只想选择组（ID）中的特殊行。应根据以下过程选择这些行：

如果可能的话，我想为每个参与者保留 event.timeline.ys 上具有正值的最后一行（即，event.timeline.ys >= 0 的 ID 组中的最后一行），其中结果变量不是不适用，但具有有效值（例如，对于 ID == 800033，这将是第 2 行）。

此外，我想为每个参与者保留 event.timeline.ys 上具有负值的第一行（即 ID 组中 event.timeline.ys

在 ID == 800076 的特殊情况下，当 event.timeline.ys

ID = 800100 的人在 event.timeline.ys 上没有任何负值。在这种情况下，我想只保留 event.timeline.ys >= 0 的最后一行。

所有其他行都应删除。最终的数据框如下所示：

      event.timeline.ys         ID     year    group  outcome
2                     1     800033     2009    A            3
4                    -1     800033     2011    A            2  
15                    0     800076     2008    B            2
16                   -1     800076     2009    B           NA
20                    1     800100     2018    C            3   
30                    0     800125     2008    A            2   
31                   -1     800125     2009    A            1
34                    1     800031     2009    A            3
37                   -2     800031     2012    A            1

我非常感谢关于如何解决这个问题的建议。我已经尝试过这个：

dd %>% 
  group_by(ID) %>% 
  filter(row_number() == last(which(event.timeline.ys >= 0 & outcome >= 0)) | 
           row_number() == first(which(event.timeline.ys < 0 & outcome >= 0)))

然而，我随后丢失了第 16 行（ID == 800076），这是不幸的。

提前谢谢了！

Using dplyr:

dd %>%
group_by(ID, event.timeline.ys>=0) %>%
arrange(ID, event.timeline.ys>=0, abs(event.timeline.ys)) %>%
filter(!is.na(outcome) | n()==1) %>%
filter(row_number()==1) %>%
ungroup() %>%
select(-one_of('event.timeline.ys >= 0'))

Output:

  event.timeline.ys     ID  year group outcome
              <int>  <int> <int> <fct>   <int>
1                -1 800033  2011 A           2
2                 1 800033  2009 A           3
3                -1 800076  2009 B          NA
4                 0 800076  2008 B           2
5                 1 800100  2018 C           3
6                -1 800125  2009 A           1
7                 0 800125  2008 A           2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

function

dplyr

如何在 R 组内的两个变量的组合上选择具有特定值的行的相关文章

rpart“as.character(x) 中的错误：无法强制类型 'builtin' 为类型 'character' 的向量”消息是什么意思？

我一直在用头撞rpart几天了尝试为我拥有的这个数据集制作分类树我认为现在是时候询问生命线了我确信这是我没有看到的愚蠢的事情但这里是我一直在做什么 EuropeWater lt read csv file paste Users a
在 R 传单中添加不透明度滑块

如何在 R leaflet 应用程序中添加滑块来控制特定图层的不透明度对于这个应用程序我不想使用闪亮这里建议在 R 传单应用程序中添加滑块 https stackoverflow com questions 37682619 add
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
检查对以下内容的理解：“变量”与“变量” “价值”、“功能”与“抽象”

这个问题是后续问题this one https stackoverflow com questions 25327705 is function a sort of variable 25329157 25329157在学习 Haskell
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
创建新的保护子句

在 Elixir 中我将如何为函数创建新的保护子句显然我已经看到你不能只调用 a 中的任何函数when声明但如果能够做这样的事情那就太好了 defmodule Player do def play card player do de
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI
将列表中的每个元素转换为数据框中的一列

假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
为什么 sapply 的缩放速度比样本大小的 for 循环慢？

假设我想采用向量 X 2 1 N 并将 e 计算为每个元素的指数是的我认识到最好的方法就是通过向量化 exp X 但这样做的目的是将 for 循环与 sapply 进行比较我通过逐步尝试三种方法一种使用 for 循环两种以不同方
C++：如何从函数返回shared_ptr

当尝试从函数返回shared ptr时我得到对局部变量 recipe 的引用返回 Werror return local addr 我哪里做错了 shared ptr
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
R ggplot 中的柯尔莫哥洛夫-斯米尔诺夫图

我正在尝试在 r 中绘制 KS 图一切似乎都很顺利除了我只能使用颜色来可视化两个不同的样本而不是线型这一事实我已经尝试过以下方法 sample1 lt SD13009 sample2 lt SD13009PB group lt c r
闪亮的应用程序包：css 和所有 www/ 目录内容

我正在尝试将 Shiny 应用程序转换为 R 包但我在处理有关 www 目录以及松散文件的所有问题时遇到了问题我闪亮的应用程序运行得很好但是当我尝试打包它时它不起作用我闪亮的应用程序目录 my shiny app R ut
R - 重塑 - 熔化错误

我正在尝试融化数据框但出现了这个奇怪的错误有什么想法吗 str zx7 data frame 519 obs of 5 variables calday new Date format 2011 01 03 2011 01 04 201
我应该在构造函数中调用成员函数吗

我知道这是一个相当简单的问题并且还取决于代码的其余部分但我对经验法则更感兴趣那么什么情况下适合在构造函数中调用函数呢更可取的是 ClassA obj1 obj1 memFun or ClassA obj1 where constru
R在Windows平台Rstudio上打印data.frames中的UTF-8代码

当数据框中存在UTF 8字符时将无法正常显示例如以下内容是正确的 gt U6731 1 朱但是当我将其放入数据框中并打印出来时它是 gt data frame x U6731 x 1
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth

随机推荐

CORS 与 Amazon S3 和 Cloudfront

我有一个托管在 Heroku 上的 Rails 应用程序它使用 CloudFront 以及托管在 S3 上的资产它完美地显示了资产尽管需要一些努力我的 Cloudfront 设置 Forward Headers Whitelist
为什么 C# 中没有“fieldof”或“methodof”运算符？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案它们可以如下使用 FieldInfo field fieldof string Empty MethodInfo method1 methodo
Spark 按列重新分区，每列动态分区数

如何根据列中的项目数对 DataFrame 进行分区假设我们有一个包含 100 人的 DataFrame 列是first name and country 我们希望为一个国家地区的每 10 个人创建一个分区如果我们的数据集包含 80
Android快速查找网络上所有本地设备

我正在制作一个 Android 应用程序需要能够查看本地网络设备名称或 IP 目前我可以扫描网络并找到设备的本地IP 然而由于时间太长用户在搜索网络时会看到黑屏加载几分钟这是我当前正在使用的代码 private ArrayList
WCF - 进行多次调用时随机客户端超时

我有一个WPF客户端通过以下方式请求数据WCF服务托管于IIS 7 服务方法调用存储过程 SQL 2012 using EF检索一些数据由于需要加载大量数据因此客户端会多次调用服务方法以分解数据加载并避免大量负载和超时我们使用生
为什么recycleview数据无法与服务器端数据库数据同步

我正在使用rest api向我在android中的应用程序提供数据对于数据库我正在使用phpmyadmin并在本地主机中执行此操作一切顺利但是当我在数据库中添加新数据时我的recycleview无法与数据库中的最新数据同步因此当
Android 上的 Skobbler 地图显示黑屏

我正在使用 Skobbler SDK 2 3 0 针对 Lollipop 在 Nexus 5 和 Galaxy S4 上进行测试在 Android Studio 1 0 2 上构建我有一个带有导航抽屉和片段的 MainActivity
Zend url：获取参数始终保留在 url 中

我在使用带有 get 参数的 Zend url 帮助器时遇到一些问题在一个视图中我有分页它在 get 中发送额外的参数所以在 url 中所以没关系但这是不行的即使我更改页面参数也始终保留在 url 中事实上 zend ur
将 xml 传递给 jquery 脚本时出现问题

我正在尝试使用 jsp 中的 bufferedReader 从本地路径读取 xml 并尝试将 xml 传递给 jquery 脚本如下所示
使用 Antlr4 解析任意分隔符

我尝试在 Antlr4 中创建一个接受正则表达式的语法由任意字符分隔与 Perl 中的类似我怎样才能实现这个目标需要明确的是我的问题不是正则表达式本身实际上我不在 Antlr 中处理而是在访问者中处理而是分隔符我可以轻松地为
将列表沿元素拆分为子列表

我有这个清单 List
内存数据库不保存数据

我有一个简单的网络应用程序在客户端有 Angular 在服务器端有 ASP NET Core Web API 我使用内存数据库 services AddDbContext
在ironpython中使用ipython需要什么？

我很想使用 IronPython 来探索 net 运行时和库但我怀念来自 CPython 的经历IPython http ipython scipy org moin 的补全和快捷键上次我检查过 IPython 由于缺少 sys get
ML.NET 无法在 uwp 上运行

我在 Visual Studio 2017 中构建了一个 UWP 应用程序并在解决方案中添加了一个类库来运行 ML NET 但每次运行该应用程序时都会出现异常 PlatformNotSupportedException 此平台不支持检索有
反规范化 XSD

我需要对 XML 模式进行非规范化以便为将创建符合该模式的文档的人员生成文档用户不了解 XSD 并且很可能永远不会学习我见过的工具能够为其他 XSD 开发人员生成文档但我的用户对如何构建架构的细节不感兴趣他们只想知道他们可以做什么
更改称为通知的 applescript 的图标

有了 OSX Mavericks 我们现在可以带有 applescript 的通知 http www macosautomation com mavericks notifications index html很容易然而似乎没有一种方法
如何将测试文件夹添加到旧的 Android Studio 项目

我在将用于测试的项目结构添加到 Android Studio 中的旧 Android 项目中时遇到一些问题当您在 Android Studio 中创建新项目时您将获得从一开始就创建的用于测试的目录 src test java for u
最后一项具有不同类型的元组（首先从剩余元素开始）

我有一个类型Foo那是一个Array可以包含任意数量的Bar元素带有可选的最后一个Qux元素以下是一些有效数据的示例 bar qux bar qux bar bar bar bar bar bar bar bar qux 无效数据示例
如何绘制多面直方图（不是条形图）以及相对于每个面的百分比？

虽然有几篇关于如何在条形图的每个方面使用缩放百分比的帖子但我没有看到任何帖子显示如何在直方图中执行此操作可以这样做吗这是我研究过的两篇文章所以帖子1 使用 ggplot2 获取反映各个方面的百分比比例 https stackover
如何在 R 组内的两个变量的组合上选择具有特定值的行

这是我之前提出的 R 问题的扩展如何在R中选择组内具有特定值的行 https stackoverflow com questions 55853841 how to select rows with certain values with

如何在 R 组内的两个变量的组合上选择具有特定值的行

如何在 R 组内的两个变量的组合上选择具有特定值的行 的相关文章

随机推荐

热门标签

如何在 R 组内的两个变量的组合上选择具有特定值的行的相关文章