具有双重重置的复数累加和

2024-04-16

我试图遵循一些关于何时将数据分组到图表中的规则。我将如何处理这个数据框：

# A tibble: 11 x 8
   assay      year   qtr invalid valid total_assays    hfr predicted_inv
   <chr>     <dbl> <dbl>   <dbl> <dbl>        <dbl>  <dbl>         <dbl>
 1 test_case 2016.    1.      2.   36.          38. 0.0350         1.33 
 2 test_case 2016.    2.      1.   34.          35. 0.0350         1.23 
 3 test_case 2016.    3.      0.   25.          25. 0.0350         0.875
 4 test_case 2016.    4.      2.   23.          25. 0.0350         0.875
 5 test_case 2017.    1.      1.   29.          30. 0.0350         1.05 
 6 test_case 2017.    2.      2.   24.          26. 0.0350         0.910
 7 test_case 2017.    3.      0.   23.          23. 0.0350         0.805
 8 test_case 2017.    4.      1.   20.          21. 0.0350         0.735
 9 test_case 2018.    1.      2.   33.          35. 0.0350         1.23 
10 test_case 2018.    2.      5.   28.          33. 0.0350         1.16 
11 test_case 2018.    3.      4.    9.          13. 0.0350         0.455

对于这个：

       assay year qtr invalid valid total_assays   hfr predicted_inv co_inv co_val co_prd_inv trend
1  test_case 2016   1       2    36           38 0.035         1.330      2     36      1.330    No
2  test_case 2016   2       1    34           35 0.035         1.225      3     70      2.555    No
3  test_case 2016   3       0    25           25 0.035         0.875      3     95      3.430    No
4  test_case 2016   4       2    23           25 0.035         0.875      5    118      4.305   Yes
5  test_case 2017   1       1    29           30 0.035         1.050      1     29      1.050    No
6  test_case 2017   2       2    24           26 0.035         0.910      3     53      1.960    No
7  test_case 2017   3       0    23           23 0.035         0.805      3     76      2.765    No
8  test_case 2017   4       1    20           21 0.035         0.735      4     96      3.500    No
9  test_case 2018   1       2    33           35 0.035         1.225      6    129      4.725   Yes
10 test_case 2018   2       5    28           33 0.035         1.155      5     28      1.155   Yes
11 test_case 2018   3       4     9           13 0.035         0.455      4      9      0.455    No

规则相当简单。对于每一行，如果 invalid 或 Predicted_inv 的累积和为 5 或更大，则趋势为“yes”，并且所有三个参数（invalid、valid、predicted_inv）的累积和都将重置并从下一行重新开始。最后，分组 (co_*) 将呈现趋势。

我尝试过使用 dplyr 的一些解决方案，但是当我尝试同时创建多个相互依赖的变量时，我不断收到错误。

现在我正在尝试一个自定义函数，它仅将 3 个参数作为向量，但我一直被迫构建循环......我更喜欢一个易于阅读的 dplyr 解决方案。

这是 dputs：

egdf1 <- structure(list(assay = c("test_case", "test_case", "test_case", 
                         "test_case", "test_case", "test_case", "test_case", "test_case", 
                         "test_case", "test_case", "test_case"), year = c(2016, 2016, 
                                                                          2016, 2016, 2017, 2017, 2017, 2017, 2018, 2018, 2018), qtr = c(1, 
                                                                                                                                         2, 3, 4, 1, 2, 3, 4, 1, 2, 3), invalid = c(2, 1, 0, 2, 1, 2, 
                                                                                                                                                                                    0, 1, 2, 5, 4), valid = c(36, 34, 25, 23, 29, 24, 23, 20, 33, 
                                                                                                                                                                                                              28, 9), total_assays = c(38, 35, 25, 25, 30, 26, 23, 21, 35, 
                                                                                                                                                                                                                                       33, 13), hfr = c(0.035, 0.035, 0.035, 0.035, 0.035, 0.035, 0.035, 
                                                                                                                                                                                                                                                        0.035, 0.035, 0.035, 0.035), predicted_inv = c(1.33, 1.225, 0.875, 
                                                                                                                                                                                                                                                                                                       0.875, 1.05, 0.91, 0.805, 0.735, 1.225, 1.155, 0.455)), .Names = c("assay", 
                                                                                                                                                                                                                                                                                                                                                                          "year", "qtr", "invalid", "valid", "total_assays", "hfr", "predicted_inv"
                                                                                                                                                                                                                                                                                                       ), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
                                                                                                                                                                                                                                                                                                                                                                  -11L))

egdf2 <- structure(list(assay = c("test_case", "test_case", "test_case", 
                         "test_case", "test_case", "test_case", "test_case", "test_case", 
                         "test_case", "test_case", "test_case"), year = c(2016L, 2016L, 
                                                                          2016L, 2016L, 2017L, 2017L, 2017L, 2017L, 2018L, 2018L, 2018L
                         ), qtr = c(1L, 2L, 3L, 4L, 1L, 2L, 3L, 4L, 1L, 2L, 3L), invalid = c(2L, 
                                                                                             1L, 0L, 2L, 1L, 2L, 0L, 1L, 2L, 5L, 4L), valid = c(36L, 34L, 
                                                                                                                                                25L, 23L, 29L, 24L, 23L, 20L, 33L, 28L, 9L), total_assays = c(38L, 
                                                                                                                                                                                                              35L, 25L, 25L, 30L, 26L, 23L, 21L, 35L, 33L, 13L), hfr = c(0.035, 
                                                                                                                                                                                                                                                                         0.035, 0.035, 0.035, 0.035, 0.035, 0.035, 0.035, 0.035, 0.035, 
                                                                                                                                                                                                                                                                         0.035), predicted_inv = c(1.33, 1.225, 0.875, 0.875, 1.05, 0.91, 
                                                                                                                                                                                                                                                                                                   0.805, 0.735, 1.225, 1.155, 0.455), co_inv = c(2L, 3L, 3L, 5L, 
                                                                                                                                                                                                                                                                                                                                                  1L, 3L, 3L, 4L, 6L, 5L, 4L), co_val = c(36L, 70L, 95L, 118L, 
                                                                                                                                                                                                                                                                                                                                                                                          29L, 53L, 76L, 96L, 129L, 28L, 9L), co_prd_inv = c(1.33, 2.555, 
                                                                                                                                                                                                                                                                                                                                                                                                                                             3.43, 4.305, 1.05, 1.96, 2.765, 3.5, 4.725, 1.155, 0.455), trend = c("No", 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  "No", "No", "Yes", "No", "No", "No", "No", "Yes", "Yes", "No"
                                                                                                                                                                                                                                                                                                                                                                                                                                             )), .Names = c("assay", "year", "qtr", "invalid", "valid", "total_assays", 
                                                                                                                                                                                                                                                                                                                                                                                                                                                            "hfr", "predicted_inv", "co_inv", "co_val", "co_prd_inv", "trend"
                                                                                                                                                                                                                                                                                                                                                                                                                                         ), class = "data.frame", row.names = c(NA, -11L))

使用功能cumsumbinning从 MESS 包中设置累积组总和不得超过的阈值（示例中为 5）。请记住，在第 9 行中，因为 2 与 4 相加超过了 5 的阈值，所以会创建另一个组，而在您所需的输出中，您希望在下一行中重置该组。

library(MESS)  
  egdf1 %>%
  group_by(group = cumsumbinning(invalid, 5)) %>%
  mutate(
    co_inv = cumsum(invalid),
    co_val = cumsum(valid),
    co_prd_inv = cumsum(predicted_inv),
    trend = ifelse(group - lag(group, default = 0) > 1, "yes", "no")
  )

Output

   assay      year   qtr invalid valid total_assays   hfr predicted_inv group co_inv co_val co_prd_inv trend
   <chr>     <dbl> <dbl>   <dbl> <dbl>        <dbl> <dbl>         <dbl> <int>  <dbl>  <dbl>      <dbl> <chr>
 1 test_case  2016     1       2    36           38 0.035         1.33      1      2     36      1.33  no   
 2 test_case  2016     2       1    34           35 0.035         1.23      1      3     70      2.56  no   
 3 test_case  2016     3       0    25           25 0.035         0.875     1      3     95      3.43  no   
 4 test_case  2016     4       2    23           25 0.035         0.875     1      5    118      4.30  no   
 5 test_case  2017     1       1    29           30 0.035         1.05      2      1     29      1.05  yes  
 6 test_case  2017     2       2    24           26 0.035         0.91      2      3     53      1.96  no   
 7 test_case  2017     3       0    23           23 0.035         0.805     2      3     76      2.76  no   
 8 test_case  2017     4       1    20           21 0.035         0.735     2      4     96      3.5   no   
 9 test_case  2018     1       2    33           35 0.035         1.23      3      2     33      1.23  yes  
10 test_case  2018     2       5    28           33 0.035         1.16      4      5     28      1.16  yes  
11 test_case  2018     3       4     9           13 0.035         0.455     5      4      9      0.455 yes

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

具有双重重置的复数累加和的相关文章

对于多项式，获取其所有极值并通过突出显示所有单调部分来绘制它

有人问我这个有趣的问题我认为值得将其发布在这里因为 Stack Overflow 上还没有任何相关线程假设我有长度为的多项式系数n vector pc 其中次数多项式n 1对于变量x可以以其原始形式表示 pc 1 pc 2 x pc
编写健壮的 R 代码：命名空间、屏蔽和使用 `::` 运算符

简洁版本对于那些不想阅读我的案例的人来说这就是本质最小化新包破坏现有代码即编写您编写的代码的机会的推荐方法是什么尽可能坚固充分利用该功能的推荐方法是什么命名空间机制 when a just using贡献的软件包比如在一
将天气 iframe 嵌入到 Shiny Dashboard 中

我正在尝试将 Forecast io 的天气预报嵌入到闪亮的仪表板中我最初在使用符号时遇到了麻烦但看到一篇文章提供了如何使用特殊字符格式化 HTML 代码的示例但是当我运行该应用程序时我看到一个简单的未找到即使我知道该链接有
warnings() 在函数内不起作用？如何解决这个问题？

op lt options warn 0 although doesn t work for any value of warn assign last warning NULL envir baseenv thisDoesntWork l
在 R 中将时间间隔数据扩展为天数

假设我有如下所示的数据 interval id indiv id role start date end date 1 1 A 2006 05 01 2006 06 16 2 1 B 2006 06 16 2006 10 16 3 1 A
使用 data.table 进行分组并选择最短日期

My Data df1 lt structure list ID c A A A B B C c1 1 6 c2 1 6 myDate c 01 01 2015 02 02 2014 03 01 2014 09 09 2009 10 10
将 RDS 文件从网络（即 URL）直接加载到 R 中？

read csv 具有直接从 url 读取的出色能力 readRDS 才不是我想将 RDS 文件从 Internet 移动到我的 R 环境我看到有几种方法 Method 1 此方法会用下载的文件弄乱工作目录 myurl lt https
如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
聚合日期时间以总结在特定条件下花费的时间

我很困惑我应该如何继续我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
R闪亮主面板显示样式和字体

我正在学习闪亮的应用程序并且有一些关于调整布局的基本问题特别是样式和字体希望得到指点或明确的答案谢谢考虑一个基本的输入输出应用程序用户在 sidebarPanel 中输入数据然后在 mainPanel 中反应性地输出结果如何
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
在 R 中导入 csv 文件时如何保留前导零？

当我写一个 csv来自 R 的文件其中我的组名称以前导零值开头前导零被保留但是当我导入 csv前导零被删除组名称被转换为整数当我导入一个组时如何保留组名称中的前导零 csvR 中的文件 Example df lt data fr
如何使用autoconf重新生成配置文件？

我使用 autoconf 重新生成配置文件它有效但是当我执行生成的配置文件时 configure 有一些错误消息例如 configure line 3713 syntax error near unexpected token bla
如何在R中匹配具有相同主键的两个表中的数据

我有两个表其中包含有关人员的数据 df1 lt data frame id c 113 202 377 288 359 name c Alex Silvia Peter Jack Jonny 这为我提供了 id name 1 113 Al
如何读取 R 中的每个 .csv 文件并将其导出到单个大文件中

你好我有以下格式的数据 101 20130826T155649 3 1 round 0 10552 180 yellow 12002 1 round 1 19502 150 yellow 22452 1 round 2 28957 130
如何总结此R问题中的销售数量、售出酒类数量和花费金额

我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
RStudio 不会通过 rPython 调用加载所有 Python 模块

我从 Bash 和 RStudio 中运行相同的脚本时出现一些意外行为请考虑以下事项我有一个文件夹 rpython 包含两个脚本 test1 R library rPython setwd rpython python load tes
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the

随机推荐

实体框架 Fluent API 映射简单的一对多关系

我有两张桌子文档 Id DocumentTypeId 标题详细信息文档类型 ID 名称描述 DocumentTypeId 是引用 DocumentTypes 表的外键 IE 所有文件都可以应该有一个分配给它们的类型我有两节课 p
多人台球游戏物理模拟[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
将邻接矩阵转换为 Cytoscape 的 Edgelist（csv 文件）

我的 csv 文件中有一个大的 200 列行邻接矩阵这详细说明了个体之间的互动我想将此文件转换为边缘列表可以手动完成但需要大量时间下面显示了一小部分数据第一个单元格是空格 A B C A 0 0 1 B 0 0 1 C 1
(0, _reactI18next.translate) 不是函数

实际上我是本地反应新手在这里我尝试使用 react i18next 将语言更改为阿拉伯语但在执行时出现以下错误 ReactNativeJS 0 reactI18next translate 不是一个函数在 0 reactI18nex
AppDelegate 或 AppController

在阅读可可教程时我注意到一些教程使用AppDelegate还有一些AppController用于定义IBActions打开使用子类的各种窗口NSWindowController 这有某种经验法则吗我创建一个仅是我的应用程序委托的类并实
如何使用 Visual Studio 2008 对 C# Web 服务进行单元测试

您应该如何使用 Visual Studio 2008 对 C 中的 Web 服务进行单元测试当我生成单元测试时它会添加对 Web 服务类的实际引用而不是 Web 引用它设置以下中指定的属性 http msdn microsoft c
检查 netcdf linux 库版本

如何确定我的系统中安装了哪个版本的 netcdf 库有命令行吗我尝试搜索 netcdf 发现了一堆文件但无法确定版本号有没有命令可以检查已安装的任何版本我在ubuntu上 netCDF 提供nc config用于此目的的命令行工具
在 Rust 中应该如何进行指针算术？

我知道答案是你不应该但为了争论如何should你做吧例如如果您想编写一个替代方案Vec
Apache 服务器上的 React、js

我正在一个react js项目中工作我有一个安装了apache服务器的云服务器我的问题是我可以在 apache 服务器上设置我的反应项目吗正如达文泰伦所说 react是一种浏览器技术除了客户端浏览器从服务器下载应用程序之外一切都
用户模型中带有 uuid 列的 Laravel Sanctum 不保存 tokenable_id

我尝试使用Laravel 8 x and Laravel sanctum 2 14 2验证我的 API 和 UUID 作为我的主密钥User model 我的定制PersonalAccessToken model use Illuminat
在 Google Places Apis 中搜索特定城市内的位置

我正在使用 Google Places Apis 来过滤特定城市内的结果我能够过滤结果但它也会显示该城市之外的结果例如如果我设置德里市的 LatLngBounds 并搜索纽约市的位置它还给了我纽约市的结果但纽约的 LatLng
为什么要实现 IEquatable 接口

我一直在阅读文章并在一定程度上理解接口但是如果我想纠正我自己的自定义 Equals 方法似乎我可以在不实现 IEquatable 接口的情况下做到这一点一个例子 using System using System Collectio
Python 如何在一行中分配多个变量？

Python 在一行中分配多个变量实际上执行了哪些步骤我以前经常做 A 0 A 1 A 1 A 0 来交换但是最近在分配链表时遇到了一个错误 insert self gt node gt def insert next self nod
Spark中连接两个RDD

我有两个 rdd 一个 rdd 只有一列其他有两列来连接键上的两个 RDD 我添加了虚拟值 0 是否有其他有效的方法可以使用 join 来执行此操作 val lines sc textFile ml 100k u data val mov
conda 内部是如何工作的？

我搜索了一段时间但找不到满意的答案康达 http conda pydata org http conda pydata org 在内部工作任何细节欢迎此外由于它与 python 无关并且显然工作得如此良好和流畅为什么它不被用作像
Spring Boot - NoClassDefFoundError：ch/qos/logback/classic/Level

我创建了一个普通的 Spring Boot 应用程序 1 5 9 RELEASE 但是当我Run As gt Spring Boot App 在 Eclipse Oxygen 中我明白 SLF4J Failed to load class
在 R Markdown 中将数据框显示为表格

In knitr我想使用 kable 包添加一个小数据框作为表格 output html document r knitr kable mtcars 1 5 1 5 format html 这将返回一个如上所述的紧凑表同时将其更改为f
机器人框架 - 清除元素文本关键字不起作用

我们有一个 html 结构的文本字段如下所示
在 CSS 流布局中自动调整图像大小以模拟 html 表格布局

我有一个图像根据屏幕分辨率它会在 CSS 流布局中下降到看不见的位置因为我已将其宽度和高度设置为静态值 CSS 流布局中是否有一种方法可以在有人缩小浏览器窗口时自动调整图像大小我已经在 html table 布局中看到了这一点并且
具有双重重置的复数累加和

我试图遵循一些关于何时将数据分组到图表中的规则我将如何处理这个数据框 A tibble 11 x 8 assay year qtr invalid valid total assays hfr predicted inv

具有双重重置的复数累加和

具有双重重置的复数累加和 的相关文章

随机推荐

热门标签

具有双重重置的复数累加和的相关文章