如何将组内的第一个值与每个后续值进行比较，直到满足条件

2024-02-06

所以我有一个一般结构如下的数据框：

数据框：

rownum	group	date
1	a	2021-05-01
2	a	2021-05-02
3	a	2021-05-03
4	b	2021-05-15
5	b	2021-05-17
6	b	2021-05-30
7	b	2021-05-31
8	b	2021-05-31
9	c	2021-05-01
10	c	2021-05-05

我想做的是，在组内，将第一行与下一行进行比较，直到日期之间的差异达到某个阈值，例如 10 天。然后，一旦该行满足阈值，我想根据后续行测试下一行。它看起来像这样：

结果，使用阈值 10：

|rownum|group |date       |date diff|
|------|------|-----------|---|        
|1     | a    |2021-05-01 |NA|
|2     | a    |2021-05-02 |1|
|3     | a    |2021-05-03 |2|
|4     | b    |2021-05-15 |NA|
|5     | b    |2021-05-17 |2|
|6     | b    |2021-05-30 |15 (meets criteria, start from row 7 now)|
|7     | b    |2021-05-31 | NA|
|8     | b    |2021-05-31 | 0|
|9     | c    |2021-05-01 | NA|
|10    | c    |2021-05-05 |  4|

因此，重申一下，它将一组的第一行与后续行进行比较，直到满足某个阈值。然后从组内的第一个代表处开始计数，直到组内的后续行。差异记录为 datediff。

我已经尝试过，但我不知道供应是否可行：

dataframe %>% 
    group_by(group) %>%
    mutate(
        datediff = sapply(date, function(x) {
            all(difftime(dataframe$date,dplyr::lag(dataframe, n = 1, default = NA)))
                }
        )
    )

也尝试过这个，我认为这更接近我想要的：

for (m in 1:length(dataframe)) {
    dataframe <- dataframe %>% 
        group_by(group) %>% 
        rowwise() %>% 
        mutate(datediff = difftime(dataframe$date,dplyr::lag(date, n = m, default = NA), units="days"))
    }

到目前为止，我还无法获得正确的行比较来实现阈值位。

Another tidyverse解决方案。我们可以用accumulate来完成这个任务。dat来自 r2evans 的示例。

library(tidyverse)

dat2 <- dat %>%
  group_by(group) %>%
  mutate(diff_lag = as.integer(date - lag(date))) %>%
  mutate(diff = accumulate(diff_lag, function(x, y){
    if (is.na(x)){
      res <- y
    }  else if (x > 10){
      res <- NA
    } else {
      res <- x + y
    }
    return(res)
  })) %>%
  select(-diff_lag) %>%
  ungroup()

dat2
# # A tibble: 10 x 4
#    rownum group date        diff
# <    int> <chr> <date>     <int>
#  1      1 a     2021-05-01    NA
#  2      2 a     2021-05-02     1
#  3      3 a     2021-05-03     2
#  4      4 b     2021-05-15    NA
#  5      5 b     2021-05-17     2
#  6      6 b     2021-05-30    15
#  7      7 b     2021-05-31    NA
#  8      8 b     2021-05-31     0
#  9      9 c     2021-05-01    NA
# 10     10 c     2021-05-05     4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

ifstatement

dplyr

Iteration

rowwise

如何将组内的第一个值与每个后续值进行比较，直到满足条件的相关文章

设置迭代顺序因运行而异

为什么 Python 集具有相同内容的迭代顺序在不同的运行中会有所不同我可以选择哪些选项来使其在不同的运行中保持一致据我所知 Python 集的迭代顺序是任意的如果我将 a b 和 c 放入集合中然后迭代它们它们可能会以任何顺序
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
R、Rcpp 与 Armadillo 中矩阵 rowSums() 与 colSums() 的效率

背景来自 R 编程我正在扩展到 C C 形式的编译代码Rcpp 作为循环交换以及一般的 C C 效果的实践练习我实现了 R 的等效项rowSums and colSums 矩阵的函数Rcpp 我知道它们以 Rcpp 糖的形式存在并
在 R 传单中添加不透明度滑块

如何在 R leaflet 应用程序中添加滑块来控制特定图层的不透明度对于这个应用程序我不想使用闪亮这里建议在 R 传单应用程序中添加滑块 https stackoverflow com questions 37682619 add
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
使用officer R导出时如何提高ggplots的分辨率

我想将图表导出到 PPT 并使用Officer 包来实现相同的目的但是图表的默认分辨率较低我想更改它我目前正在使用以下电话 ph with gg p1 type chart res 1200 其中 p1 是 ggplot 对象运行
R 闪亮仪表板中的动态重复条件面板

我正在尝试创建一个动态条件面板所以我的条件如下在用户界面中输入 selectInput inpt Input Number seq 1 50 1 selectize FALSE 我的条件面板 UI 输入是 conditionalPane
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI
如何纠正 data.frame 上的字符编码

我有一个像这样的数据框 data names lt data frame DATA c 1 5 rownames data names lt c IV xc1N JOS xc9 LUC xcdA RAM xd3N TO xd1O data
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
在 RcppArmadillo 中将列向量乘以数值标量

我在编译这个简单的程序时遇到一些麻烦c 代码使用Rcpp和RcppArmadillo包裹采用以下简单示例将矩阵的每一列乘以数值标量 code lt arma mat out Rcpp as
在包加载之前如何知道 R 中特定函数属于哪个包？

例如我知道许多流行的功能例如tbl df 我通常不记得它属于哪个包即data table or dplyr 所以我必须始终记住并加载一个包但我做不到 tbl df除非我加载了正确的包在 R 控制台本身加载或安装包之前有没有办法知
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
为什么这个 R ggplot2 代码会显示一个空白的显示设备？

虽然 SO 通常不用于帮助解决错误但这个显示了特别简单且特别烦人的行为如果你是一个ggplot2用户您可以在 10 秒或更短的时间内重现它正如这个 GitHub 问题 ggplot gtable 创建空白显示 https githu
R：按组，测试一个变量的每个值是否存在于另一个变量中

我有一个数据框架结构如下 a lt c 1 1 1 2 2 2 3 3 3 3 4 4 b lt c 1 2 3 1 2 3 1 2 3 4 1 2 c lt c NA NA 2 NA 1 1 NA NA 1 1 NA NA df lt
增加雷达图中长轴标签的空间

我想创建一个雷达图ggirahExtra ggRadar 问题是我的标签很长并且被剪掉了我想我可以通过添加在标签和绘图之间创建更多空间margin margin 0 0 2 0 cm to element text in axis tex
当设置 coord_fixed 时，ggplot/shiny 中的鼠标悬停坐标是错误的

我正在使用问题中的答案当您将鼠标悬停在闪亮的 ggplot 上时出现工具提示 https stackoverflow com questions 27965931 tooltip when you mouseover a ggplot o

随机推荐

logging.error() 被调用了多少次？

也许它根本不存在因为我找不到它但是使用 python 的日志记录包有没有办法查询记录器以找出特定函数被调用的次数例如报告了多少错误警告日志记录模块似乎不支持此功能从长远来看您可能最好创建一个新模块并通过对现有日志记录模块
如何发布和订阅非 Mongodb 的数据？

Meteor publish 设置执行一些异步请求例如 API 然后返回要在 React 组件中显示的数据的过程是什么发布是如何工作的以及客户端代码如何访问它如果可能的话我想用 withTracker 函数来做到这一点谢谢本指南
如何将标签或按钮恰好放置在表单的中间？

我找不到将标签或按钮精确放置在表单中间的工具或属性例如在 X 轴上对比 2015 年 Design time 在我的 VisualStudio2010 中我有这 2 个按钮用于水平和垂直居中它位于工具栏布局中如果没有您可以
WebView，将本地 .CSS 文件添加到 HTML 页面？

在 android 中我使用 WebView 来显示我使用 Apache 的 HttpClient 从互联网获取的网页的一部分为了只从 html 中获取我想要的部分我使用 Jsoup String htmlString EntityU
Python 是否存在与素数相关的函数库？

我刚刚实施了米勒拉宾测试 http en wikipedia org wiki Miller E2 80 93Rabin primality test以及一个用于分解数字的简单函数两者都可以做得更好至少米勒拉宾测试是众所周知的那么
如何在 Visual Studio 2015 中使用 clang 编译适用于 Windows 的 C++

据我了解 Visual Studio 2015 附带了 clang 首先我以为这仅适用于 Android 和 iOS 应用程序但根据本文 http blogs msdn com b vcblog archive 2015 05 01 b
对于相同的数据，为什么 scipy.stats.gaussian_kde() 比 seaborn.kde_plot() 慢？

在 python 3 7 中我有这个 numpy 数组其形状 2 34900 该数组是一个坐标列表其中索引 0 表示 X 轴索引 1 表示 y 轴当我使用 seaborn kde plot 来可视化该数据的分布时在 i5 第七代
是否可以创建一个 DateFormatter 将两位数年份转换为四位数年份？

在我的 Java 应用程序中我使用DateFormat解析日期输入的实例 DateFormat fmt fmt DateFormat getDateInstance DateFormat DEFAULT dd MM yyyy for de
谷歌地图地理编码器返回状态

我正在使用谷歌地图地理编码器对邮政编码进行地理编码我希望它返回邮政编码所在的状态并将其存储在变量 local 中我收到一条错误消息表明 local 未定义为什么参见下面的代码 var address document getEle
定义读写操作符 [ ]

在 The C Programming Language 一书中作者给出了以下示例以及几条语句定义一个用于读取和写入的运算符例如是很困难的因为简单地返回引用并让用户决定如何处理它是不可接受的 cref 是帮助实现一个区分读和写的下
使用 .replaceWith 删除
标签但将内容保留在标签内？

我有一个表格单元格其中包含包含在内的内容 p tags td class address td p p Content goes here p 我想要 p 标签被删除所以它看起来像这样 td class address Content
MSysObjects 错误没有读取权限

我正在尝试通过以下方式连接到 MS Access 数据库 mdb OleDb 我的查询是 SELECT FROM ListQueries 这让我犯了错误 SQL 执行错误执行的 SQL 语句 SELECT FROM ListQueries
javascript中获取小数点后的值

我有一个 JavaScript 号码 12 1542 我想要这个字符串中的新字符串 12 1542 60 我怎么才能得到它谢谢你可以使用模运算符 https developer mozilla org en JavaScript Ref
SDK.DIR丢失？安卓更新项目？

当我这样做时我收到此错误 ant release sdk dir is missing Make sure to generate local properties using android update project or to i
jsTree - 渲染优化|具有 2000 个节点的超长渲染

我正在使用 jsTree 1 0 rc3 以及通过 AJAX 加载数据的选项并且在通过它加载大约 2000 个子节点时遇到问题虽然服务器会在几秒钟内响应但 jsTree 仅需要大约 40 秒才能在浏览器 chrome FF 中呈现结果
使用Python下载Kaggle数据集

我已经尝试下载kaggle dataset通过使用Python 但是我在使用时遇到了问题request方法和下载的输出 csv 文件是损坏的 html 文件 import requests The direct link to the Ka
Java 生成 RSA 密钥对并转换为 PEM - 但 OpenSSL 函数 PEM_read_bio_RSA_PUBKEY 返回 null

我使用以下代码生成 RSA 密钥对并将其转换为 PEM 但是当我使用OpenSSL功能时PEM read bio RSA PUBKEY是返回null Java代码 public static RSAKeyPair creatKeyPair
如何从数据子集中随机抽取并在 R 中引导统计测试

我有一个包含两个变量的数据集我希望统计测试它们在引导循环中是否相关即使用 Spearman 的等级校正cor test 我的数据集中的大多数测量值都来自独立的样本单位我们称之为植物单位尽管有些测量值来自同一植物为了处理伪复制问题
Azure ACS 是否像 Salesforce 一样支持 saml 2.0 IdP？

我没有安装访问控制服务 ACS 但我在一些在线视频演示中看到 Salesforce 不在可用的预安装身份提供商列表中 Salesforce 可以配置为 IdP 使用标准 SAML 2 0 我可以设置 ACS 以便使用 Salesforce
如何将组内的第一个值与每个后续值进行比较，直到满足条件

所以我有一个一般结构如下的数据框数据框 rownum group date 1 a 2021 05 01 2 a 2021 05 02 3 a 2021 05 03 4 b 2021 05 15 5 b 2021 05 17 6 b 20

如何将组内的第一个值与每个后续值进行比较，直到满足条件

如何将组内的第一个值与每个后续值进行比较，直到满足条件 的相关文章

随机推荐

热门标签

如何将组内的第一个值与每个后续值进行比较，直到满足条件的相关文章