R - 从排序数据构建新变量

2024-04-09

这是更新/后续this https://stackoverflow.com/questions/55639062/detecting-sequence-by-group-and-compute-new-variable-for-the-subset问题。答案概述了他们不符合新的要求。

我正在寻找一种有效的方法（data.table？）为每个构建两个新的措施ID.

措施1和措施2需要满足以下条件：

条件一：查找一个由三行组成的序列，其中：

首先count > 0
第二个“计数> 1”和
第三count ==1.

措施 1 的条件 2：

取元素的值product序列的第三行是：
in the product序列的第二行和
不在stock按顺序排列的第一行。

措施 2 的条件 2：

取元素的值product序列的最后一行是：
不在product序列第二行的
不在stock按顺序排列的第一行。

Data:

df2 <- data.frame(ID = c(1,1,1,1,1,1,1,2,2,2,3,3,3,3),
              seqs = c(1,2,3,4,5,6,7,1,2,3,1,2,3,4),
              count = c(2,1,3,1,1,2,3,1,2,1,3,1,4,1),
              product = c("A", "B", "C", "A,C,E", "A,B", "A,B,C", "D", "A", "B", "A", "A", "A,B,C", "D", "D"),
              stock = c("A", "A,B", "A,B,C", "A,B,C,E", "A,B,C,E", "A,B,C,E", "A,B,C,D,E", "A", "A,B", "A,B", "A", "A,B,C", "A,B,C,D", "A,B,C,D"))

> df2
   ID seqs count product     stock
1   1    1     2       A         A
2   1    2     1       B       A,B
3   1    3     3       C     A,B,C
4   1    4     1   A,C,E   A,B,C,E
5   1    5     1     A,B   A,B,C,E
6   1    6     2   A,B,C   A,B,C,E
7   1    7     3       D A,B,C,D,E
8   2    1     1       A         A
9   2    2     2       B       A,B
10  2    3     1       A       A,B
11  3    1     3       A         A
12  3    2     1   A,B,C     A,B,C
13  3    3     4       D   A,B,C,D
14  3    4     1       D   A,B,C,D

所需的输出如下所示：

   ID seq1 seq2 seq3 measure1   measure2
1:  1    2    3    4   C         E 
2:  2    1    2    3    
3:  3    2    3    4   D

你会如何编码？

要做到这一点，您需要了解以下几件事：

shift比较组中值的功能
separate_rows函数来分割字符串以获取标准化数据视图。

library(data.table)
dt <- data.table(ID = c(1,1,1,1,1,1,1,2,2,2,3,3,3,3),
                  seqs = c(1,2,3,4,5,6,7,1,2,3,1,2,3,4),
                  count = c(2,1,3,1,1,2,3,1,2,1,3,1,4,1),
                  product = c("A", "B", "C", "A,C,E", "A,B", "A,B,C", "D", "A", "B", "A", "A", "A,B,C", "D", "D"),
                  stock = c("A", "A,B", "A,B,C", "A,B,C,E", "A,B,C,E", "A,B,C,E", "A,B,C,D,E", "A", "A,B", "A,B", "A", "A,B,C", "A,B,C,D", "A,B,C,D"))

dt[, count.2 := shift(count, type = "lead")]
dt[, count.3 := shift(count, n = 2, type = "lead")]

dt[, product.2 := shift(product, type = "lead")]
dt[, product.3 := shift(product, n = 2, type = "lead")]


dt <- dt[count > 0 & count.2 > 1 &  count.3 == 1]
dt <- unique(dt, by = "ID")

library(tidyr)
dt.measure <- separate_rows(dt, product.3, sep = ",")
dt.measure <- separate_rows(dt.measure, stock, sep = ",")
dt.measure <- separate_rows(dt.measure, product, sep = ",")

dt.measure[, measure.1 := (product.3 == product.2 & product.3 != stock)]
dt.measure[, measure.2 := (product.3 != product.2 & product.3 != stock)]
res <- dt.measure[, 
  .(
    measure.1 = max(ifelse(measure.1, product.3, NA_character_), na.rm = TRUE), 
    measure.2 = max(ifelse(measure.2, product.3, NA_character_), na.rm = TRUE)
  ),
  ID
]

dt <- merge(dt, res, by = "ID")
dt[, .(ID, measure.1, measure.2)]
# ID measure.1 measure.2
# 1:  1         C         E
# 2:  2      <NA>      <NA>
# 3:  3         D      <NA>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

dataTable

Sequence

R - 从排序数据构建新变量的相关文章

条件移位：在 pandas 中使用多个条件从“当前行值”中减去“前一行值”

我有以下数据框 Disease HeartRate State MonthStart MonthEnd Covid 89 Texas 2020 02 28 2020 03 31 Covid 91 Texas 2020 03 31 2020
在 mutate 和 across 之后使用 ~separate

目的是将所有物种 setosa 行转换为一行 setosa 这是一个最小的示例实际上有更多列和更多组我有这个数据框 head iris 2 gt select 1 2 5 gt group by Species Sepal Length
使用管道语法处理模型列表

我经常喜欢拟合和检查与 R 数据框中的两个变量相关的多个模型我可以使用如下语法来做到这一点 require tidyverse require broom models lt list hp exp cyl hp cyl map df m
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
从向量中删除元素在 R 中出现的时间量

我想从一个向量中删除元素在另一个向量中出现的时间就像我要减去它们一样鉴于我想要删除的元素向量中的每个元素也存在于我想要从中删除的主向量中 a lt c A B B C C C b lt c A B C C a a in b return
回归时如何设置系数值；右

我正在寻找一种指定预测变量值的方法当我使用当前数据运行 glm 时其中一个变量的系数接近 1 我想将其设置为 0 8 我知道这会给我一个较低的 R 2 值但我先验地知道模型的预测能力会更大 glm 的权重组件看起来很有希望但我还没有
如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
使用 readHTMLTable 从 https 网页读取表格

我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
stat_function 从函数生成平线

我有以下代码 library ggplot2 f lt function x if x gt 2 1 x 0 3 else 0 graph lt ggplot data frame x c 0 10 aes x graph lt graph
在`rmarkdown`中，如何在句子中添加图标？

In rmarkdown 如何在句子中添加图标例如如下如何添加markdown icon单词 Markdown 和 is 之间有一个很好的 R 包可以轻松下载 RMarkdown 文档并将图标添加到其中 icons https gi
从另一列的子字符串创建列

我有一个 Pandas 数据框对象我想从现有列的子字符串创建新列我的数据如下所示 Date variable want1 want2 want3 0 02 01 08 Australia Sydney A Australia Sydne
根据 pyspark 中的条件从数据框中删除行

我有一个包含两列的数据框 col1 col2 22 12 2 1 2 1 5 52 1 2 62 9 77 33 3 我想创建一个新的数据框它只需要行 col1 的值 gt col2 的值就像注释一样col1 很长类型和col2 有双
如何总结此R问题中的销售数量、售出酒类数量和花费金额

我使用以下代码在 R 上上传我的数据 if file exists ames liquor rds url lt https github com ds202 at ISU materials blob master 03 tidyvers
空间数据xyz到矩阵

我有一个大数据框 100 000 行其中包含 LON LAT VALUE 我想将其转换为矩阵 EPSG 中的坐标 3035 我使用以下命令尝试了 reshape2 包 acast df lon lat value var value 效果
在 R 中使用逻辑 grep 抓取文本

下午好谢谢你帮我解答这个问题我有兴趣抓取一组超过 5000 个 URL 的列表我使用 lapply 和 readLines 使用下面的示例代码提取这些网页的文本 multipleURL lt c http dailymed nlm n
通过 r markdown 中的循环创建代码片段

如同如何使用R中的knitr创建一个包含代码块和文本的循环 https stackoverflow com questions 36373630 how to create a loop that includes both a code
R 中使用 `UseMethod()` 与 `inherits()` 来确定对象的类

如果我需要根据 R 对象的类以不同的方式处理它们我可以使用if and else在单个函数内 foo lt function x if inherits x list Foo the list else if inherits x num
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the
R Leaflet Legend：colorBin-删除中断之间的小数

我正在使用 Leaflet 库在 R 中创建交互式 HTML 地图传说中采用的是colorBin用于创建将数据分为 6 个类别的方法使用min values and max values 我已经定义了美国社区调查收入数据的特定范围可能落

随机推荐

UpdatePanel 中的 ASP.NET FileUpload - 仍然无法正常工作

尝试在 NET 4 5 C Web 应用程序的 updatepanel 中使用 FileUpload 或 AsyncFileUpload 控件我尝试在母版页中使用标准 Scriptmanager 或 ToolKitScriptManage
子窗口中的 ListView 触发立即关闭，或在滚动时触发

我有一个相当奇怪的场景如果我启动一个包含ListView如果有一个中等复杂的委托和足够的项目来轻松超出可见区域整个子窗口将在启动时立即关闭降低委托的复杂性将允许窗口打开但随后快速滚动窗口ListView会强行关闭它 This SSC
Typescript 期望 mockImplementation 为所有方法和属性提供模拟

我正在使用 typescript jest 并且在创建模拟实现时遇到了一些类型检查问题举个例子我想嘲笑Credentials对象从aws sdk import Credentials from aws sdk jest mock aws
如何在 Android 中从 PostExecute 正确启动 Activity？

我有一个 AsyncTask 它用来自互联网的解析数据填充自定义列表在 PostExecute 中我填充该列表并准备好将其传输到新的活动我这样做 Override protected void onPostExecute List
找不到您输入的 Apple ID 或您的密码不正确

我正在 ipad ios 7 0 3 上调试我的应用内购买但是当我输入密码时总是显示找不到您输入的apple id或您的密码不正确我的开发者id和在这个ipad上注册的apple id不一样当我故意输入错误的密码时它会显示不同的
React Leaflet使用MapContainer显示图例

我正在使用 React leaflet 3 1 0 我想在地图中显示图例我为图例构建了一个组件并传递从 MapContainer whenCreated setMap 获取的地图实例地图组件 import useState from
使用 PHPstorm 让 php 代码在浏览器中执行

因此当我单击运行时 PHPstorm 正在其控制台中正常运行 php 代码这很好但我想在浏览器中看到它所以我在 PHPstorm 中创建了一个新的 PHP Web 应用程序将服务器设置为 localhost 8000 现在当
为 Corona SDK 制作游戏图形的可能方法是什么？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我一直在使用 Corona SDK 开发一个简单的 iPhone Android 游戏游戏本身不使用导入的图形仅使用常规形状现在我面
Yocto/Bitbake 向 rootfs 嵌入式 Linux 添加空目录的方法

是否有任何方法可以向 rootfs 添加新的空目录我尝试将其添加到我的 bbappend 文件之一中 do install install d D tmp myNewDir FILES PN tmp myNewDir 但我遇到了非描述性错
使用带有点符号的变量编辑/访问 Powershell 对象

我正在尝试在 PowerShell 中编辑通过导入 JSON 文件创建的对象然后我尝试使用点表示法来访问或修改对象的属性例如下面是一个 JSON 示例和一个代码片段 menus menu1 position left Import t
wix 反应本机导航 v2 |如何从侧抽屉组件将新屏幕推送到当前屏幕

我有下一个布局 Navigation setRoot root sideMenu right component id sideDrawer name DRAWER center bottomTabs id bottomTabs
std::condition_variable::wait 带谓词

在 std condition variable 的文档中存在以谓词函数作为参数的 wait 重载该函数将等待直到谓词函数为 true 的第一次wake up In the 文档 http en cppreference com w
Java库截断html字符串？

我需要截断在存储在数据库之前已经被我的应用程序清理过的 html 字符串并且仅包含链接图像和格式标记但在向用户呈现时需要对其进行截断以呈现内容概述 So I 需要缩写html字符串在java中这样 img src http d2qx
如何在 Qt connect 中声明函子参数？

Qt 可以通过函子参数在信号槽连接中使用 lambda 函数如图所示 http qt project org doc qt 5 0 qtcore qobject html connect 5 但是如何在 Qt connect 中声明函子参数
在 std::list 上使用擦除时的 C++ 分段

我正在尝试使用以下命令从 C 链接列表中删除项目erase和一个列表迭代器 include
将整数列表转换为 int 数组[重复]

这个问题在这里已经有答案了有没有办法将整数列表转换为整数数组不是整数类似于 List 到 int 的东西无需循环遍历列表并手动将 intger 转换为 int 您可以使用toArray得到一个数组Integers ArrayUtil
未使用的 css - 如何清理它？

也许任何有经验的 Web 开发人员都会熟悉这个问题随着时间的推移你的 css 文件可能会变得非常巨大和丑陋因为所有不再使用的选择器这可能很难找到我正在开发一个 Rails 项目我们经常重新设计一些东西这会导致大量的 CSS 负
如何获取方法参数名称？

假设有一个函数a method被定义为 def a method arg1 arg2 pass 从开始a method本身我如何获取参数名称例如作为字符串元组例如 arg1 arg2 看看inspect http docs pyt
为 Oauth2 Spring Boot 创建自定义 OpenId 提供程序

我使用 Oauth2 框架进行授权和访问控制以保护我的 Spring Boot 微服务 api Oauth2 框架工作正常但现在我的客户需要一个专用的 OpenId 提供程序用于在 Oauth2 框架之上进行身份验证我已经在 Goo
R - 从排序数据构建新变量

这是更新后续this https stackoverflow com questions 55639062 detecting sequence by group and compute new variable for the subs

R - 从排序数据构建新变量

R - 从排序数据构建新变量 的相关文章

随机推荐

热门标签

R - 从排序数据构建新变量的相关文章