如果满足另一列中的条件，则将数据从一列复制到另一列

2024-01-01

我正在尝试创建一个标题为 Study_id、Conflict 的表，并创建第三列和第四列，其中包含与列中的值相对应的数据： Conflict

下面的代码实现了这个目的。然而它相当长，特别是因为我希望将其扩展以涵盖列中的数百个不同值：冲突

预先感谢您的任何指点

df <- data.frame(study_id=c("1", "1", "4", "4", "5"), 
                 Conflict=c("WATER.START", "WATER.STOP", "OIL.START", "NA", "WATER.STOP"), 
                 Result=c("TRUE", "TRUE", "TRUE", "NA", "TRUE"))

df2 <- data.frame(study_id=c("1", "2", "3", "4", "5"), 
                  WATER.start=c(1, 1, 2, NA, 6), 
                  WATER.truestart=c(1, 1, 2, NA, 25), 
                  WATER.stop=c(33, 3, 2, NA, 8), 
                  WATER.truestop= c(34, 4, 2, NA, 8))

final <- left_join(df, df2, by ='study_id')

dd <- final %>% filter(Result == "TRUE" & Conflict == "WATER.START")
dd <- dd %>% subset(., Conflict == "WATER.START", 
                    select=c(study_id, Conflict, WATER.start, WATER.truestart))
dd <- dd %>% rename(initial=WATER.start) %>% rename(verification=WATER.truestart)

ee <- final %>% filter(Result == "TRUE" & Conflict == "WATER.STOP")
ee <- ee %>% subset(., Conflict == "WATER.STOP", 
                    select=c(study_id, Conflict, WATER.stop, WATER.truestop))
ee <- ee %>% rename(initial=WATER.stop) %>% rename(verification=WATER.truestop)

ff <- bind_rows(dd, ee)
gg <- ff %>% select(study_id, Conflict, initial, verification)

gg 
#   study_id    Conflict initial verification
# 1        1 WATER.START       1            1
# 2        1  WATER.STOP      33           34
# 3        5  WATER.STOP       8            8

首先，因为看起来你只关注c('WATER.START', 'WATER.STOP'), subset你的第一个df。接下来，对于每一个MARGIN=1（即每一行），我们apply匿名函数\(x)选择适当的列df2, using tolower匹配大小写，并且cbind在一起。最后使用重命名列setNames and rbind结果列表。

subset(df, Conflict %in% c('WATER.START', 'WATER.STOP')) |>
  apply(MARGIN=1, \(x) {
    mt <- match(tolower(x[2]), tolower(names(df2)))
    cbind(t(x[1:2]), df2[df2$study_id == x[1], c(mt, mt + 1)]) |>
    setNames(c('study_id', 'Conflict', 'initial', 'verification'))
}) |> do.call(what=rbind)
#   study_id    Conflict initial verification
# 1        1 WATER.START       1            1
# 2        1  WATER.STOP      33           34
# 5        5  WATER.STOP       8            8

你也可以使用字典a（这可能会扩展到您可能正在使用的其他级别）。

a <- c(WATER.START='WATER.start', WATER.STOP='WATER.stop')

subset(df, Conflict %in% c('WATER.START', 'WATER.STOP')) |>
  apply(MARGIN=1, \(x) {
    mt <- match(a[match(x[2], names(a))], names(df2))
    cbind(t(x[1:2]), df2[df2$study_id == x[1], c(mt, mt + 1)]) |>
      setNames(c('study_id', 'Conflict', 'initial', 'verification'))
  }) |> do.call(what=rbind)
#   study_id    Conflict initial verification
# 1        1 WATER.START       1            1
# 2        1  WATER.STOP      33           34
# 5        5  WATER.STOP       8            8

However,我认为你真正需要的是reshape您的数据。

## basic
reshape(df2, direction='long', idvar=1, varying=list(c(2, 4), c(3, 5))) 
#     study_id time WATER.start WATER.truestart
# 1.1        1    1           1               1
# 2.1        2    1           1               1
# 3.1        3    1           2               2
# 4.1        4    1          NA              NA
# 5.1        5    1           6              25
# 1.2        1    2          33              34
# 2.2        2    2           3               4
# 3.2        3    2           2               2
# 4.2        4    2          NA              NA
# 5.2        5    2           8               8

## enhanced
reshape(df2, dir='long', idvar='study_id',
        varying=list(c("WATER.start", "WATER.stop"), c("WATER.truestart", "WATER.truestop")),
        timevar='foo', times=c('water.start', 'water.stop'), v.names=c('initial', 'verification')) 
#               study_id         foo initial verification
# 1.water.start        1 water.start       1            1
# 2.water.start        2 water.start       1            1
# 3.water.start        3 water.start       2            2
# 4.water.start        4 water.start      NA           NA
# 5.water.start        5 water.start       6           25
# 1.water.stop         1  water.stop      33           34
# 2.water.stop         2  water.stop       3            4
# 3.water.stop         3  water.stop       2            2
# 4.water.stop         4  water.stop      NA           NA
# 5.water.stop         5  water.stop       8            8

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

如果满足另一列中的条件，则将数据从一列复制到另一列的相关文章

在ggplot2中添加水平线到绘图和图例

这段代码创建了一个漂亮的图但我想在 y 50 处添加一条水平黑线并让图例显示一条黑线并在图例中显示文本 cutoff 但在图例中保留源点我可以使用 geom line 添加该行但无法在图例中获取该行 library ggplot2
用于检查和批量线性模型的数据表选项

我想知道是否有data table用于从数据集中批量处理线性模型并首先进行检查的选项我需要对每个唯一标识符运行一堆线性模型但首先我需要进行检查对于每个唯一的 id 和年份我需要检查是否有至少 24 个月的先前每月数据但不超过 60
如何按组计算日期之间的时间差

我有一个包含日期时间和位置的数据框我想计算组内记录与上一条记录根据日期排列之间的分钟差异并变异为新列我已经弄清楚如何使用循环来完成此操作但这仅适用于所有组位置而且我不确定如何按组执行此操作 fake data set fo
双精度数据类型和数值数据类型之间的区别

R编程中双精度数据类型和数值数据类型有什么区别 From stat ethz ch https stat ethz ch R manual R devel library base html double htm R 的浮点向量有两个名称
随着数据帧变大，如何防止 rbind() 变得非常慢？

我有一个只有 1 行的数据框为此我开始使用 rbind 添加行 df mydataframe with only one row for i in 1 20000 df lt rbind df newrow 随着我的成长这变得非常缓慢
以对数刻度绘制较长的 y 轴刻度，刻度向外

我之前有一篇关于在特定 y 轴值处绘制较长刻度的文章在特定 y 轴值处绘制较长的刻度 https stackoverflow com questions 51335424 plotting longer ticks at particul
如何重新格式化数据并映射它？

假设我有数据其中列名称是城市行名称是经度和纬度 Columbus Nashville Austin Washington D C London Manchester lon 82 99879 86 7816 97 74306 77 03
将鼠标悬停在 ggplot 上时更新 CSS 和渲染工具提示以错误的顺序发生

我在这里构建了一个虚拟应用程序它为 ggplot 生成悬停消息并确保它们保持在屏幕边界内我编写了一些计算来确定所需的 CSS 更正并将其发送到服务器它基于将悬停消息保留在此处的第一次尝试 SO问题 https stackoverfl
使用 data.table::fwrite() 写入 .txt 文件 — is.list(x) 不为 TRUE

我试图替换基本 R 函数write table with data table fwrite 加快写入速度但该函数抱怨说is list x is not TRUE 我提供的输入有什么问题fwrite 期望但是write table 默默
按组划分的模态值（最常见）的简明 R data.table 语法

用于查找每个 id 最常见类别的高效且优雅的 data table 语法是什么我保留一个指示 NA 位置的布尔向量用于其他目的 dt data table id rep 1 2 7 category c x y NA print dt
如何使用 R 获取所有 S&P500 公司代码列表？

我想在R中制作FOR语句来一次性分析股票数据但我不知道如何获得 S P 公司代码列表请让我知道解决方案谢谢 library rpart library rpart plot library quantmod startDate as
将最新的 R 安装路径从注册表添加到 PATH windows 7/8/10

嗨我是 Windows 批处理新手我想向打电话的同事分发一个 runMe bat 文件Rscript myRfile R处理一些数据文件但众所周知我的同事在不同地方安装了 R 我不能指望他们知道如何将 Rscript 添加到 PAT
求R中3列中每一行的最大值

我需要计算 3 列中每行的最大值一个表可以是 x c 1 2 3 4 5 y c 2 3 3 1 1 z c 4 3 2 1 1 df lt data frame x y z 我需要得到 x y z max 1 1 2 4 4 2 2 3
如何根据子字符串匹配选择 R data.table 行（类似于 SQL）

我有一个带有字符列的 data table 并且只想选择其中包含子字符串的行相当于SQLWHERE x LIKE substring E g gt Months data table Name month name Number 1 12
在 R 中调用“boot”时没有数据

我有一个包含很多列的数据框第一列包含系统 1 系统 2 等类别第二列包含代表 0 和 1 的数字请看下面例如 SYSTEM Q1 Q2 S1 0 1 S1 1 0 S2 1 1 S2 0 0 S2 1 1 我在 R 中有这段代码来
我们可以有更多错误（消息）吗？

在 R 中如果函数使用变量有没有办法弹出错误消息未在函数体内声明即我希望有人标记这种类型的函数 aha lt function p return p n 看如果某个地方碰巧有一个 n 变量 aha p 2 会给我一个答案因为
如何在R中绘制堆积柱形图？

有谁知道如何使用 R 绘制由超过 1 个变量堆叠的列的直方图就像excel中的堆积柱形图一样谢谢你我假设您确实想要一个条形图而不是直方图在这种情况下 barplot从标准图形或barchart格子包中的两者都可以做到或者使用
R 矩阵到犰狳的转换非常慢

观察对于中等大小的矩阵将矩阵从 R 传递到 C 的开销要慢得多arma mat类型比NumericMatrix类型大约需要 250 倍的时间这是一个最小的例子 include
R 中带有自定义字段类的参考类？

我想在另一个引用类中使用自定义引用类但此代码失败 nameClass lt setRefClass nameClass fields list first character last character methods list ini
使用 R 中的剪切函数对缺失值进行 NA 级别[重复]

这个问题在这里已经有答案了 R 中的 cut 函数省略了 NA 但我想要一个缺失值的级别这是我的 MWE set seed 12345 Y lt c rnorm n 50 mean 500 sd 1 NA Y1 lt cut log Y

随机推荐

选择要安装的包 - 安装按钮呈灰色

我正在尝试使用 sdk 管理器安装一组软件包但即使选择全部接受后安装按钮仍然呈灰色我可以看到一些文字说这个包依赖于缺少 SDK 平台 Android API 17 但不知道我需要做什么来安装缺少 SDK 平台 Androi
何时应在函数返回值上使用 std::move？ [复制]

这个问题在这里已经有答案了在这种情况下 struct Foo Foo meh return std move Foo 我很确定此举是不必要的因为新创建的Foo将是一个 x 值但在这样的情况下该怎么办呢 struct Foo Foo m
Guice 最佳实践和反模式

我不确定这个问题是否有价值但是是否有任何特定于的最佳实践和反模式谷歌指南 https github com google guice 请将任何通用 DI 模式定向至这个问题 https stackoverflow com q 168255
Javascript - XMLHttpRequest 如何同时发送多个请求？

我遇到了一个非常超自然的问题我正在尝试实现一个购物车其中我在客户端存储了 cookie 以识别已订购的商品 ID 及其数量当我加载结帐 HTML 页面时我会读取 cookie 并逐个获取项目 id 然后对于每个项目 id 我将向我
如何注册网络 python 包安装的入口点？

我有一个用户环境其中大多数 python 软件包都安装在网络共享上并可通过PYTHONPATH环境变量 Python本身仍然安装在本地其中一些软件包需要注册 setuptools切入点 http pythonhosted org se
git 子模块分支是否与主项目的分支一起切换？

最近我开始了解 git 子模块它们似乎是自给自足的项目拥有自己的 git 结构和分支当我切换主项目的分支时这是否也会切换子模块的分支 git 如何处理这种情况我最近遇到类似的问题 https stackoverflow com a
使用 Javascript 关闭 iPhone 视频播放器

我有一个带有多个 html5 标签的网页为用户提供了许多他们可以选择播放的视频的海报缩略图当用户触摸其中一个时 iPhone 视频播放器就会打开并播放视频我希望能够在视频播放完毕后自动关闭视频播放器并将用户返回到缩略图我已经为结
为什么使用 Url.Content 来引用资源？

在我遇到的几乎每个 ASP NET MVC 示例中我总是看到网址内容用于引用 CSS JavaScript 和图像没有人解释过为什么要使用它有谁愿意解释一下吗这样做有什么不好 img src Content Img MyImage
无法将 iOS 自定义框架添加到 KMM（Kotlin 多平台）模块（未找到 cinteropXXXIosArm64 FAILED 模块）

我正在开发一个 iOS 应用程序它使用 Kotlin Native 共享模块这个Kotlin Native共享模块利用了自主开发的iOS框架这在过去非常有效但现在我正在尝试将我的项目升级为最新版本的 Kotlin Native 此
React，webpack：避免导入语句中的“..”

我目前正在学习 React 因此正在学习 es6 es7 和 webpack 来自主要Python背景的我对导入语句的文件夹敏感路径声明感到恼火即使用在进口声明中这意味着如果我将文件移动到不同的目录我需要更改文件中声明的导入语句 P
c 开关和跳转表

据我了解 c c 中的 switch 语句有时会编译为跳转表我的问题是有什么经验法则可以保证这一点吗就我而言我正在做这样的事情 enum myenum MY CASE0 0 MY CASE0 1 switch foo case MY
jQuery 获取特定选项标签文本

好吧假设我有这个
在 Firebase 中对类似聊天的应用程序进行建模

我有一个 Firebase 数据库结构问题我的场景接近于聊天应用程序以下是具体细节 users node storing several users of the app id1 name John id2 name Meg id2 n
Java ZonedDateTime 到 Instant 转换

我计划按照以下逻辑将 ZonedDateTime 转换为即时时间假设我处于 PST 时区当前时间是上午 11 点如果我现在转换从今天 2018 年 3 月 4 日起没有夏令时 toInstant 将为晚上 7 点由于遵守夏令时自
如何使用多处理实现发布/订阅模式？

有什么办法可以使用发布订阅模式multiprocessing数据结构换句话说我想要类似队列的东西只不过发布者可以同时向多个工作人员发送单个命令您可以创建自己的数据结构以使用包装器来实现简单的发布订阅模式multiprocess
用于在大写字母前添加下划线的正则表达式

如何在字符串中的大写字母前添加下划线第一个字母除外 1 VarLengthMean VarWidthMean 我希望它变成 1 Var Length Mean Var Width Mean 我考虑过使用str replace all fr
如何使用Java通过Selenium WebDriver按Ctrl+A选择页面中的所有内容

I want to select all content by pressing Ctrl a from keyboard by using WebDriver with Java I wrote the following code Ac
django中基于表单输入和字符串操作的查询

Django 表单中的字段 https stackoverflow com questions 50841850 django fields in form 50845891 50845891 正如问题 4 中所述我需要获取表单输入并计算
解决使用 OOP 时的过程混乱

我正在用 Fortran 语言编写向量类型但我感到非常困惑假设我有以下派生类型 Type Vector Real x y Contains Procedure vector smul End Type Function vector s
如果满足另一列中的条件，则将数据从一列复制到另一列

我正在尝试创建一个标题为 Study id Conflict 的表并创建第三列和第四列其中包含与列中的值相对应的数据 Conflict 下面的代码实现了这个目的然而它相当长特别是因为我希望将其扩展以涵盖列中的数百个不同值冲突预先

如果满足另一列中的条件，则将数据从一列复制到另一列

如果满足另一列中的条件，则将数据从一列复制到另一列 的相关文章

随机推荐

热门标签

如果满足另一列中的条件，则将数据从一列复制到另一列的相关文章