使用 dplyr 计算变量变化的更简单方法？

2024-04-09

我试图找到一种更简单的方法来计算数据框中变量（由列表示）的变化，使用dplyr。我的玩具数据集是这样的

structure(list(CAR = structure(c(1L, 2L, 3L, 4L, 5L, 6L, 1L, 
2L, 3L, 4L, 5L, 6L, 1L, 2L, 3L, 4L, 5L, 6L), .Label = c("a", 
"b", "c", "d", "e", "f"), class = "factor"), TIME = c(0L, 0L, 
0L, 0L, 0L, 0L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L
), VAR = c(20L, 30L, 40L, 50L, 60L, 70L, 30L, 40L, 50L, 60L, 
70L, 80L, 40L, 50L, 60L, 70L, 80L, 90L)), .Names = c("CAR", "TIME", 
"VAR"), class = "data.frame", row.names = c(NA, -18L))

看起来像

   CAR TIME VAR
1    a    0  20
2    b    0  30
3    c    0  40
4    d    0  50
5    e    0  60
6    f    0  70
7    a    1  30
8    b    1  40
9    c    1  50
10   d    1  60
11   e    1  70
12   f    1  80
13   a    2  40
14   b    2  50
15   c    2  60
16   d    2  70
17   e    2  80
18   f    2  90

我正在尝试计算变化VAR之间TIME等于0以及其他时间，例如1,2对于每个CAR.

这就是我所做的，这似乎是一种非常复杂的方式，首先我得到的值VAR at TIME等于0

library(dplyr)
X <- local_test %>% filter(TIME == 0)  %>% group_by(CAR)  %>% mutate(baseline_VAR = VAR)

X好像

Source: local data frame [6 x 4]
Groups: CAR

  CAR TIME VAR baseline_VAR
1   a    0  20           20
2   b    0  30           30
3   c    0  40           40
4   d    0  50           50
5   e    0  60           60
6   f    0  70           70

然后，我做了一个left_join与原始数据框local_test

Y  <- left_join(local_test, X, by = c("CAR"))

Y好像

   CAR TIME.x VAR.x TIME.y VAR.y baseline_VAR
1    a      0    20      0    20           20
2    b      0    30      0    30           30
3    c      0    40      0    40           40
4    d      0    50      0    50           50
5    e      0    60      0    60           60
6    f      0    70      0    70           70
7    a      1    30      0    20           20
8    b      1    40      0    30           30
9    c      1    50      0    40           40
10   d      1    60      0    50           50
11   e      1    70      0    60           60
12   f      1    80      0    70           70
13   a      2    40      0    20           20
14   b      2    50      0    30           30
15   c      2    60      0    40           40
16   d      2    70      0    50           50
17   e      2    80      0    60           60
18   f      2    90      0    70           70

最后，我添加一列Y，计算出的变化VAR两个不同之间TIME for CAR

Y %>% group_by(CAR) %>% mutate(change_VAR = VAR.x - baseline_VAR)

Final Y好像

Source: local data frame [18 x 7]
Groups: CAR

   CAR TIME.x VAR.x TIME.y VAR.y baseline_VAR change_VAR
1    a      0    20      0    20           20          0
2    b      0    30      0    30           30          0
3    c      0    40      0    40           40          0
4    d      0    50      0    50           50          0
5    e      0    60      0    60           60          0
6    f      0    70      0    70           70          0
7    a      1    30      0    20           20         10
8    b      1    40      0    30           30         10
9    c      1    50      0    40           40         10
10   d      1    60      0    50           50         10
11   e      1    70      0    60           60         10
12   f      1    80      0    70           70         10
13   a      2    40      0    20           20         20
14   b      2    50      0    30           30         20
15   c      2    60      0    40           40         20
16   d      2    70      0    50           50         20
17   e      2    80      0    60           60         20
18   f      2    90      0    70           70         20

这似乎需要做很多额外的工作，需要将额外的列添加到原始数据框中。我需要对一个大数据框重复执行此操作。有没有一种更简单（一步）的计算方法change_VAR?

Thanks!

这可以通过将“VAR”与min按“CAR”分组的“VAR”。

local_test %>%
     group_by(CAR) %>%
     mutate(change_VAR= VAR- min(VAR))

或者，如果“VAR”的基值是“TIME”为 0 时（假设每个组没有重复的“TIME”），我们将“VAR”子集化为 TIME 0 并得到差值。

local_test %>% 
      group_by(CAR) %>%
      mutate(change_VAR= VAR- VAR[TIME==0])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

使用 dplyr 计算变量变化的更简单方法？的相关文章

rpart是自动剪枝吗？

Is rpart自动修剪生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多否但拟合函数的默认值可能会提前停止分割对于早期的某些定义 See rpart control对于您可
如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
在 Shiny 中叠加两个 ggplot

我有一个非常大的数据集我正在使用 ggplot 在 Shiny 上绘制它我有一个与 x 轴上的值相关联的滑块我想用它对选定的数据子集重新着色并让其余数据保持原样最简单的选择是重新创建整个绘图但由于它是一个大型数据集因此这是一个
使用 readHTMLTable 从 https 网页读取表格

我安装了 R 3 3 1 并使用 RStudio 0 99 903 我正在尝试从以下 URL 将表格读入 R https www fantasypros com nfl rankings consensus cheatsheets php
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
使用自定义渐变填充直方图箱

我想在 R 和 ggplot2 中创建一个直方图其中根据连续的 x 值填充箱大多数教程仅通过离散值或密度计数进行着色下列的这个例子 https stackoverflow com questions 40284227 how to
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
如何使用autoconf重新生成配置文件？

我使用 autoconf 重新生成配置文件它有效但是当我执行生成的配置文件时 configure 有一些错误消息例如 configure line 3713 syntax error near unexpected token bla
根据 R 数据框中的名称对列进行平均

我想知道是否有一种有效的方法来获取每组的平均值类似命名的列谁的名字结尾为 1S and 2S ex ex1S ex2S at time 1并取每组的平均值类似命名的列谁的名字结尾为 1C or 2C ex ex1C ex2C at time
空间数据xyz到矩阵

我有一个大数据框 100 000 行其中包含 LON LAT VALUE 我想将其转换为矩阵 EPSG 中的坐标 3035 我使用以下命令尝试了 reshape2 包 acast df lon lat value var value 效果
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
通过 r markdown 中的循环创建代码片段

如同如何使用R中的knitr创建一个包含代码块和文本的循环 https stackoverflow com questions 36373630 how to create a loop that includes both a code
R 多元一步预测和准确性

我想使用 R 来比较两个预测模型的 RMSE 均方根误差第一个模型使用 1966 年至 2000 年的估计值来预测 2001 年然后使用 1966 年至 2001 年的估计值来预测 2002 年依此类推直至 2015 年第二个模型使
更改 pander 中的默认对齐方式 (pandoc.table)

我目前正在切换到pander对于我的大部分时间knitr markdown格式化因为它提供了如此出色的pandoc支持我不太满意的一件事是默认的居中对齐营销人员可能会喜欢它但对于技术报告来说这是一个可怕的事情使用的最佳选择Hmis
使用 ggplot 构面时增加闪亮的绘图大小

有没有办法增加绘图窗口的大小shiny取决于在一个中使用的面的数量ggplot图也许使用垂直滚动例如使用下面的示例当输入为 A 有三个方面情节看起来不错当选项 B 选择绘图数量会增加但绘图窗口保持相同大小导致绘图太小是否有
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
在 igraph 中为社区分配颜色

我在 igraph 中使用 fastgreedy community 检测算法在 R 中生成社区代码返回 12 个社区但是在绘图时很难识别它们因为它返回的图的颜色数量有限我怎样才能用十二种不同的颜色绘制这个图表 l2 lt layo
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred

随机推荐

Python - 如果某个键不在一个列表中，则追加到另一个列表中

这可能是一个相当简单的问题但我还没有完全弄清楚我有两个元组列表 List A a 0 033 b 0 030 c 0 020 d 0 010 e 0 005 List B a 0 057 b 0 065 w 0 060 x 0 040
视图绑定 - 如何获取包含的布局的绑定？

在使用视图绑定时我遇到了一些未记录的案例第一如何获得包含的视图布局部分的绑定主绑定只能看到主布局中定义的项目第二如何获得合并布局部分的绑定同样主绑定只能看到主布局中的项目的情况下包含通用布局不是合并节点我们需要为包含
使用 Java 从数据库读取 UDT 的最佳方法是什么？

我以为我了解有关 UDT 和 JDBC 的一切直到有人SO http stackoverflow com指出了Javadoc的一些细节java sql SQLInput http download oracle com javase 6
查询根目录下的文件和文件夹列表

我想获取根目录中的文件和文件夹列表而不必对所有文件进行排序是否有一个查询可以做到这一点根文件夹也可以使用名为 root 的特殊别名来寻址因此您可以使用以下查询获取根文件夹中的所有文件和文件夹 https www googleapis
如何连接到 Docker Toolbox 中托管的容器？

我尝试在 Docker 容器中运行 ASP NET Core 1 1 Web API 但无法从浏览器或curl 为了进行故障排除我还启动了标准 nginx 和 Apache httpd 容器但也无法连接到这些容器因此我相信这是 Doc
连接消除在 Oracle 中不适用于子查询

我能够让连接消除适用于简单的情况例如一对一关系但不适用于稍微复杂的情况最终我想尝试锚点建模但首先我需要找到解决这个问题的方法我正在使用 Oracle 12c 企业版版本 12 1 0 2 0 我的测试用例的 DDL drop vi
如何在android中制作自定义textview？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在开发布局我为此布局开发了可绘制对象但是在此视图中文本未调整任何人告诉我有关库的信息请提供其
如何在 Mojolicious 应用程序中从命令行获取凭据？

我正在开发一个 Mojolcious 独立应用程序在代码中我正在联系内部后端用户应在其中提供一些凭据目前我正在代码中使用凭据作为变量它看起来有点像 password somthing 我尝试使用配置插件在那里存储凭据但是 Moj
查找 R 中 data.table 中多次出现的值对

我有一个data table in R gt head d COUNT SAMPLE junction 1 1 R1 tup 2 1 R1 tup 3 1 R1 tai 4 1 R2 milt 5 2 R3 Bsg25D 6 1 R4 tu
动态链接在应用程序关闭时不起作用，仅在后台运行时

我一直致力于在我的应用程序中包含动态链接我已经对其进行了设置以便可以正确生成并正确接收链接但它们仅在应用程序打开并在后台运行时才有效如果应用程序完全关闭该链接将仅打开该应用程序即使我在 didFinishLaunchingWit
用于测量 GC 活动的 V8 垃圾收集器回调

我有一个关于V8的小问题6 7 240GC 行为和AddGCPrologueCallback AddGCEpilogueCallback回调问题背后的一个小故事我们使用 V8 引擎启动自定义 JS 代码为了限制执行时间我们有一个wa
键入错误“模块的默认导出具有或正在使用私有名称” - 从 typescript v1.8 切换到 2

我已将我的 ionic 应用程序从 beta 11 更新到 rc0 所以这意味着我已经从 Angular2 RC4 切换到 Angular2 stable 从 TypeScript 1 8 切换到 2 我有一个 redux 架构并且正在使用
安卓上的UID是什么？

安卓上的UID是什么它是特定用户的 ID 还是特定应用程序的 ID If you re referring to this UID http developer android com reference android os Proce
在 Visual Studio 中链接到 C++（32 位）中未修饰的 DLL 名称时遇到问题

我有一个 C DSP 函数库我想在运行时动态链接到它们我正在使用PDLL h https github com yielding code blob master sys programming win32 DLLdynamic PDl
HTTP2 请求示例因 Jmeter4、Java 10 无客户端 ALPNProcessors 崩溃

我无法使用 Jmeter 4 0 创建 HTTP2 请求我已经安装了最新的 JDK 和 HTTP 2 协议采样器插件我还观察到 penJDK8ClientALPNProcessor e23ec5a 不适用于 java 10 0 2 尝试
有没有办法用 PyCharm 捕获单元测试异常？

python unittest 运行程序处理所有异常我想用我的调试器捕获它们有没有办法让我的单元测试运行程序重新引发测试异常以终止进程我想亲自处理它们 Edit 找到解决办法了您可以创建一个unittest TestSuite并调用
网络中的端口是什么？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在学习java网络我不清楚什么
选择输入字段中的文本，但无法编辑

我有一个简单的文本输入字段
如何从 Javascript 数组中完全删除一个对象？

我一直在使用以下代码 formData objectiveDetails push emptyObjectiveDetail 这会将一个新的空ObjectiveDetail对象推送到名为objectiveDetails的数组的末尾例如如
使用 dplyr 计算变量变化的更简单方法？

我试图找到一种更简单的方法来计算数据框中变量由列表示的变化使用dplyr 我的玩具数据集是这样的 structure list CAR structure c 1L 2L 3L 4L 5L 6L 1L 2L 3L 4L 5L 6L 1

使用 dplyr 计算变量变化的更简单方法？

使用 dplyr 计算变量变化的更简单方法？ 的相关文章

随机推荐

热门标签

使用 dplyr 计算变量变化的更简单方法？的相关文章