组对组划分

2024-03-13

数据集：

  date     bal      
1/31/2013  10   
1/31/2013  11  
1/31/2013  12  
1/31/2013  13   
1/31/2013  14 
2/28/2013  20   
2/28/2013  30  
2/28/2013  40  
2/28/2013  50   
2/28/2013  60    
3/30/2013  10  
3/30/2013  11     
3/30/2013  12   
3/30/2013  13    
3/30/2013  15

使用的代码：

bb <- read.csv("abc.csv", stringsAsFactors=T, header=T)
bb
library(dplyr)

new_data <- bb %>% 
   mutate(D = (bal) / lag(bal[1:5])) %>%
   data.frame()
new_data

我们划分第 2 组（日期 - 2013 年 2 月 28 日的第二行 = 30）/（第 1 组 - 2013 年 1 月 31 日的第一行 = 10）即：30 / 10 = 3.000、40/11 = 3.63、50/12 = 4.16 等等。

从上面的代码得到的输出：

     date     bal        D
1   1/31/2013  10       NA
2   1/31/2013  11 1.100000
3   1/31/2013  12 1.090909
4   1/31/2013  13 1.083333
5   1/31/2013  14 1.076923
6   2/28/2013  20       NA
7   2/28/2013  30 3.000000
8   2/28/2013  40 3.636364
9   2/28/2013  50 4.166667
10  2/28/2013  60 4.615385
11  3/30/2013  10       NA
12  3/30/2013  11 1.100000
13  3/30/2013  12 1.090909
14  3/30/2013  13 1.083333
15  3/30/2013  15 1.153846

现在这里的问题是：

第一组保留为参考 = 除数，即 10, 11,12,13 这意味着以下所有日期组（bal）都将除以第一个参考组。

我们希望每次除数应按下一组日期递增，并与下面的组（股息）相同，依此类推。

     date     bal        D           
1   1/31/2013  10       NA         
2   1/31/2013  11       NA
3   1/31/2013  12       NA  
4   1/31/2013  13       NA 
5   1/31/2013  14       NA
6   2/28/2013  20       NA
7   2/28/2013  30 3.000000       - 30 / 10 = 3
8   2/28/2013  40 3.636364       - 40 / 11 = 3.63  
9   2/28/2013  50 4.166667       - 50 / 12 = 4.16
10  2/28/2013  60 4.615385       - 60 / 13 = 4.61
11  3/30/2013  10       NA          NA
12  3/30/2013  11 1.100000       - 11 / 20 = 0.55 
13  3/30/2013  12 1.090909       - 12 / 30 = 0.4
14  3/30/2013  13 1.083333       - 13 / 40 = 0.325 
15  3/30/2013  15 1.153846       - 15 / 50 = 0.3

我期待上面的输出。

DF %>%
  group_by(g1=seq_along(bal) %% 5) %>%
  mutate(denominator=lag(bal)) %>%
  ungroup() %>%
  group_by(g2=(seq_along(bal) - 1) %/% 5) %>%
  mutate(denominator=lag(denominator),
         D=bal / denominator) %>%
  ungroup()

# # A tibble: 15 x 6
#         date   bal    g1 denominator    g2        D
#       <fctr> <int> <dbl>       <int> <dbl>    <dbl>
#  1 1/31/2013    10     1          NA     0       NA
#  2 1/31/2013    11     2          NA     0       NA
#  3 1/31/2013    12     3          NA     0       NA
#  4 1/31/2013    13     4          NA     0       NA
#  5 1/31/2013    14     0          NA     0       NA
#  6 2/28/2013    20     1          NA     1       NA
#  7 2/28/2013    30     2          10     1 3.000000
#  8 2/28/2013    40     3          11     1 3.636364
#  9 2/28/2013    50     4          12     1 4.166667
# 10 2/28/2013    60     0          13     1 4.615385
# 11 3/30/2013    10     1          NA     2       NA
# 12 3/30/2013    11     2          20     2 0.550000
# 13 3/30/2013    12     3          30     2 0.400000
# 14 3/30/2013    13     4          40     2 0.325000
# 15 3/30/2013    15     0          50     2 0.300000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

组对组划分的相关文章

如何在 R 中压缩多个 CSV 文件？

我正在尝试在 R 中压缩多个 CSV 文件下面是供参考的代码 Create two dataframes using inbuilt datasets for reproducible code df1 lt head mtcars df
将“dplyr::across”与具有多个参数的函数一起使用

我想知道是否有办法使用dplyr across一个需要多个参数的函数如果没有如何执行以下操作dplyr tidyverse library dplyr create a dataframe df lt structure list x1
将时间值转换为数字，同时保留时间特征

我有一个数据集其中包含不同事件发生的间隔时间我想要做的是将数据转换为数字向量以便更容易操作和运行摘要制作图表等同时保持其时间特征这是我的数据片段 data lt c 03 31 12 17 16 29 09 52 04 01 0
如何将曲线拟合到直方图

我已经探讨了有关该主题的类似问题但在我的直方图上生成漂亮的曲线时遇到了一些麻烦我知道有些人可能会认为这是重复的但我目前还没有找到任何可以帮助解决我的问题的东西尽管数据在此处不可见但这里是我使用的一些变量以便您可以在下面的代码中看
通过 R 连接到 Azure SQL

下面的代码允许我通过 R 连接到 Azure SQL 服务器但是我只能访问主数据库而不能访问我在下面创建的两个数据库表格显示为空白有什么想法吗谢谢 library RODBC library dplyr library DB
模糊匹配两个字符串 ur r

我有两个向量每个向量都包含一系列字符串例如 V1 c pen document folder warn V2 c pens copy folder warning 我需要找出哪两个最匹配我直接使用编辑距离但这还不够好就我而言钢笔
移动 sf 对象的经度

我有一张国家地图 sf 对象我想改变俄罗斯东部的经度以便它不与俄罗斯其他地区隔离看图片 https i stack imgur com NBjyK jpg 我找到了后端代码st shift longitude https github
如何根据一个值过滤远程表？

我正在做一个filter using in 但 dplyr 翻译查询的方式似乎不正确事实上 in 运算符对于多个值可以正常工作但当仅存在单个元素时则不行在我最初的场景中过滤值是动态的因此我希望有一个在这两种情况下都有效的函数 my
使用Shiny和Shinydashboard时如何使图标大小一致？

我在闪亮的应用程序中添加可点击的图标以显示弹出信息框请参阅以下屏幕截图和代码示例我的策略是将我的文本和代码包装起来actionLink in the HTML功能这效果很好然而图标的大小是由关联的大小决定的我想知道是否可以使所有
替换 R 中内置函数的定义？

sparcl 包使用标准 stat 包中的 kmeans 函数我想让它使用我自己的 kmeans 实现一种方法是编辑 sparcl 包本身中的代码我宁愿避免这种情况因为它会很混乱而且我不确定如何在 R 中安装编辑过的代码不幸的是
按列名称索引拆分数据框

这是先前问题的变体 df lt data frame matrix rnorm 9 9 ncol 9 names df lt c c 1 d 1 e 1 a p b p c p 1 o1 2 o1 3 o1 我想按下划线后面的column
错误消息：fn(x, ...) 中的错误：已过时的 VtV 不是正定的

我正在尝试使用 lmer 函数创建一个最小足够模型我的模型已配对尺寸尝试状态随机因素 as logical Mated as numeric Size as factor Attempts as factor Status 这些都
检查远程错误时出错 (val)：5 个节点产生错误：未找到对象

我尝试使用并行处理 parLapply 进行 10 倍交叉验证并估计联合模型的模型性能我试图找出为什么我收到错误消息 checkForRemoteErrors val 中的错误五个节点产生错误未找到对象 Week 代码如下 Valid
重塑错误 - 无效的“row.names”长度

我有以下数据库宽格式 st all 其中有两个我希望重塑的变量 P 和 PLC 主题的 ID 是 g id g id study condition sample PLC1 PLC2 PLC3 PLC4 PLC5 PLC6 PLC7 PL
dplyr 中每组的 cumsum

我开始享受dplyr但我陷入了一个用例我希望能够申请cumsum数据框中的每个组与包但我似乎无法正确处理对于演示数据框我生成了以下数据 set seed 123 len 10 dates as Date 2014 01 01 1 l
RStudio 服务器未启动

过去几个月我一直在远程 RStudio 服务器上工作没有任何问题今天我使用此命令重新启动了 rstudio 服务器 sudo rstudio server restart 此后我无法通过浏览器访问服务器它继续等待我用这个检查了状
如何在变成因子的变量中保留原始值？

这是一些工作代码来说明我的问题 Categorical variable recorded as numeric integer df1 lt data frame group c 1 2 3 9 3 2 9 1 9 3 2 我有一个分类变
条件格式 DT 中的样式

我想根据 B 列中的值对 A 列中的行进行着色下面的代码基于小插图中的示例Link https rstudio github io DT 010 style html 但仅显示两列的条件 mobile number by mobile f
OpenBUGS：伯努利分布中缺失值

我正在尝试通过 R R2OpenBUGS 使用 OpenBUGS 将观察时间建模为随机变量如果所有观察时间都可用没有 NA 则一切正常但如果我将其中一个时间设置为 NA 则什么也不会发生我使用 WinBUGS 测试了相同的代码
泛化 R %in% 运算符以匹配元组

前几天我花了一段时间寻找一种方法来检查行向量是否包含在 R 中的某些行向量集中基本上我想概括 in 运算符来匹配元组而不是向量中的每个条目例如我想要 row vec c A 3 row vec 1 A 3 data set rbin

随机推荐

检查 Oracle 数据库有多少年了？

因此我们有一个生产数据库的经过处理的版本的镜像无论如何您知道是否可以查明数据库的年龄即当数据库放置在 Oracle 服务器上时谢谢你的帮助选择从 dba users 创建其中用户名 SYS 在我的网站上有 16 秒的差异从
如何在Spark 1.6集群上运行用Spark 2.1组装的Spark应用程序？

有人告诉我我可以使用 Spark 的一个版本构建 Spark 应用程序只要我使用sbt assembly为了构建它我可以在任何 Spark 集群上使用 Spark Submit 运行它因此我使用 Spark 2 1 1 构建了简单
为什么 Base64.decode 为不同的字符串生成相同的字节数组？

我使用 URL 安全 Base64 编码来对随机生成的字节数组进行编码但我在解码时遇到问题当我解码两个不同的字符串除了最后一个字符之外的所有字符都是相同的时它会生成相同的字节数组例如对于两者 dGVzdCBzdHJpbmr a
C# 3.0 自动属性 - 是否可以添加自定义行为？

我想知道是否有任何方法可以将自定义行为添加到自动属性获取设置方法中我能想到的一个明显的例子是希望每个设置属性方法都可以调用任何PropertyChanged事件处理程序作为System ComponentModel INotifyPro
用户在 Python 中输入后出现“NameError：name ''未定义”[重复]

这个问题在这里已经有答案了我完全不明白为什么这不起作用应该可以精确地工作对吗 UserName input Please enter your name print Hello Mr UserName raw input
设置限制的 PayloadTooLargeError

您好我在 Express js 方面遇到问题我需要将 base64 文件发送到 node js 我的 configuraizone 如下所示但是当我发送文件时出现此错误 PayloadTooLargeError 请求实体太大我读过
现有命名空间类型的使用声明与创建类型别名

这不是关于两者之间差异的问题using and typedef用于创建类型别名我想提供从代码块或函数内的命名空间对现有类型的访问我发现了两种不同的方法我可以使用 using 声明包含该类型 using typename mynam
如何使用 angular.js 在 DOM 中移动视图？

如何使用 Angular JS 将元素移动到 DOM 中的不同位置我有一个像这样的元素列表 ul li div content div li li div content div li li div content div li li d
不带 http://www 的 url 正则表达式 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我需要一个 url 正则表达式来验证
同时进行语音转文本和文本转语音

介绍我正在开发一个应用程序我需要在其中使用 Booth SpeechRecognizer 和 TTS 但我在尝试这个时遇到了一些问题主要的一个问题是如果我初始化 TTS SpeechRecgonizer 似乎无法工作而如果我禁用
PHP 在 foreach 循环中包含文件

我这样做可以吗 foreach item as val include external script php 外部脚本大约有 800 行代码出于组织原因我希望将其分开亲切我想你最好为此使用一个函数包含文件需要读取解析和解释该文
React 将导入名称作为 prop 传递并添加到图像 src

我有一个反应组件它有一个带有包含图像路径的导入名称的道具在这种情况下道具值为Ico1 我需要像这样在 img src 中传递 prop 代码如下 import React from react import Ico1 from ico
双精度接受逗号而不是点

我无法从 bash 终端在程序中输入双精度值下面是我用来弄清楚为什么会发生这种情况的代码这是我的测试代码 import java util public class DoubleTest public static void main
django：从 django 模板调用重写的模型方法

我已经超越了被覆盖 the get FOO display django模型类的方法参见 doc参考 https docs djangoproject com en 1 10 ref models instances django db
哪些 int 值与 C 中的 exit() 相关？

On 教程点 com http www tutorialspoint com c standard library c function exit htm 退出时传递值0 而人们经常通过它1 我什至见过exit 3 不同的值意味着什么唯一
Nuget - 对子文件夹中的内容设置 CopyToOutputDirectory

我是 Nuget 新手我正在尝试上传我的第一个包到目前为止一切都很顺利但是我尝试在一些我想要存放在 Lib 子文件夹中的内容文件上设置 CopyToOutputDirectory 我的目录如下所示 Readme txt MyPac
为什么 initContainer `istio-init` 中的 iptables 规则设置在应用程序容器中有效？

我正在阅读的文档istio https istio io latest blog 2019 data plane setup 它说 istio init 这个 init 容器用于设置 iptables 规则以便入站出站流量将通过 sid
C# 为什么使用静态类？ [复制]

这个问题在这里已经有答案了可能的重复何时在 C 中使用静态类 https stackoverflow com questions 241339 when to use static classes in c sharp 我经常将我的类设
如何将具有前端 SPA 的 Azure CDN 和具有 .Net Core WebApi 的 Azure WebApp 配置到同一自定义域？

我想拥有https example com https example com作为我设置的 Azure CDN 的自定义域并且https example com api https example com api作为其余 api 端点来捕
组对组划分

数据集 date bal 1 31 2013 10 1 31 2013 11 1 31 2013 12 1 31 2013 13 1 31 2013 14 2 28 2013 20 2 28 2013 30 2 28 2013 40 2 2

组对组划分

组对组划分 的相关文章

随机推荐

热门标签

组对组划分的相关文章