带条件的累积平均值

2023-12-28

我的 df 的小代表：

PTS_TeamHome <- c(101,87,94,110,95)
PTS_TeamAway <- c(95,89,105,111,121)
TeamHome <- c("LAL", "HOU", "SAS", "MIA", "LAL")
TeamAway <- c("IND", "LAL", "LAL", "HOU", "NOP")
df <- data.frame(cbind(TeamHome, TeamAway,PTS_TeamHome,PTS_TeamAway))
df

TeamHome TeamAway PTS_TeamHome PTS_TeamAway
  LAL      IND          101           95
  HOU      LAL           87           89
  SAS      LAL           94          105
  MIA      HOU          110          111
  LAL      NOP           95          121

想象一下，这是一个赛季 1230 场比赛的前四场比赛。我想计算主队和客队在任何给定时间每场比赛的累积积分（平均值）。

输出如下所示：

  TeamHome TeamAway PTS_TeamHome PTS_TeamAway HOMETEAM_AVGCUMPTS ROADTEAM_AVGCUMPTS
1  LAL      IND          101           95                101                 95
2  HOU      LAL           87           89                 87                 95
3  SAS      LAL           94          105                 94              98.33
4  MIA      HOU          110          111                110                 99
5  LAL      NOP           95          121               97.5                121

请注意该公式对主队第五场比赛的作用。由于 LAL 是主队，因此会查看 LAL 在主场或客场比赛时得分多少。在这种情况下 (101 + 89 + 105 + 95) / 4 = 97.5

这是我尝试过但没有取得多大成功的方法：

lst <- list()
for(i in 1:nrow(df)) lst[[i]] <- ( cumsum(df[which(df$TEAM1[1:i]==df$TEAM1[i]),df$PTS_TeamAway,0]) 
                                 + cumsum(df[which(df$TEAM2[1:i]==df$TEAM1[i]),df$PTS_TeamHome,0]) ) 
                             / #divided by number of games
  df$HOMETEAM_AVGCUMPTS <- unlist(lst)

我想计算累积 PTS，然后用游戏数量来除以它，但这些都不起作用。

我认为你应该重组你的数据更整齐的格式 https://cran.r-project.org/web/packages/tidyr/vignettes/tidy-data.html每场比赛有两排：客队一排，主队一排。处理整齐/长格式的数据要容易得多。

library(dplyr)
library(tidyr)

df %>%
  mutate(game = row_number()) %>%
  gather(location, team, TeamHome, TeamAway) %>%
  gather(location2, points, PTS_TeamHome, PTS_TeamAway) %>%
  filter(
    (location == "TeamHome" & location2 == "PTS_TeamHome") | 
      (location == "TeamAway" & location2 == "PTS_TeamAway")
  ) %>%
  select(-location2) %>%
  arrange(game) %>%
  group_by(team) %>%
  mutate(run_mean_points = cummean(points))

data

# note that cbind() is removed.

df <- data.frame(TeamHome, TeamAway,PTS_TeamHome,PTS_TeamAway, stringsAsFactors = FALSE)

Source: local data frame [10 x 5]
Groups: team

   game location team points run_mean_points
1     1 TeamHome  LAL    101       101.00000
2     1 TeamAway  IND     95        95.00000
3     2 TeamHome  HOU     87        87.00000
4     2 TeamAway  LAL     89        95.00000
5     3 TeamHome  SAS     94        94.00000
6     3 TeamAway  LAL    105        98.33333
7     4 TeamHome  MIA    110       110.00000
8     4 TeamAway  HOU    111        99.00000
9     5 TeamHome  LAL     95        97.50000
10    5 TeamAway  NOP    121       121.00000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

mean

sumifs

cumulativesum

带条件的累积平均值的相关文章

回归时如何设置系数值；右

我正在寻找一种指定预测变量值的方法当我使用当前数据运行 glm 时其中一个变量的系数接近 1 我想将其设置为 0 8 我知道这会给我一个较低的 R 2 值但我先验地知道模型的预测能力会更大 glm 的权重组件看起来很有希望但我还没有
在 Shiny 中叠加两个 ggplot

我有一个非常大的数据集我正在使用 ggplot 在 Shiny 上绘制它我有一个与 x 轴上的值相关联的滑块我想用它对选定的数据子集重新着色并让其余数据保持原样最简单的选择是重新创建整个绘图但由于它是一个大型数据集因此这是一个
聚合日期时间以总结在特定条件下花费的时间

我很困惑我应该如何继续我下面有一些虚拟数据 Date lt as POSIXct c 2018 03 20 11 52 25 2018 03 22 12 01 44 2018 03 20 12 05 25 2018 03 20 12 10
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
如何有效地将多个光栅 (.tif) 文件导入 R

我是 R 新手尤其是在空间数据方面我正在尝试找到一种方法来有效地将多个 600 单波段栅格 tif 文件导入到 R 中所有文件都存储在同一文件夹中不确定这是否重要但请注意在我的 Mac 和 Windows 并行 VM 上的文件夹
dplyr 中的标准评估：全局环境中的函数出现“无法找到函数”错误

我试图在 dplyr 中对全局环境中的函数使用标准评估但出现无法找到函数错误这是一些代码 create data frame df lt data frame x rnorm 10 y rnorm 10 define arbitra
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
如果条目出现次数少于 x 则删除数据框中的行

我有以下数据框称之为 df 它是由三个向量组成的数据框姓名年龄和邮政编码 df Name Age ZipCode 1 Joe 16 60559 2 Jim 20 60637 3 Bob 64 94127 4 Joe 23 9412
通过 R 中的数据子集执行计算

我想对数据框的 PERMNO 列中的每个公司编号进行计算其摘要可以在此处查看 gt summary companydataRETS PERMNO RET Min 10000 Min 0 971698 1st Qu 32716 1st Qu
按不规则时间间隔对数据进行分组求和（R语言）

我正在看这里的 stackoverflow 帖子 R 计算一组内的观察次数 https stackoverflow com questions 65366412 r count number of observations within a
如何绘制每条线之间具有特定距离的图形

实际上我尝试绘制一个图形但它将所有列线放在一起并显示因此它不具有代表性我尝试制作模拟数据并向您展示我如何绘制它并向您展示我想要的内容我不知道如何制作像下面所示的示例的数据但我在这里做了什么 set seed 1 M lt
如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
如何在 R 中绘制一列与其余列的关系图

我有一个数据集其中 1 是时间接下来的 14 个是幅度我想在一张图表上散布所有大小与时间的关系其中每个不同的列都是网格化的分层在另一个之上我想使用原始数据来制作这些图表并单独制作它们但只想执行此过程一次数据集A 唯一的自变
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
如何连续添加起始行和下一行的值

我只想创建一个 sql 查询结果就像图片上的那样类似于 SQL 中的斐波那契数列 Ex Column 1 10 则 Result 列的值为 Result 10 因为这是第一行然后假设column1第二行的值为50 那么Result第二
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个

随机推荐

何时不使用 docker run --init

The init flag https docs docker com engine reference run specify an init process of docker run导致tini初始化系统用作ENTRYPOINT 因此
詹金斯。指定的代理类型“docker”无效。必须是 [任意、标签、无] 之一

我的 JenkinsFile 如下所示 pipeline agent docker image node 12 16 2 args p 3000 3000 stages stage Build steps sh node version s
Delphi函数通用

我想创建一个通用函数我是通用的新手我有 3 个不同类型的私人列表我想要一个公共通用方法来返回列表中的 1 项我有下面的代码我已经简化了 TFilter class private FListFilter TObjectList
每个视图更改数据库和每个视图访问多个数据库

我在 Pyramid 中使用 SQLAlchemy 时遇到一些问题虽然我可以找到我需要的示例但它们通常都很短且缺乏所以我最终得到了几乎没有任何意义的零碎代码所以我希望有人能够给出我需要做什么的更完整的例子我有 4 个数据库全部具
Cocoa 中的小写“k”

我知道这是一个常见的约定但是变量名称中的 k 表示什么即 kMaxImageViewSize 我查看了 Apple 文档中有关变量名称的内容但没有发现任何提及谢谢回答这是一种通用编程表示法并非特定于 Objective C 即匈
PyCharm 显示“PEP8：预期 2 个空行，发现 1”

考虑以下代码 def add function a b c str a b print c is s c def add int function c d e c d print the vaule of e is d e if name
我正在尝试将一个结构从 C 编组到 C#，不知道从哪里开始

我的 C 结构如下 this structure contains the xfoil output parameters vs angle of attack typedef struct xfoil outputdata struct
如何设置单选按钮状态以使用CSS进行检查？

我有一组单选按钮其中默认选中一个像这样
指针缺少可为空类型说明符

在 Xcode 7 GM 中我开始收到此警告指针缺少可空性类型说明符 Nonnull Nullable 或 Null unspecified 在以下函数声明中 NSUserDefaults扩展 void setObject nullabl
如何在 C# 中创建一个适用于多个控件的事件处理程序？

在 Visual Basic 中我知道如何做到这一点但我是 C 新手所以你们能告诉我如何通过鼠标悬停创建一个私有空白将相同的事件应用于多个控件吗有一个例子 private void button1 button2 button3
Pandas 根据字符串比较有条件地替换数据框中的值

我有一个 Pandas 数据框如下所示有 3 列我想比较每一列以查看该值是否与特定字符串匹配如果是则将该值替换为 NaN 例如如果数据框的第 1 列中有 5 个值 abcd abcd defg abcd defg 如果比较字符串
如何更改点击时的图像和 alt 属性？

我希望使用 JQuery 而不是普通的 JavaScript 来更改几个图像 onclick 并同时更改图像 alt 属性以实现可访问性这应该很容易因为我不希望对变化做一些特殊的效果但我仍然没有找到任何关于它的东西这是我使用 JS
如何循环遍历 pandas df 列，查找字符串是否包含来自单独 pandas df 列的任何字符串？

我有两个 python 中的 pandas DataFrame DDF A 包含一列它基本上是句子长度的字符串 sentenceCol other column this is from france 15 DF B 包含一列该列是国家
获取黑白 UIImage（非灰度）

我需要从另一个 UIImage 不是灰度获取纯黑白 UIImage 有人可以帮助我吗谢谢阅读 EDITED 这是建议的解决方案谢谢大家我几乎知道这不是更好的方法但效果很好 Gets an pure black and white
Java 和 Spring。事务注释@Transactional

我想从 DAO 类中删除开始和提交事务并且我需要使用事务注释应该怎么做呢现在例外是 org hibernate HibernateException createQuery 在没有活动事务的情况下无效课程DAO java publ
Reacts/Flux 的存储应该是 GUI 整个状态的快照吗？

简短的问题看起来应用程序的状态可以从 React Flux 存储中完全序列化我已经在输入值和其他内容中看到过这种情况但是动画或悬停效果又是什么呢我应该使用经典吗 hover用于悬停效果的 CSS 选择器还是应该使用 mouseen
db4o 客户端/服务器似乎一次只能处理一个查询？

我们正在评估 db4o 来自http www db4o com http www db4o com 我们针对客户端服务器模式进行了性能测试其中我们启动服务器然后同时使用多个客户端对其进行测试看起来服务器一次只能处理一个客户端的查询
Spark 节点在 Shuffle 期间如何通信？

我见过从这个问题 https stackoverflow com questions 38084293 spark how does it distribute data around the nodesSpark 节点有效地直接通信但
在 MySQL 中使用列组作为唯一键

我有一张桌子叫requests列所在的位置id placeId songId userId id是表的主索引其余列只是无符号整数并且没有定义其他唯一键 I want placeId songId对是唯一的即如果一行有placeId
带条件的累积平均值

我的 df 的小代表 PTS TeamHome lt c 101 87 94 110 95 PTS TeamAway lt c 95 89 105 111 121 TeamHome lt c LAL HOU SAS MIA LAL Team

带条件的累积平均值

data

带条件的累积平均值 的相关文章

随机推荐

热门标签

带条件的累积平均值的相关文章