Python Pandas 根据条件求平均值到新列中

2024-02-16

我有一个包含以下数据的 pandas 数据框：

matchID    server    court    speed
1          1         A         100
1          2         D         200
1          3         D         300
1          4         A         100
1          1         A         120
1          2         A         250
1          3         D         110
1          4         D         100
2          1         A         100
2          2         D         200
2          3         D         300
2          4         A         100
2          1         A         120
2          2         A         250
2          3         D         110
2          4         D         100

我想添加两个新列，其中包含基于两个条件的平均值。专栏meanSpeedCourtA13应包含平均速度servers1 和 3 其中court = A。这会是蜜蜂(100 + 120) / 2 = 110。第二列名为meanSpeedCourtD13应包含平均速度servers1 和 3 其中court = D。这将是(300 + 110) / 2 = 205.

请注意，这应该对每个matchID，因此，还需要一个groupby。这意味着解决方案包含iloc()不能使用。

生成的数据框应如下所示：

matchID    server    court     speed    meanSpeedCourtA13   meanSpeedCourtD13
1          1         A         100      110                 205
1          2         D         200      110                 205
1          3         D         300      110                 205
1          4         A         100      110                 205
1          1         A         120      110                 205
1          2         A         250      110                 205
1          3         D         110      110                 205
1          4         D         100      110                 205
2          1         A         100      110                 205        
2          2         D         200      110                 205        
2          3         D         300      110                 205        
2          4         A         100      110                 205        
2          1         A         120      110                 205        
2          2         A         250      110                 205        
2          3         D         110      110                 205        
2          4         D         100      110                 205

好吧，这有点复杂了。通常我会尝试一些转换，但如果有人有比以下更好的东西，我会很高兴：

Use groupby并将 df 发送到 func wheredf.loc https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html#pandas-dataframe-loc被使用，最后使用pd.concat将数据框再次粘合在一起：

import pandas as pd

data = {'matchID': {0: 1, 1: 1, 2: 1, 3: 1, 4: 1, 5: 1, 6: 1, 7: 1, 8: 2, 9: 2, 10: 2, 
                    11: 2, 12: 2, 13: 2, 14: 2, 15: 2}, 
'court': {0: 'A', 1: 'D', 2: 'D', 3: 'A', 4: 'A', 5: 'A', 6: 'D', 7: 'D', 8: 'A',
          9: 'D', 10: 'D', 11: 'A', 12: 'A', 13: 'A', 14: 'D', 15: 'D'}, 
'speed': {0: 100, 1: 200, 2: 300, 3: 100, 4: 120, 5: 250, 6: 110, 7: 100, 8: 100, 
          9: 200, 10: 300, 11: 100, 12: 120, 13: 250, 14: 110, 15: 100}, 
'server': {0: 1, 1: 2, 2: 3, 3: 4, 4: 1, 5: 2, 6: 3, 7: 4, 8: 1, 9: 2, 10: 3, 
           11: 4, 12: 1, 13: 2, 14: 3, 15: 4}}

df = pd.DataFrame(data)

def func(dfx):
    dfx['meanSpeedCourtA13'],dfx['meanSpeedCourtD13'] = \
     (dfx.loc[(dfx.server.isin((1,3))) & (dfx.court == 'A'),'speed'].mean(),
      dfx.loc[(dfx.server.isin((1,3))) & (dfx.court == 'D'),'speed'].mean())
    return dfx

newdf = pd.concat(func(dfx) for _, dfx in df.groupby('matchID'))

print(newdf)

Returns

   court  matchID  server  speed  meanSpeedCourtA13  meanSpeedCourtD13
0      A        1       1    100             110.00             205.00
1      D        1       2    200             110.00             205.00
2      D        1       3    300             110.00             205.00
3      A        1       4    100             110.00             205.00
4      A        1       1    120             110.00             205.00
5      A        1       2    250             110.00             205.00
6      D        1       3    110             110.00             205.00
7      D        1       4    100             110.00             205.00
8      A        2       1    100             110.00             205.00
9      D        2       2    200             110.00             205.00
10     D        2       3    300             110.00             205.00
11     A        2       4    100             110.00             205.00
12     A        2       1    120             110.00             205.00
13     A        2       2    250             110.00             205.00
14     D        2       3    110             110.00             205.00
15     D        2       4    100             110.00             205.00

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python Pandas 根据条件求平均值到新列中的相关文章

为什么 urllib2 出现 urllib2.HTTPError 而 urllib 没有错误？

我有以下简单的代码 import urllib2 import sys sys path append BeautifulSoup BeautifulSoup 3 1 0 1 from BeautifulSoup import page h
Python lambda 函数没有在 for 循环中正确调用[重复]

这个问题在这里已经有答案了我正在尝试使用 Python 中的 Tkinter 制作一个计算器我使用 for 循环来绘制按钮并且尝试使用 lambda 函数以便仅在按下按钮时调用按钮的操作而不是在程序启动时立即调用然而当我尝试这
如何/在哪里发布 Python 包

如果一个人创建了一个有用的 Python 包那么如何在哪里发布宣传它以供其他人使用我已经把它放到了 github 上但几周后谷歌也没有找到它包装整洁完整我制作它供我个人使用不与其他人分享将是一种耻辱这是 PyPI 指南 h
Django/gevent socket.IO 与 redis pubsub。我把东西放在哪里？

我有一个独立的 python 脚本它只是从 Twitter 的流 API 捕获数据然后在收到每条消息时使用 redis pubsub 将其发布到频道 tweets 这是该脚本 def main username username pa
通过 pyodbc 连接到 Azure SQL 数据库

我使用 pyodbc 连接到本地 SQL 数据库该数据库工作正常 SQLSERVERLOCAL Driver SQL Server Native Client 11 0 Server localdb v11 0 integrated se
这是我尝试安装 pip3 时得到的结果

这是我尝试安装 pip3 时得到的结果 sudo apt get install python3 pip Reading package lists Done Building dependency tree Reading state i
python: X 服务器上的致命 IO 错误 11（资源暂时不可用）：0.0

我正在尝试读取一些图像稍后打算对它们执行一些任务同时将图像读入内存我想显示动画 gif 图像为此我必须使用线程现在它给出错误 python Fatal IO error 11 Resource temporarily unava
使用 Pandas 滚动差异

您好我正在尝试使用 Pandas 滚动函数来计算下表中的滚动差异我正在尝试生成每月可用项目列中的值但没有得到任何结果请帮忙 Item Adds Subtracts Month Monthly Available items A
映射器无法组装任何主键列

我从 sqlite 表创建了一个临时表该表是基于各种选择标准的原始表的子集屏幕截图中有一个示例我试图一次循环一个表记录以便更新每个记录中的字段我有 source table self source engine create en
将带有非字符串关键字的 dict 传递给 kwargs 中的函数

我使用具有签名功能的库f args kwargs 我需要在 kwargs 参数中传递 python dict 但 dict 不包含关键字中的字符串 f 1 2 3 4 Traceback most recent call last File
从文件中读取单词并放入列表中

本质上我有一个巨大的文件所有文件包含每行多个单词每个单词用空格分隔有点像这样 WORD WORD WORD WORD ANOTHER WORD SCRABBLE BLAH YES NO 我想要做的是将文件中的所有单词放入一个巨大的列
设置区域设置和字符串模块

这个简单的脚本 from locale import LC ALL setlocale print setlocale LC ALL from string import letters print letters 给我这个输出 tr TR
__subclasses__ 没有显示任何内容

我正在实现一个从适当的子类返回对象的函数如果我搬家SubClass from base py 没有出现子类 subclasses 它们必须在同一个文件中吗也许我从来没有直接导入subclass py对Python隐藏子类我能做些什么
在 Python 中将 int 转换为 ASCII 并返回

我正在为我的网站制作一个 URL 缩短器我当前的计划我愿意接受建议是使用节点 ID 来生成缩短的 URL 因此理论上节点 26 可能是short com z 节点 1 可能是short com a 节点 52 可能是short c
captureWarnings 设置为 True 不会捕获警告

我想记录所有警告我以为这样的设定captureWarnings to True应该可以解决问题但事实并非如此代码 import logging import warnings from logging handlers import
使用 PIL 合并图像时模式不匹配

我正在传递 jpg 文件的名称 def split image into bands filename img Image open filename data img getdata red d 0 0 0 for d in data L
使用 boto3 将 csv 文件保存到 s3

我正在尝试写入 CSV 文件并将其保存到 s3 中的特定文件夹存在这是我的代码 from io import BytesIO import pandas as pd import boto3 s3 boto3 resource s3 d
如何在特定时间启动Tornado周期性回调？

目前在我的 Tornado 应用程序中我正在使用定期调用回调PeriodicCallback每隔一小时像这样 import tornado ioloop from tornado ioloop import PeriodicCallba
继承自 NumPy 数组的类如何更改其自身的值？

我有一个继承自 NumPy n 维数组的简单类我想要该类的两个方法可以更改该类实例的数组值其中一种方法应将类实例的数组设置为类实例的列表数据属性的值另一种方法应将一些列表值附加到类实例的数组中我不确定如何实现这一点但我的尝试如下
张量流多元线性回归不收敛

我正在尝试使用张量流训练具有正则化的多元线性回归模型由于某种原因我无法获取以下代码的训练部分来计算我想要用于梯度下降更新的误差我在设置图表时做错了什么吗 def normalize data matrix averages np av

随机推荐

查找目录中的所有目录并仅返回名称

我想找到vb net中一个目录中的所有目录我找到了一个脚本 For Each Dir As String In Directory GetDirectories FolderName ComboBox3 Items Add Dir Nex
Rufus 调度程序与 unicorn 一起运行多次，用 :lockfile 修复，但如何消除错误消息？

scheduler Rufus Scheduler new lockfile gt rufus scheduler lock scheduler every 60 do end 环境 Ubuntu rails 4 rufus unicorn
Azure 中的 React 和 AppSettings

我的目标是从 Azure 应用程序设置中检索一些环境密钥例如 api url 我的构建工厂如下用于 tsx 的 webpack 到压缩的 js 使用 VSTS 构建和发布在 Azure Web 应用程序上部署 Azure Web Ap
ipysheet 和数据框。选中复选框时如何修改 ipysheet 中的值

需要你的帮助我创建一个数据框并将其加载为 ipysheet 我用复选框超载了 1 列目的当我单击第 1 列的单元格的复选框时我将 2 列中的相应值乘以 2 不是全部第2栏我尝试了不同的方法但它没有按预期工作参见下面的代码那么
有没有办法对 NSArray （或其他类簇）进行猴子修补或混合？

今天我正在开发一个项目在该项目中我想为所有实例别名一个替代方法NSArray 并且不认为对某些人来说太困难很好的老式方法 http www google com search q method 20Swizzling 我爆发了JRSw
在 Chrome 扩展中获取并存储 auth_token

我正在实现一个 chrome 扩展用户登录电子邮件和密码并从第 3 方获取身份验证令牌的位置我想存储此身份验证令牌以便在向同一方发送另一个请求时我可以使用此令牌有什么好的方法可以做到这一点我应该储存它吗如果是的话怎么办否则
Twitter Bootstrap 的响应式 CSS 适用于调整大小的窗口，但不适用于移动设备

我使用 Twitter Bootstrap 框架来构建我的最新网站我用了boostrap responsive css使其在移动设备上运行但事实并非如此看起来它根本没有看到CSS 当我在 Android 手机上运行它时它就像我的 P
如何在不同选项卡中保存或导出Excel中的多个数据框？

我需要在不同选项卡的 Excel 中导出或保存 pandas 多个数据框假设我的 df 是 df1 Id Name Rank 1 Scott 4 2 Jennie 8 3 Murphy 1 df2 Id Name Rank 1 John
st_normalize.sfc(x, c(x_range[1], y_range[1], x_range[2], y_range[2])) 中的错误：域必须具有正范围

背景我正在使用 ggplot2 geom point 按周绘制动物位置点作为底图我使用计算机中的形状文件这是我的数据的示例 datexample lt data frame animal c A B yearweek c 20202
如何使用内连接和 Case 语句更新表

问题 Table1 CatId Type Qty 8 O 10 8 N 20 8 U 30 30 N 5 30 O 15 30 NULL 25 Table2 catId Old New Useless Other 8 100 70 140
为什么抛出或捕获的类型必须从 System.Exception 派生

因此出于好奇我想看看异常类有什么特别之处允许它与关键字一起使用Throw而标准课程则不然我发现的是 Exception 类实现了以下内容 public class Exception System Object System Run
.NET 程序集绑定，我可以将一个程序集映射到另一个程序集中的版本吗？

早上好是否可以将程序集请求映射到另一个程序集中的版本例如我们的产品使用NHibernate 3 2 我们正在转向 NServiceBus 3 2 2 对于 DBSubscription 存储它使用 NHibernate 并且采用 NH
在 Angular 模板中创建本地绑定上下文

假设我有一个要绑定的深层嵌套对象图 div model rootProperty div div div model some deeply nested property with a donut name div div model s
CMake include() 与 find_package() 的默认搜索路径

我在 Debian 机器上安装了 VTK6 它将所有 CMake 文件放置在 ls usr lib cmake vtk 6 3 VTKConfig cmake vtkModuleAPI cmake 当我做 find package VTK
UWP 显示全屏弹出窗口、ContentDialog 或 Flyout

我需要在我的 UWP 应用程序中显示全屏对话框在应用程序窗口边界中但似乎无法使其工作我尝试过 ContentDialog 仅显示垂直拉伸且 FullSizeDesired True 弹出窗口甚至尝试在其后面的代码中设置宽度和高度也不
在 ScalaCheck 中生成选项[T]

我试图在 ScalaCheck 中生成可选参数但没有成功似乎没有直接的机制可以实现这一点 Gen containerOf Option Thing thingGenerator 失败因为它找不到隐式Buildable Thing Op
有效地广播具有多个变量的大型数据集

我在尝试着dcast大型数据集数百万行我有一行用于到达时间和出发地另一行用于出发时间和目的地有一个id识别这两种情况下的单位它看起来类似于 id time movement origin dest 1 10 06 2011 15
如何在 dojo 数据网格中显示复选框？

如何在 dojo 数据网格中显示复选框我建议将 cellType 设置为 dojox grid cells Bool 而不是格式化程序格式化程序为您提供了很大的自由但也有责任从所有复选框针对所有行收集数据像这样的结构条目应该可以
Typescript：类型“never”上不存在属性“length”

我有一组基本功能 export function isObject value any value is Object return value null typeof value object isArray value export f
Python Pandas 根据条件求平均值到新列中

我有一个包含以下数据的 pandas 数据框 matchID server court speed 1 1 A 100 1 2 D 200 1 3 D 300 1 4 A 100 1 1 A 120 1 2 A 250 1 3 D 110

Python Pandas 根据条件求平均值到新列中

Python Pandas 根据条件求平均值到新列中 的相关文章

随机推荐

热门标签

Python Pandas 根据条件求平均值到新列中的相关文章