将多列传递给 groupby.transform

2024-04-28

据我所知，当您使用 DataFrame 列调用 groupby.transform 时，该列将传递给转换数据的函数。但我无法理解的是如何将多个列传递给函数。

people = DataFrame(np.random.randn(5, 5), columns=['a', 'b', 'c', 'd', 'e'], index=['Joe', 'Steve', 'Wes', 'Jim', 'Travis'])
key = ['one', 'two', 'one', 'two', 'one']

现在我可以轻松地贬低数据等，但我似乎无法正确执行的是使用多个列值作为函数的参数来转换组内的数据。例如，如果我想为每个观察添加一个采用值 a.mean() - b.mean() * c 的列“f”，如何使用转换方法来实现这一点。

我尝试过以下变体

people['f'] = float(NA)
Grouped = people.groupby(key)
def TransFunc(col1, col2, col3):
    return col1.mean() - col2.mean() * col3
Grouped.f.transform(TransFunc(Grouped['a'], Grouped['b'], Grouped['c']))

但这显然是错误的。我也尝试过将函数包装在羔羊中，但也无法完全使其工作。

我能够通过以下方式迭代组来实现结果：

for group in Grouped:
    Amean = np.mean(list(group[1].a))
    Bmean = np.mean(list(group[1].b))
    CList = list(group[1].c)
    IList = list(group[1].index)

    for y in xrange(len(CList)):
        people['f'][IList[y]] = (Amean - Bmean) * CList[y]

但这似乎不是一个令人满意的解决方案，特别是如果索引不唯一。我也知道这必须可以使用 groupby.transform 实现。

概括一下这个问题：如何编写用于转换具有涉及使用多个列中的值的参数的数据的函数？

帮助表示赞赏。

您可以使用apply() method:

import numpy as np
import pandas as pl
np.random.seed(0)

people2 = pd.DataFrame(np.random.randn(5, 5), 
                      columns=['a', 'b', 'c', 'd', 'e'], 
                      index=['Joe', 'Steve', 'Wes', 'Jim', 'Travis'])
key = ['one', 'two', 'one', 'two', 'one']

Grouped = people2.groupby(key)

def f(df):
    df["f"] = (df.a.mean() - df.b.mean())*df.c
    return df

people2 = Grouped.apply(f)
print people2

如果你想要一些通用方法：

Grouped = people2.groupby(key)

def f(a, b, c, **kw):
    return (a.mean() - b.mean())*c

people2["f"] = Grouped.apply(lambda df:f(**df))
print people2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

将多列传递给 groupby.transform 的相关文章

Python：如果满足条件，则循环遍历一个字典并在新字典中创建键/值对

我想将一个字典的值与第二个字典的值进行比较如果值满足特定条件我想创建第三个字典其中的键和值对将根据匹配情况而变化这是一个显示我的问题的人为示例编辑对所有返回感到抱歉但堆栈溢出无法识别单个返回并且在一行上运行 3 4 行使代
扭曲多种协议

我希望为我正在从事的项目学习扭曲该项目需要服务器响应 HTTP 请求以及通过 TCP 连接的其他协议 Twisted能够同时处理多种协议吗我想使用 Twisted Web 来帮助处理 HTTP 但同时需要响应其他端口上的 TCP 连接
c++11 正则表达式比 python 慢

嗨我想了解为什么以下代码使用正则表达式进行分割字符串分割 include
将 geojson 文件下载到 jupyter 中的 folium 中

我想要一张欧洲地图作为 json 文件这样我就可以使用 geojson 将其作为图层放置在 Folium 地图上这样我就可以将我的数据集嵌入到其中以显示欧洲哪个国家的酒精含量最高我在从 GitHub 获取 json 文件以在 jy
来自多元 t 分布的样本 python

我想知道Python中是否有一个从多元学生t分布中采样的函数我有包含 14 个元素的均值向量 14x14 协方差矩阵和自由度我想从这个 t 分布中采样一个向量对于一维情况我使用 stats t rvs df loc scale 并且
绘制对数轴

我想使用 matplotlib 绘制一张带有一个对数轴的图我一直在阅读文档但无法弄清楚语法我知道这可能很简单 scale linear 在情节争论中但我似乎无法正确理解示例程序 import pylab import matplo
如何将数据从 JavaScript 发送到 Python

我正在 jinja2 和 python2 7 上使用 GAE 进行 Web 开发我可以从Python获取数据但我无法将数据从 JavaScript 发送到 Python 这是 JavaScript 代码 function toSave
如何使用 django Rest 框架保存多对多字段对象

我有博客发布标签三个模型在博客模型中我将字段 postedin 作为发布模型的外键将标签作为标签模型的许多字段模型 py class Posted models Model name models CharField Pos
PyQt5 的 OpenGL 模块和版本控制问题（调用不正确的 _QOpenGLFunctions_(ver)）

我一直在努力得到PyQt5 helloGL 示例代码 https github com baoboa pyqt5 blob master examples opengl hellogl py编译当我尝试构建解决方案时我得到 Traceb
seaborn 箱线图的子图

我有一个像这样的数据框 import seaborn as sns import pandas as pd pylab inline df pd DataFrame a one one two two one two one one one
Python3 - 如何将字符串转换为十六进制

我正在尝试将字符串逐个字符转换为十六进制但我无法在Python3中弄清楚它在较旧的 python 版本中我的以下内容有效 test This is a test for c in range 0 len test print 0x s
如何检查discord.py中的所有者

我试图让这个命令只有所有者才能运行它是否有办法检查服务器的最高角色或创建者我尝试了 commands is owner 但这仅检查某人是否是机器人的所有者 Guild owner https discordpy readthedocs
在 Python 中通过网络发送对象的最佳方式是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要通过网络发送对象我将使用 Twisted 并且我刚刚开始查看它的文档据我所知 python实现套接字的唯一方式是通过文本那么我如何使
在解析器/子解析器的开头使用 argparse.REMAINDER

我想实现一个 arg 解析器它允许我将单元测试作为子命令之一运行盲目地将参数传递给 unittest main 例如 foo py unittest args to pass to unittest main 以及其他子命令 foo p
如何在 Python 中连接两个列表？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动如何在 Python 中连接两个列表 Example listone 1 2 3 lis
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
如何将 Django 数据库中的模板标签解释/渲染为 HTML

我正在尝试添加带有来自 Django 管理站点的图像的帖子但安全自动转义关闭过滤器无法解释 Django 的模板标签 My input and page look like 复制图像地址给出http 127 0 0 1 8000 7B
如何通过异常值检测方法在周期性或基于序列的数据上生成脉冲作为异常值以进行实验？

我想对一些时间序列数据进行一些实验KM https scikit learn org stable auto examples cluster plot cluster iris html sphx glr auto examples cl
类unix系统中的python和python3命令有什么区别？

我通读了每个命令的描述但每个命令的描述都是完全相同的所以我不明白这两个命令在类 Unix 系统中的工作方式有何不同谁能解释其中的区别吗 Python3命令的引入是因为python命令指向了python2 从那时起 Python3 已成
在不同进程之间共享列表？

我有以下问题我编写了一个函数它将列表作为输入并为列表中的每个元素创建一个字典然后我想将这本字典附加到一个新列表中这样我就得到了一个字典列表我正在尝试为此生成多个进程我的问题是我希望不同的进程访问由其他进程更新的字典列表例如

随机推荐

即使在 virtualenv 激活后，python 也指向全局安装

有点奇怪我激活了虚拟环境python仍然指向全局安装 which python usr bin python source virtualenv bin activate virtualenv which python usr bin p
在无序列表中的项目后面添加管道分隔符，除非该项目是一行中的最后一个

是否可以设置此 html 的样式 ul li Dogs li li Cats li li Lions li li Tigers li li Zebras li li Giraffes li li Bears li li Hippopotam
在同一 Jenkins 项目的后期重用工件

我有一个 Jenkins 管道其构建步骤有一个archiveArtifacts命令构建步骤之后是单元测试集成测试和部署在部署步骤中我想使用其中一个工件我以为我可以在构建步骤生成它的同一个地方找到它但显然archiveArtif
如何将格式化的电子邮件地址解析为显示名称和电子邮件地址？

给定电子邮件地址 Jim 电子邮件受保护 gt 如果我尝试将其传递给 MailAddress 我会得到异常指定的字符串不符合电子邮件地址所需的格式如何将此地址解析为显示名称 Jim 和电子邮件地址电子邮件受保护 cdn cgi l e
如何停止 IntelliJ 搜索传入的 SVN 更改？

我的 IntelliJ IDE 12 1 4 定期搜索连接的 SVN 存储库中的传入更改当我第一次安装 IntelliJ 时不会自动搜索这些传入更改如果我没记错的话我必须单击更改选项卡中传入子选项卡中的刷新按钮并设置一些选项
Azure DevOps/Pipeline IP 随机变化，因此由于防火墙规则，我无法使用 Azure SQL 数据库

Azure DevOps Pipeline IP 随机变化因此由于防火墙规则我无法使用 Azure SQL 数据库这种情况下的解决办法是什么在连接数据库之前您可以根据代理的当前 IP 创建防火墙规则如下所示 task Azure
PHP MySQL 检查表是否有主键

我将查询 MySQL 服务器来检查表是否有主键就像是 if mysql send SELECT TABLE table HAS PRIMARY KEY TRUE do stuff here SHOW INDEXES FROM TABLE
在 Windows Phone 8 中设置广告

我发现了一些对类似问题的零散回复主要是 Windows Phone 7 但我想发布一个包含 Windows Phone 8 广告的所有要求的答案我在 Windows Phone 8 中设置广告时遇到了一些问题每次运行模拟器时我都会遇
mysql_insert_id 带更新

执行下面的查询后我使用 PHP 函数mysql insert id 它总是给我0 UPDATE tbl training types SET fld serial serial no fld name training name fld
检测应用程序的阶段（alpha、beta 或生产）

我正在使用 cordova 开发一个 android 应用程序我希望使用三个给定的阶段来逐步发布它 IT 测试的 Alpha 合作伙伴测试版为其他人生产但是我正在使用 mixpanel 来跟踪一些用户输入 Mixpanel 需要一个
在 EditText 中输入数据并响应，无需按 Enter 键

我有一个带有侦听器的 editText edittext setOnKeyListener new OnKeyListener public boolean onKey View v int keyCode KeyEvent event I
带有第二个 y 轴的 Seaborn 图

i wanted to know how to make a plot with two y axis so that my plot that looks like this to something more like this by
如何在xcode中创建数组键和值？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我是一名新的 iPhone 开发者
在 Mac OS X 中安装 Avro

我正在查看 Avro RPC for Python 网址为https github com phunt avro rpc quickstart python https github com phunt avro rpc quickstar
EF Core 5.0 中的多对多关系是否可以配置为仅保留一个导航属性（在一侧）？

我已使用以下代码配置了 DbContext EF Core 5 0 protected override void OnModelCreating ModelBuilder modelBuilder modelBuilder Entity
如何使用 Chart.js 在堆积条形图中显示内联值？

我正在使用 Chart js 库在堆叠条形图中显示一些值但我正在努力找出如何显示条形图中的值即现在我有以下代码可以在条形顶部显示数字但我想知道如何在条形内部显示它们 var numberWithCommas function x
如何使用 UIImagePickerController CropRect

我刚刚找到了一种方法来更改裁剪框的矩形该裁剪框在捕获图像后出现UIImagePickerViewController 这可以在以下帮助下完成UIImagePickerControllerCropRect 但我不知道如何使用它最初的裁剪框
在 Python 的内置数字类型上，repr 和 str 总是相同吗？

Are repr and strPython 内置数字类型相同 int bool float and complex 或者是否存在深奥的两者可能产生不同结果的情况 SO的相关问题例如this one https stackoverfl
在 iOS6 中处理手势识别器

显然当你有手势识别器和手势识别器时 iOS 6 会尝试自动处理这种情况 UIButton在同一个地方用同一个手势被激活当您想要单击按钮而不是激活手势识别器时这种新的自动处理可以解决问题但是产生了一个新问题当您希望手势识别器起作用时
将多列传递给 groupby.transform

据我所知当您使用 DataFrame 列调用 groupby transform 时该列将传递给转换数据的函数但我无法理解的是如何将多个列传递给函数 people DataFrame np random randn 5 5 colum

将多列传递给 groupby.transform

将多列传递给 groupby.transform 的相关文章

随机推荐

热门标签