pandas，将多列的多个函数应用于groupby对象

2024-01-04

我想将多列的多个函数应用于 groupby 对象，这会产生一个新的pandas.DataFrame.

我知道如何分步骤完成：

by_user = lasts.groupby('user')
elapsed_days = by_user.apply(lambda x: (x.elapsed_time * x.num_cores).sum() / 86400)
running_days = by_user.apply(lambda x: (x.running_time * x.num_cores).sum() / 86400)
user_df = elapsed_days.to_frame('elapsed_days').join(running_days.to_frame('running_days'))

Which results in user_df being:

但我怀疑有更好的方法，例如：

by_user.agg({'elapsed_days': lambda x: (x.elapsed_time * x.num_cores).sum() / 86400, 
             'running_days': lambda x: (x.running_time * x.num_cores).sum() / 86400})

然而，这不起作用，因为据我所知agg()致力于pandas.Series.

我确实找到了这个问题和答案 https://stackoverflow.com/q/14529838/3447047，但这些解决方案对我来说看起来相当丑陋，考虑到答案已经有近四年的历史了，现在可能有更好的方法。

解决方案的另一个可靠的变化是做 @MaxU 所做的事情这个解决方案 https://stackoverflow.com/a/43417577/3899919 to 类似的问题 https://stackoverflow.com/questions/43417090/apply-multiple-functions-at-one-time-to-pandas-groupby-object并包装各个功能在熊猫系列中，因此只需要一个reset_index()返回一个数据帧。

首先，定义转换函数：

def ed(group):
    return group.elapsed_time * group.num_cores).sum() / 86400

def rd(group):
    return group.running_time * group.num_cores).sum() / 86400

将它们包装在一个系列中使用get_stats:

def get_stats(group):
    return pd.Series({'elapsed_days': ed(group),
                      'running_days':rd(group)})

Finally:

lasts.groupby('user').apply(get_stats).reset_index()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas，将多列的多个函数应用于groupby对象的相关文章

python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
R 中的数据框操作 - 将单元格向左移动并删除 NA

我有一个数据框其列由随机分布的值和 NA 组成如下所示 a lt c S E NA S NA b lt c A NA M G K c lt c I NA NA NA L meh lt dataframe a b c 1 2 3 4 5
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

在 C++11 中实现元函数 zip

我实际上想看看是否可以获得一个最小的库该库支持我从 boost fusion 使用的极少数操作这是我到目前为止所拥有的 template lt typename Types gt struct typelist template lt
是什么导致Spring在使用AnnotationConfigApplicationContext时无法加载配置类？

我最近遇到了这个问题在搜索 stackoverflow 网站后找不到可行的解决方案我收到的错误是 Spring 在加载配置类时遇到问题我使用注释和 Spring 类来配置而不是 XML 文件以练习使用注释而不是 XML 文件配置
是否可以强制使用 DataType 作为 DataType.Currency 的 MVC3 字段的货币

我正在编写一个 MVC3 应用程序它从数据库中读取一堆货币数据我遇到的问题是这些金额都是不同的货币如果我像这样设置字段的类型 DataType DataType Currency public Amount get set 我得到小数
添加使用向上和向下箭头键选择表格行的功能

我需要专家的帮助来解决我的以下问题因为它超出并远远超出了我对 JavaScript 编程的知识水平鉴于下面现有的 JavaScript 编码我如何搭载并添加到现有编码中以便为用户添加功能以便在滚动时使用向上和向下箭头键滚动表格顺
我无法使用 libusb for Ruby 模拟嗅探 urb 中断

嗅探 URB INTERRUPtions 我嗅探了一些应用程序 SoundLab 和设备带 USB 的声波计之间的通信我找到了一个负责返回当前状态的数据包 USB URB Source host Destination 1 1 2 U
包主要版本更改是否意味着子包主要版本更改？

假设我有一个核心 CMS 已从v4 8 7 to v5 0 0 我还有一个事件模块包有自己的版本号1 2 4它将这个核心 CMS 包导入到它的composer json file company name cms 4 3 我将这个包上的c
Tesseract 混淆两个数字

我正在编写一个应用程序来扫描图像中的数字这些数字使用 OCR B 字体并且还可能包含 and gt 人物这是我的源图像即使将字符集限制为上述字符使用 Tesseract 的扫描效果也不是很好由于我没有找到 Tesseract 的
Visual Studio 不会调试到引用的 DLL（来自同一解决方案）

我有一个 Visual studio 2008 解决方案有 2 个项目一个 DLL A 一个 Web 应用程序 B B 有一个对 A 的项目引用并且 A dll 和 A pdb 正在被复制到 B 的 bin 目录中一切都设置为在调试
文件夹外的文件夹路径

我的主文件夹中有一个包含所有 css 的文件夹名为 main 在 main 中我有另一个名为 math 的文件夹我想在 math 文件夹中使用我的CSS 但是当我输入在 math 文件夹的index html 上它可以工作我认为这
无法在 Codeigniter 中加载请求的类 Session

我的图书馆在autoload php is autoload libraries array database pagination session cart form validation 我收到此错误 An Error Was Enco
Kotlin 注解 IntDef

我有这个代码示例 class MeasureTextView TextView constructor context Context super context constructor context Context attrs Attr
如何向框架添加鼠标监听器

我想向 mt JFrame 框架添加一个 mouselistener 但是当我执行 frame addMouseListener this 时我收到一个错误指出我无法在静态方法中使用它我正在制作一个应用程序检测鼠标的单击然后以 i
如何使用 scikit 的预处理/标准化以及交叉验证？

作为没有任何预处理的交叉验证的示例我可以这样做 tuned params penalty l2 l1 from sklearn linear model import SGDClassifier SGD SGDClassifier fro
如果选中则获取复选框值

我正在使用 HTML 和 JQuery mobile 构建一个表单以便该表单可以在移动设备上使用我有通过电子邮件导出到 CSV 的表单但是如果未选中复选框则不会写入 CSV 文件我可以使用 jQuery 中的函数使用标签中的值从
MySQL GROUP_CONCAT 多个字段

我可能正处于无脑时刻我想使用 GROUP CONCAT 从数据库中的两个字段返回一系列数字到目前为止我已经使用以下方法完成了此操作 SELECT t id CONCAT GROUP CONCAT DISTINCT s id IFNULL
如何在 C# 中序列化和反序列化以字节数组作为成员的类

我正在尝试以字节流的形式在两个进程之间发送数据这对于几乎所有类都工作得很好但我遇到的一个问题是如果对象的类内部有一个字节数组并给出则反序列化会失败我收到一个错误指出无法加载发生序列化的程序集我无法将程序集包含在此处因为发送方和
matplotlib：3D 图中的网格

In matplotlib 如何在 3D 散点图中显示网格在二维图中我只是这样做 plt grid True 它就像一个魅力现在对于 3D 绘图相同的调用会返回警告 File usr lib pymodules python2 7
Haystack - 为什么 RealtimeSearchIndex 有时不更新我保存的对象

我正在将 Haystack 和 Whoosh 与 Django 一起使用在 search index py 中我有这个 class PageIndex RealTimeSearchIndex text CharField document
在 Collectionview 中如何根据选择设置颜色？

我的要求是首先设置默认颜色indexPath我想根据选择改变颜色我的要求是当集合视图在第一个索引加载时背景颜色应该是红色未选择的颜色是蓝色如何管理这个这是我的代码 import UIKit class MyCollectionVie
pandas，将多列的多个函数应用于groupby对象

我想将多列的多个函数应用于 groupby 对象这会产生一个新的pandas DataFrame 我知道如何分步骤完成 by user lasts groupby user elapsed days by user apply lambd

pandas，将多列的多个函数应用于groupby对象

pandas，将多列的多个函数应用于groupby对象 的相关文章

随机推荐

热门标签

pandas，将多列的多个函数应用于groupby对象的相关文章