groupby pandas 数据帧上的算术运算

2024-02-14

我有一个包含 40 列和 400000 行的 pandas 数据框。我创建了一个包含 3 列的汇总数据集。

现在，我需要根据其中两列计算百分比指标。 Python 抛出错误 -

unsupported operand type(s) for /: 'SeriesGroupBy' and 'SeriesGroupBy'

这是示例代码：

print sample_data
   date  part  receipt  bad_dollars  total_dollars  bad_percent
0     1   123       22           40            100          NaN
1     2   456       44           80            120          NaN
2     3   134       33           30            150          NaN
3     1   123       22           80            100          NaN
4     5   456       45           40             90          NaN
5     3   134       33           85            150          NaN
6     7   123       24           70            120          NaN
7     5   456       45           20             85          NaN
8     9   134       35           50            300          NaN
9     7   123       24          300            600          NaN

sample_data_group = sample_data.groupby(['date','part','receipt'])

sample_data_group['bad_percents']=sample_data_group['bad_dollars']/sample_data_group['total_dollars']

TypeError: unsupported operand type(s) for /: 'SeriesGroupBy' and 'SeriesGroupBy'

请帮忙！

您可以使用 groupby 对象上的 apply 来执行此操作：

import pandas as pd
import numpy as np

cols = ['index', 'date',  'part',  'receipt',  'bad_dollars',  'total_dollars',
        'bad_percent']
sample_data = pd.DataFrame([
[0,     1,   123,       22,           40,            100,          np.nan],
[1,     2,   456,       44,           80,            120,          np.nan],
[2,     3,   134,       33,           30,            150,          np.nan],
[3,     1,   123,       22,           80,            100,          np.nan],
[4,     5,   456,       45,           40,             90,          np.nan],
[5,     3,   134,       33,           85,            150,          np.nan],
[6,     7,   123,       24,           70,            120,          np.nan],
[7,     5,   456,       45,           20,             85,          np.nan],
[8,     9,   134,       35,           50,            300,          np.nan],
[9,     7,   123,       24,          300,            600,          np.nan]],
                           columns = cols).set_index('index', drop = True)

sample_data_group = sample_data.groupby(['date','part','receipt'])

xx = sample_data_group.apply(
         lambda x: x.assign(bad_percent = x.bad_dollars/x.total_dollars))\
                      .reset_index(['date','part', 'receipt'], drop = True)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

groupby

groupby pandas 数据帧上的算术运算的相关文章

从一个数组中删除另一个数组中的元素

假设我有这些二维数组A and B 我怎样才能从中删除元素A那些在B 集合论中的补集 A B A np asarray 1 1 1 1 1 2 1 1 3 1 1 4 B np asarray 0 0 0 1 0 2 1 0 3 1 0 4
在 sympy 绘图中，如何获得具有固定纵横比的绘图？

如果我用这个片段画一个圆 from sympy import x y symbols x y p1 plot implicit Eq x 2 y 2 1 aspect ratio 1 1 我会得到一个像这样的图形窗口现在长宽比不是我所期望
如何从数据库模式自动生成示例 Django 应用程序？

我正在评估概念验证应用程序的框架该应用程序的生命周期约为 30 天之后它将被遗忘或完全重写我已确定要从现有数据库模式自动生成示例应用程序然后调整视觉设计的某些方面我看过一个演示红宝石 on Rails 它会为数据库中的每个表自动生
如何在模型 Django 中创建必需：布尔字段

我有一个模型其中有一个名为的字段is student and is teacher Student and Teacher forms is teacher models BooleanField teacher status defau
gcloud app deploy：此部署有太多文件

当我尝试通过 gcloud 部署我的 GAE 应用程序时出现以下错误 Updating service default failed ERROR gcloud app deploy Error Response 400 This depl
如何逐行替换（更新）文件中的文本

我试图通过读取每一行测试它然后写入是否需要更新来替换文本文件中的文本我不想保存为新文件因为我的脚本已经先备份文件并对备份进行操作这是我到目前为止所拥有的我从 os walk 获取路径并且保证 pathmatch var 正确返
Python中非常大的整数的math.pow是错误的[重复]

这个问题在这里已经有答案了我试图通过计算一个整数的非常大的幂来打印一个非常大的数字尽管我的代码是正确的但我没有观察到所需的输出一般来说 Python解释器可以打印系统内存支持的非常大的整数考虑到这个假设下面是我正在运行的代码 a
Python/Scipy 2D 插值（非均匀数据）

这是我上一篇文章的后续问题 Python Scipy 插值地图坐标 https stackoverflow com questions 5124126 python scipy interpolation map coordinates
如何在Python中重命名virtualenv？

我拼错了名字virtualenv使用以下方法初始化它 virtualenv vnev 我实际上打算创建一个名为的环境venv 尝试重命名后vnev文件夹到venv 我发现这并没有提供太多帮助激活环境的名称仍然重命名旧的vnev mv vn
Python textwrap.wrap 导致 \n 问题

所以我只是重新格式化了一堆代码以合并textwrap wrap 却发现我所有的 n都消失了这是一个例子 from textwrap import wrap def wrapAndPrint msg width 25 wrap msg to
如何在Python中比较列表列表中的元素以及比较列表列表中的键？

我有以下顺序 seq ATG ATG ATG ATG GAC GAT GAA CCT GCC GCG GCA GCT 这是一个字典键用于存储每个密码子的氨基酸值三联碱基例如ATG GCT etc aminoacid TTT F TTC
Tensorflow：Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

我正在从源安装tensorflow 文档 https www tensorflow org versions r0 10 get started os setup html installing from sources Cuda驱动版本
Web 应用程序框架：C++ 与 Python

作为一名程序员我熟悉 Python 和 C 我正在考虑编写自己的简单 Web 应用程序并且想知道哪种语言更适合服务器端 Web 开发我正在寻找一些东西它必须是直观的我认识到 Wt 存在并且它遵循 Qt 的模型我讨厌 Qt 的一件
Python 日志记录 - 如何检查记录器是否为空

我刚刚在我的应用程序中实现了日志记录我想知道是否有一种方法可以检查记录器是否为空我的想法是在我的脚本中设置两个处理程序一个用于带水平仪的控制台WARNING 一个用于带级别的文件DEBUG 在脚本的最后我需要检查是否CONSOLE记
使用字体模块的 Tkinter 代码无法从命令行运行？

我有使用 tkinter 的代码我可以从 IDLE 运行得很好但会引发异常AttributeError module object has no attribute font 当它从命令行运行时其他 tkinter 程序工作正常但任
Kivy错误（python 2.7）：sdl2导入错误

我尝试在我的 Python 2 7 项目在 PyCharm Windows 10 环境中上使用 kivy 但出现以下错误如果有人可以帮助我吗谢谢 PS 我多次尝试卸载重新安装库等并按照像这样的帖子上的建议进行操作但它不起作用
使用 django-profiles 以配置文件形式编辑相关模型

我在用着Django 配置文件 http bitbucket org ubernostrum django profiles wiki Home在我的应用程序中因为它为我提供了一些简单的视图可以帮助我更快地到达我想去的地方但是我有一
从 Cython 代码生成 SIMD 指令

我需要概述在高性能数字代码中使用 Cython 可以获得的性能我感兴趣的事情之一是找出优化的 C 编译器是否可以对 Cython 生成的代码进行矢量化所以我决定写下面的小例子 import numpy as np cimport num
Python，质数检查器[重复]

这个问题在这里已经有答案了你好我正在创建一个函数来检查一个数字是否是素数但它告诉我 9 是一个素数 def eprimo num if num lt 2 return False if num 2 return True else f
Django 表单中的只读字段

如何在 Django 表单中将字段设置为只读我知道如何禁用某个字段但这不是我想要的任何帮助将不胜感激您可以使用可选的attrs定义时的参数Field 以机智 somefield forms CharField widget for

随机推荐

当汇总为双精度时，从 ForEach 循环转换为 Parallel.ForEach 循环会减慢速度

我有一段 C 代码如下此代码总结了 DataTable 中的一列双精度 var data this Db ExecuteRead query this Score Name var time 0 0 foreach DataRow ro
Android Appwidget textview不更新

你好我的 Android 小部件遇到了一个非常奇怪的问题我广泛查看了很多地方但我似乎无法弄清楚出了什么问题基本上我在我的小部件中调用待定意图广播并在 onrecivie 方法中成功捕获该意图但是在 onRecive 方法中当
python子进程隐藏stdout并等待它完成

我有这个代码 def method a self command line somtoolbox GrowingSOM som prop path subprocess Popen shlex split command line def
Visual Studio 2017 调试错误：为了防止在评估函数 *.toString 时发生不安全中止，允许所有线程运行

我将 Visual Studio 2017 更新到版本 15 8 2 这次更新之后我在调试时开始遇到这些错误以下是错误消息 Visual Studio 调试错误为了防止在评估函数 toString 时发生不安全中止允许所有线程运行
链接到 Github 上的另一个 html 页面

我试图寻找解决方案但不太确定如何在谷歌中以简洁的方式表达我的问题以获得解决方案我对 Html 和 github 相当陌生最近我用自己的 html 代码制作了自己的 Github 页面简而言之我在github中有一个文件 index
如何在 iOS 中禁用特定方向

我想在某些视图中禁用横向方向我已经重写了以下两个方法但这些方法不会随时调用 NSUInteger supportedInterfaceOrientations return UIInterfaceOrientationMaskPortr
Spring Boot 在 Apache 代理后面嵌入 Tomcat

我们有一个 Spring Boot Spring MVC 应用程序在 Apache SSL 代理后面的专用应用程序服务器上嵌入了 Tomcat 代理服务器上的 SSL 端口是 4433 转发到应用程序服务器上的端口 8080 所以代理服务
在 Python 中将文件从一个位置复制到另一个位置

我有一个名为fileList包含数千个文件名和大小如下所示 home rob Pictures some folder picture one something jpg 143452 home rob Pictures some oth
如何将文件保存到我的桌面文件夹 Angular 6

我已经从base64构建了一个文件我想将其保存到本地系统 dataURLtoFile dataurl filename format const arr dataurl split const mime arr 0 match 1 con
根据模板参数创建字符串

I have many像这样的类方法 template
如何从 NSMutableArray 中删除 NULL 值？ IOS

我有一个生日数组因为数组是从 facebook 填充的所以有一些朋友的生日是私有的所以它包含 NULL 如何将该数组转换为空字符串只要存在 null 值数组如下所示
在 ASP.NET 中构建动态“高级搜索”控件的建议

替代文本 http img3 imageshack us img3 1488 advancedsearch png http img3 imageshack us img3 1488 advancedsearch png 我正在 ASP N
如何修复 Git 中的“packet_write_wait：连接到...损坏的管道”错误

当我git push文件发送到我的远程存储库它会抛出错误 packet write wait 连接到 13 250 177 223 端口 22 管道损坏之前git push 我已经从远程克隆了该项目并且git add git commi
正确设置 IIS7.5 机器帐户以进行匿名网站访问

使用 IIS 7 5 IIS IUSRS 应该是要使用的帐户我收到 401 未经授权由于凭据无效访问被拒绝错误如果我添加一个带有 Read 的 EVERYONE 帐户它就可以工作但最好不要拥有Everyone 帐户知道为什么
C++ 隐式进入/启动主要可执行错误

我在 Mac 上运行 Hadoop 管道代码时遇到问题这是我的 C 代码 include
一起使用 ASP.Net AJAX 和 JQuery 的任何缺点

我们计划使用 jQuery 库来增强我们的客户端 JavaScript 需求尝试同时使用 ASP Net AJAX 和 jQuery 时是否存在任何重大问题这两个库似乎都将用于特殊目的有什么冲突是我们需要注意的吗我们还使用使用 A
如何在 C# 中将泛型对象分配给非泛型引用

我是一名 Java 人员正在尝试用 C 实现一些代码我研究了一个小时但没有找到任何东西我有一个声明为通用的接口称为 interface TypeSerializer
在 Python 正则表达式中使用 ^ 匹配行首

我正在尝试从 Thomson Reuters Web of Science 中提取出版年份 ISI 风格的数据出版年份的行看起来像这样在行的最开头 PY 2015 对于我正在编写的脚本我定义了以下正则表达式函数 import re
我的 C 程序如何检查它是否对给定文件具有执行权限？

有没有办法判断进程是否may执行文件而不必实际执行它例如通过调用execv filepath args 只是失败并发现errno EACCES I could stat文件并观察st mode 但我仍然不知道这与这个过程有什么关系理想情
groupby pandas 数据帧上的算术运算

我有一个包含 40 列和 400000 行的 pandas 数据框我创建了一个包含 3 列的汇总数据集现在我需要根据其中两列计算百分比指标 Python 抛出错误 unsupported operand type s for Seri

groupby pandas 数据帧上的算术运算

groupby pandas 数据帧上的算术运算 的相关文章

随机推荐

热门标签

groupby pandas 数据帧上的算术运算的相关文章