将小计添加到 Pandas Groupby

2023-12-01

我正在寻找一种更干净的方法来将小计添加到 Pandas groupby 中。

这是我的数据框：

df = pd.DataFrame({
'Category':np.random.choice( ['Group A','Group B'], 50),
'Sub-Category':np.random.choice( ['X','Y'], 50),
'Product':np.random.choice( ['Product 1','Product 2'], 50),
'Units_Sold':np.random.randint(1,100, size=(50)),
'Dollars_Sold':np.random.randint(100,1000, size=50),
'Date':np.random.choice( pd.date_range('1/1/2011','03/31/2011',  
                      freq='D'), 50, replace=False)})

从那里，我创建一个新的 Groupby Dataframe，如下所示：

df1 = df.groupby(['Category','Sub-Category','Product',pd.TimeGrouper(key='Date',freq='M')]).agg({'Units_Sold':'sum','Dollars_Sold':'sum'}).unstack().fillna(0)

我想提供类别和子类别的小计。我可以使用以下代码来做到这一点：

df2 = df1.groupby(level=[0,1]).sum()
df2.index = pd.MultiIndex.from_arrays([df2.index.get_level_values(0),
                                   df2.index.get_level_values(1) + ' Total',
                                   len(df2) * ['']])
df3 = df1.groupby(level=[0]).sum()
df3.index = pd.MultiIndex.from_arrays([df3.index.get_level_values(0) + ' Total',
                                   len(df3) * [''],
                                   len(df3) * ['']])
pd.concat([df1,df2,df3]).sort_index()

这给了我我想要的数据框：最终数据框

我的问题 - 有没有比为每个级别创建一个新的 DataFrame 然后连接在一起更Pythonic 的方法来做到这一点？我对此进行了研究，但找不到更好的方法。我必须对许多不同的多索引数据帧执行此操作，并且正在寻求更好的解决方案。

在此先感谢您的帮助！

编辑附加信息：

感谢@Wen 和@DaFanat 的回复。我尝试使用我的数据上提供的链接@Wen [链接]：Python（Pandas）在多索引数据帧的每个级别上添加小计

pd.concat([df.assign(\
    **{x: 'Total' for x in "CategorySub-CategoryProduct"[i:]}\
    ).groupby(list('abc')).sum() for i in range(1,4)])\
    .sort_index()

这对总数进行了求和，但它忽略了构成第二级列的日期。它给我留下了这个结果。结果图像

我尝试使用 groupby 添加 TimeGrouper ，但这会返回错误。任何帮助将不胜感激。谢谢！

通过将您上面的尝试与@piRSquared 中的示例对齐，我可以让您更接近。

该列表必须与多重索引匹配。试试这个：

iList = ['Category','Sub-Category','Product']
pd.concat([
    df1.assign(
        **{x: '' for x in iList[i:]}
    ).groupby(iList).sum() for i in range(1,4)
]).sort_index()

它没有在正确的位置显示“总计”一词，也没有在每组的底部显示总计，但至少它在功能上或多或少是正确的。我的总计不匹配，因为 DataFrame 中的值是随机的。

我花了一段时间才完成中提供的原始答案Python（Pandas）在多索引数据帧的每个级别上添加小计。但同样的逻辑也适用于此。

allocate() 将列中的值替换为对 MultiIndex 列列表的元素执行的字典理解所返回的字典中的值。
然后 groupby() 只查找那些非空白列的唯一值并对它们进行相应的求和。
这些 groupby 包含在列表理解中，因此 pd.concat() 只需组合这些行集。
sort_index() 将索引标签按升序排列。
（是的，您仍然会收到有关“列名和索引级别”的警告，但它仍然有效。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将小计添加到 Pandas Groupby 的相关文章

如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
如何从 Lua 调用 Python 函数？

我想从我的 lua 文件运行 python 脚本我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
Python 队列 get()/task_done() 问题

我的消费者端队列 m queue get queue task done
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
部署 Flask 应用程序时如何检测额外文件的更改并重新加载应用程序？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 Flask 中构建了一个小型 Web 应用程序并尝试将其部署在 Pythonanywhere 上在开发过程中
Python matplotlib 在鼠标悬停时不显示完整日期

我有一个数据框日期索引 and 温度值 Date Temperature 2015 10 21 9 118 2015 10 22 9 099 2015 10 23 8 945 2015 10 26 8 848 2015 10 27 8 84

随机推荐

根据 Google 表格中单列中的重复项删除行

我有与此类似的电子表格我想根据第一列数据删除行的所有重复项因此在此屏幕截图行中将保留第 1 行和第 2 行并删除第 2 行任何帮助将不胜感激附在我的例子中列从 A 到 AU 行从 2 到 9500 谢谢 Maya s an
如何在同一个循环中同时循环所有 Firebase 子项？

我在 firebase 中有三个节点我想使用相同的循环来循环它们我成功地能够使用以下代码循环遍历单个节点 cookie databaseRef child cookies observeSingleEvent of value with
从 Java 到 PHP 重新创建 PDF 文件

我有一个 Java 中的 WebService 使用 Apache Axis 它获取文档的 id 并调用 JasperReports 来创建 PDF 文件之前在 java 应用程序中创建的报告服务器端以创建我正在使用的方法的报告 Ja
使用 Javascript 删除从不同页面呈现的整个表格

我有一张像这样的桌子 table class toc border 1 table 在许多页面中所有这些页面都呈现在单个页面中当我应用 Javascript 来删除加载时使用的内容时仅删除一张表其他表不会被删除我正在尝试使用 Ja
Azure AD登录后如何重定向到特定页面？

我正在将 Azure AD 登录集成到我的应用程序中我想在成功登录天蓝色广告后重定向到特定操作我的 Startup Auth cs 文件中有以下代码但它没有重定向到redirecturi 任何人都可以建议我如何在成功登录后重定向到自定
Python Tkinter Treeview 添加图像作为列值

我试图将图像添加到树视图上每一行的第一列但无论我做什么最终总是显示对象 pyimage1 的名称而不是实际图像正如这张图片所示我正在使用的代码是这样的 from tkinter import PhotoImage self img
如何使用 jQuery 在 30 分钟内使 cookie 过期？

如何让 Cookie 在 30 分钟内过期我正在使用 jQuery cookie 我能够做这样的事情 cookie example foo expires 1 这是 1 天的时间但是我们如何将到期时间设置为 30 分钟 30分钟是30
在 SQL SERVER 2008 中从字符串转换日期和/或时间时转换失败

我有以下 SQL UPDATE student queues SET Deleted 0 last accessed by raja last accessed on CONVERT VARCHAR 24 23 07 2014 09 37
是否有 C# 中的 JSON Web Token (JWT) 示例？

我觉得我在这里服用了疯狂的药通常对于任何给定的任务网络上总会有一百万个库和示例我正在尝试使用 JSON Web Tokens JWT 来实现 Google 服务帐户的身份验证如下所述here 但是只有 PHP Python 和
使用 C#/.NET 将图像上传到服务器并将文件名存储在数据库中

我目前正在使用以下代码片段将数据插入数据库的表中效果很好但是我想开始添加文件名数据但不确定如何继续我有以下内容 Create command comm new SqlCommand INSERT INTO Entries Titl
基于主机的卡模拟，有什么指导吗？

我是这个领域的新手我有一个 Nexus S CyanogenMod11 Android Kitkat 4 4 2 我需要使用 HCE 基于主机的卡模拟模式来模拟非接触式卡为了实现这一目标我需要遵循的步骤和技巧有什么指导吗我需要对模
如何从 hashCode 中获取字符串

我正在开发一个项目我得到了我的密码字段值hashCode出于安全目的并将该 hashCode 存储在数据库中现在我想从 hashCode 中恢复密码我该怎么做是否可以从 hashCode 中获取 String 值如果不是任何人
为什么docker build后node_modules为空？

为什么我的 docker 数据卷在主机系统上挂载为空当的时候docker compose up完成后我可以执行到 docker 容器并查看node modules目录中我可以看到所有已成功安装的模块但是当我检查我的node modu
有没有办法在 ActionScript 中获取字形的实际边界框？

我正在学习 ActionScript Flash 我喜欢玩弄文本并且使用出色的 Java2D API 做了很多这样的事情我想知道的一件事是你到底在哪里画那个字形 TextField 类提供了方法getBounds and getCha
IE 中的 JQuery 复选框列表问题？保存为 on,on,on 的值应为 10,12,13 等

我有一个使用 javascript 呈现的复选框列表
开发和生产属性

我有一个 GlassFish j2ee 应用程序我在一个盒子上进行开发生产是一个远程盒子我有一个生成文件的函数并且我需要根据我的开发盒或生产情况使文件的位置有所不同有什么自动方法可以进行切换这样我就不必根据部署位置来编辑源文件
春季启动+休眠

我的 Maven 依赖项出了什么问题当我包含 JPA 时我有例外列表这是我的 Maven 依赖项
如何将Hive连接到asp.net项目

你好我对 Hadoop 很陌生我已将 Microsoft HDInsight 安装到本地系统现在我想连接到 hive 和 HBase 但用于 HIVE 连接我必须指定连接字符串端口用户名密码但我无法弄清楚如何获得这个值我尝
Git：在提交/推送之前运行过滤器？

有没有办法在提交之前通过过滤器运行更改的文件我希望确保文件遵循项目的编码标准我还想在提交推送实际发生之前编译并运行一些测试所以我知道存储库中的所有内容实际上都有效预提交挂钩继续阅读git钩子 Git 书籍有一个example例如
将小计添加到 Pandas Groupby

我正在寻找一种更干净的方法来将小计添加到 Pandas groupby 中这是我的数据框 df pd DataFrame Category np random choice Group A Group B 50 Sub Category

将小计添加到 Pandas Groupby

将小计添加到 Pandas Groupby 的相关文章

随机推荐

热门标签