使用 MultiIndex 计算 pandas hub_table 中的小计

2023-12-08

我在数据框中有以下原始数据:

   BROKER    VENUE  QUANTITY
0  BrokerA  Venue_1       300
1  BrokerA  Venue_2       400
2  BrokerA  Venue_2      1400
3  BrokerA  Venue_3       800
4  BrokerB  Venue_2       500
5  BrokerB  Venue_3      1100
6  BrokerC  Venue_1      1000
7  BrokerC  Venue_1      1200
8  BrokerC  Venue_2     17000

我想对数据进行一些汇总,以查看每个经纪人向每个地点发送了多少数据,因此我创建了一个数据透视表:

pt = df.pivot_table(index=['BROKER', 'VENUE'], values=['QUANTITY'], aggfunc=np.sum)

结果,正如预期的那样:

                 QUANTITY
BROKER  VENUE            
BrokerA Venue_1     300.0
        Venue_2    1800.0
        Venue_3     800.0
BrokerB Venue_2     500.0
        Venue_3    1100.0
BrokerC Venue_1    2200.0
        Venue_2   17000.0

我还想知道每个经纪人总共发送了多少金额。并将其显示在同一张表中。我可以通过输入来获取该信息df.groupby('BROKER').sum(),但是如何将其作为名为 BROKER_TOTAL 的列添加到我的数据透视表中?

注意:这个问题很相似,但似乎是旧版本,我根据我的情况调整它的最佳猜测不起作用:Pandas 数据透视表行小计


您可以创建MultiIndex.from_arrays for df1, concat it to pt最后sort_index:

df1 = df.groupby('BROKER').sum()
df1.index = pd.MultiIndex.from_arrays([df1.index + '_total', len(df1.index) * ['']])
print (df1)
                QUANTITY
BrokerA_total       2900
BrokerB_total       1600
BrokerC_total      19200

print (pd.concat([pt, df1]).sort_index())
                       QUANTITY
BROKER        VENUE            
BrokerA       Venue_1       300
              Venue_2      1800
              Venue_3       800
BrokerA_total              2900
BrokerB       Venue_2       500
              Venue_3      1100
BrokerB_total              1600
BrokerC       Venue_1      2200
              Venue_2     17000
BrokerC_total             19200
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 MultiIndex 计算 pandas hub_table 中的小计 的相关文章

  • 使用 Django 的 post_save() 信号

    我有两张桌子 class Advertisement models Model created at models DateTimeField auto now add True author email models EmailField
  • 如何用 python 和 sympy 解决多元不等式?

    我对使用 python 和 Sympy 还很陌生 并且遇到了使用 sympy 解决多元不等式的问题 假设我的文件中有很多函数 如下所示 cst sqrt x 2 cst exp sqrt cst x 1 4 log log sqrt cst
  • 在 python-docx 中搜索和替换

    我有一个包含以下字符串的文档 模板 你好 我的名字是鲍勃 鲍勃是一个很好的名字 我想使用 python docx 打开此文档并使用 查找和替换 方法 如果存在 来更改每个字符串 Bob gt Mark 最后 我想生成一个新文档 其中包含字符
  • Python3 查找 2 个列表中有多少个差异才能相等

    假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到 其中有多少项list2应该改变 以便它等于lis
  • python中函数变量的作用域

    假设我们有两个函数 def ftpConnect ftp FTP server ftp login ftp cwd path def getFileList ftpConnect files ftp nlst print files 如果我
  • 唯一的图像哈希值即使 EXIF 信息更新也不会改变

    我正在寻找一种方法来为 python 和 php 中的图像创建唯一的哈希值 我考虑过对原始文件使用 md5 和 因为它们可以快速生成 但是当我更新 EXIF 信息 有时时区关闭 时 它会更改总和 并且哈希也会更改 有没有其他方法可以为这些文
  • Python:随时接受用户输入

    我正在创建一个可以做很多事情的单元 其中之一是计算机器的周期 虽然我将把它转移到梯形逻辑 CoDeSys 但我首先将我的想法放入 Python 中 我将进行计数 只需一个简单的操作 counter 1 print counter 跟踪我处于
  • 行为:如何从另一个文件导入步骤?

    我刚刚开始使用behave http pythonhosted org behave 一个Pythonic BDD框架 使用小黄瓜语法 http docs behat org guides 1 gherkin html 行为需要一个特征 例
  • Pandas:根据列名进行列的成对乘法

    我有以下数据框 gt gt gt df pd DataFrame ap1 X 1 2 3 4 as1 X 1 2 3 4 ap2 X 2 2 2 2 as2 X 3 3 3 3 gt gt gt df ap1 X as1 X ap2 X a
  • 使用Python将图像转换为十六进制格式

    我的下面有一个jpg文件tmp folder upload path tmp resized test jpg 我一直在使用下面的代码 Method 1 with open upload path rb as image file enco
  • 使用 dict 在数据框中查找行

    df pd DataFrame a 1 2 3 b 4 5 6 produces a b 0 1 4 1 2 5 2 3 6 给定一个字典 d a 2 b 5 我将如何提取数据帧中字典的键值与所有列值匹配的行 所以在这种情况下 a b 1
  • Python While 循环,and (&) 运算符不起作用

    我正在努力寻找最大公因数 我写了一个糟糕的 运算密集型 算法 它将较低的值减一 使用 检查它是否均匀地划分了分子和分母 如果是 则退出程序 但是 我的 while 循环没有使用 and 运算符 因此一旦分子可整除 它就会停止 即使它不是正确
  • 在 Windows 上使用 IPython 笔记本时出现 500 服务器错误

    我刚刚在 Windows 7 Professional 64 位上全新安装了 IPython 笔记本 我采取的步骤是 从以下位置安装 Python 3 4 1http python org http python org gt pip in
  • Python int 太大,无法放入 SQLite

    我收到错误 OverflowError Python int 太大 无法转换为 SQLite INTEGER 来自以下代码块 该文件约25GB 因此必须分部分读取 length 6128765 Works on partitions of
  • 使用 lambda 函数更改属性值

    我可以使用 lambda 函数循环遍历类对象列表并更改属性值 对于所有对象或满足特定条件的对象 吗 class Student object def init self name age self name name self age ag
  • 使用 Doc2vec 后如何解释 Clusters 结果?

    我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式 例如 v1 v100 之后 我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo
  • Plotly:如何避免巨大的 html 文件大小

    我有一个 3D 装箱模型 它使用绘图来绘制输出图 我注意到 绘制了 600 个项目 生成 html 文件需要很长时间 文件大小为 89M 这太疯狂了 我怀疑可能存在一些巨大的重复 或者是由单个项目的 add trace 方法引起的 阴谋 为
  • 是否可以强制浮点数的指数或有效数匹配另一个浮点数(Python)?

    这是我前几天试图解决的一个有趣的问题 是否可以强制一个的有效数或指数float与另一个人一样float在Python中 出现这个问题是因为我试图重新调整一些数据 以便最小值和最大值与另一个数据集匹配 然而 我重新调整后的数据略有偏差 大约小
  • 具有指定置信区间的 Seaborn 条形图

    我想在 Seaborn 条形图上绘制置信区间 但我已经计算出置信区间 如何让 Seaborn 绘制我的置信区间而不是尝试自行计算它们 例如 假设我有以下 pandas DataFrame x pd DataFrame Group 1 0 5
  • 如何使用 Django (Python) 登录表单?

    我在 Django 中构建了一个登录表单 现在我遇到了路由问题 当我选择登录按钮时 表单不会发送正确的遮阳篷 我认为前端的表单无法从 查看 py 文件 所以它不会发送任何 awnser 并且登录过程无法工作 该表单是一个简单的静态 html

随机推荐

  • web.config 何时被读取?

    我正在研究一篇关于 ASP NET Pipeline 的文章 但到目前为止我所涵盖的资源都没有充分解释何时机器级别 应用程序级别 甚至可能是子应用程序级别 web config文件被读取 另外 我的大部分阅读都误导了我寻找默认的 HTTP
  • PHP 中 Bing 搜索的 Windows Azure 身份验证

    我正在尝试使用 Windows Azure Marketplace API 执行 Bing 搜索 我已经下载了他们的指南和示例代码 该代码准备了带有基本身份验证的 HTTPS 请求 但是我不断收到以下错误 Warning file get
  • MSBuild 日志文件位置

    我在构建脚本中运行 msbuild 并收到此错误 MSBUILD error MSB4166 Child node 2 exited prematurely Shutting down Diagnostic information may
  • Three.js - VRControls 集成 - 如何在场景中移动?

    我使用 Three js 在小场景中渲染和移动 我的 OrbitControl 更改了camera position 现在我有眼裂 所以我添加了 VRControls 和 VREffect 移动头部没有问题 但我无法在场景中移动 因为 VR
  • 找不到框架 MicrosoftBandKit_iOS

    Error Ld DerivedData SenseWatch Build Products Debug iphonesimulator SenseWatch app SenseWatch normal x86 64 cd Users Ji
  • MVC 控制器:从 HTTP 主体获取 JSON 对象?

    我们有一个 MVC MVC4 应用程序 有时可能会收到从第 3 方发布到我们特定 URL 的 JSON 事件 http server com events JSON 事件位于 HTTP POST 的正文中 并且正文是严格的 JSON Con
  • 如何通过脚本自动生成临时表列和数据类型

    我经常在 SQL 中创建临时表 并且正在寻找一种为表定义自动生成列名和数据类型的方法 这样我就不必每次都查找它们 例如我运行 SELECT CustomerID ClientID FirstName LastName INTO Test F
  • 为什么 NOT IN (NULL) 总是不返回任何内容

    I have following table And following simple query SELECT FROM dbo Calendars WHERE calname NOT IN NULL 我的问题是为什么总是不在 空 什么都
  • 如何确保 .NET core 2.2 Web API 中仅运行一个 IHostedService 实例

    我有一个 NET Core 2 2 Web API 可以根据需求扩展到多个实例 此 API 有一个后台服务 IHostedService 该服务一次只能在其中一个实例上运行 是否有一种通用的方法或设计模式来确保该服务在任何给定时间点仅在一个
  • 如何在 WCF 中将有限值设置为 maxoccurrs 而不是“无界”

    我有 WCF 服务 当我公开我的服务时 我的所有数据契约都将转换为元素 并且每个带有 ComplextType 标记的元素也会转换为 ArrayOf 在 ComplextType 标记中 maxOccurs 的默认值为 无界 但实际上我想覆
  • 如何将Dataframe转换为Series?

    我想将 N 列转换为一个系列 如何有效地做到这一点 Input 0 1 2 3 0 64 98 47 58 1 80 94 81 46 2 18 43 79 84 3 57 35 81 31 预期输出 0 64 1 80 2 18 3 57
  • 将 System.in 重定向到 swing 组件

    大家好 我正在使用 Swing 和 Apache Commons 制作一个终端应用程序 我能够重定向System out and System err to a JTextArea很容易 但我该怎么做System in 我需要覆盖吗Inpu
  • 从文件路径创建位图/可绘制对象

    我正在尝试从现有文件路径创建位图或可绘制对象 String path intent getStringExtra FilePath BitmapFactory Options option new BitmapFactory Options
  • 更改 JOptionPane 中的图标

    我有一个扩展的类JOptionPane 其中有一个方法调用showConfirmDialog new JFrame JScrollPane jp Friends List 2 0 icon 有没有办法无需调用即可更改图标showConfir
  • R ggplot2 for循环绘制相同的数据

    我已经组合了一个简单的 for 循环来生成一系列图 然后使用 grid arrange 来绘制它们 我有两个问题 绘图的轴正确更改为列名称 但same数据绘制在每个图表上 添加断点并单步执行代码后 它似乎正确递增 所以我不确定为什么 我已将
  • 如何从列表中删除复选框项目

    我的列表中有 50 个列表项 现在我已经检查了 10 个项目 那么当我单击删除按钮时如何从列表视图中删除 删除 这 10 个检查项目 这是我的代码 请查看我的代码和响应错误在哪里 public class BookmarksJokes ex
  • scanf 不等待输入就返回0

    我从来没有用 C 编程过 今天我必须编写一些小代码 程序非常简单 我想将两个整数相加 但是当我试图检查给定的输入是否是数字并且第一个 scanf 返回 0 时 第二个 scanf 也返回 0 而无需等待输入 代码 int main int
  • 有没有一种css3方法可以在y轴上固定,让它在x轴上滚动?

    这个问题已经被问过无数次了 here there and 另一个地方就这样 然而我找不到真正好的答案 通常 我的表格在垂直方向上比视口深得多 我希望能够滚动表格 tbody 而其 thead 保持固定且可见 其中一些表格也比视口宽得多 这里
  • AWS Glue Python Shell 与 Oracle cx_Oracle 的连接问题

    我正在研究 AWS Glue Python Shell 我想将 python shell 与 Oracle 连接 我成功安装了 psycopg2 和 mysql 库 但是当我尝试使用 cx Oracle 连接 Oracle 时 我已成功安装
  • 使用 MultiIndex 计算 pandas hub_table 中的小计

    我在数据框中有以下原始数据 BROKER VENUE QUANTITY 0 BrokerA Venue 1 300 1 BrokerA Venue 2 400 2 BrokerA Venue 2 1400 3 BrokerA Venue 3