对多索引 pandas 数据帧上的重复行求和

2024-04-09

你好，我在处理熊猫方面遇到了麻烦。我正在尝试对多索引数据帧上的重复行进行求和。我尝试过df.groupby(level=[0,1]).sum()，还与df.stack().reset_index().groupby(['year', 'product']).sum()和其他一些，但我无法让它工作。我还想添加每个给定年份的每个独特产品，如果未列出，则为它们指定 0 值。

示例：具有多索引和 3 种不同产品（A、B、C）的数据框：

                  volume1    volume2
year   product
2010   A          10         12
       A          7          3
       B          7          7
2011   A          10         10
       B          7          6
       C          5          5

预期输出：如果给定年份有重复的产品，那么我们将它们相加。如果其中一个产品一年未列出，我们将创建一个全为 0 的新行。

                  volume1     volume2
year   product
2010   A          17          15
       B          7           7
       C          0           0
2011   A          10          10
       B          7           6
       C          5           5

任何想法？谢谢

您可以将索引的第二级设为CategoricalIndex当你使用groupby它将包括所有类别。

df.index.set_levels(pd.CategoricalIndex(df.index.levels[1]), 1, inplace=True)
df.groupby(level=[0, 1]).sum().fillna(0, downcast='infer')

              volume1  volume2
year product                  
2010 A             17       15
     B              7        7
     C              0        0
2011 A             10       10
     B              7        6
     C              5        5

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

multiindex

对多索引 pandas 数据帧上的重复行求和的相关文章

如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
如何使用 django Rest 框架保存多对多字段对象

我有博客发布标签三个模型在博客模型中我将字段 postedin 作为发布模型的外键将标签作为标签模型的许多字段模型 py class Posted models Model name models CharField Pos
使用 Python 打开新窗口时，selenium window_handles 不正确

我想使用 selenium 和 Python 在一个浏览器中打开多个选项卡并通过多个选项卡同时抓取实时投注赔率网站主页生成游戏列表但是除非您找到游戏元素并使用 click 该网站是 ajax 密集型否则无法获取游戏链接这会在同一
ipython/jupyter 中的 tk 问题

我正在尝试编写一个用于从 ipython jupyter 笔记本启动的 gui 但在笔记本中使用 tkinter 时遇到了麻烦特别是在让 tk gui 窗口正常关闭方面如何从 jupyter 制作启动 tkinter gui 然后在不
我可以在pycharm中的断点处进入交互模式吗

我是一个相当新的 Pycharm 3 用户正在从事 django 项目我可以在 pycharm3 中的断点处进入交互模式吗这可能吗当程序在断点处停止时我尝试过工具 gt 打开调试命令行但我没有看到控制台打开我怎样才能让它发挥作
如何使用Peewee查询多个相似的数据库？

我遇到了使用 Peewee 查询多个数据库的问题我有 2 个现有的 mysql 数据库让我们将它们命名为 A 和 B 结构相似因为它是两个 Bugzilla 数据库我使用 Pwiz 生成模型 modelsA py 和 modelsB
使用 python boto3 管理 Route53 中具有多个 IP 的 A 记录

我的route53中有一条A记录后面有多个IP 例子 A record dummy xyz com 点IPs 1 1 1 1 2 2 2 2 和 3 3 3 3路由策略 Simple 我使用下面的代码来更新单个 IP 的记录 Change
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
如何在solidpython中设置特殊变量$fa、$fs、$fn

in 上一个线程 https stackoverflow com questions 54040390 how to save data in stl file after python solid processing显示了如何通过 So
自动创建带有文件输出的目录[重复]

这个问题在这里已经有答案了假设我想制作一个文件 filename foo bar baz txt with open filename w as f f write FOOBAR 这给出了一个IOError since foo bar不存
在 Python 中通过网络发送对象的最佳方式是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我需要通过网络发送对象我将使用 Twisted 并且我刚刚开始查看它的文档据我所知 python实现套接字的唯一方式是通过文本那么我如何使
在解析器/子解析器的开头使用 argparse.REMAINDER

我想实现一个 arg 解析器它允许我将单元测试作为子命令之一运行盲目地将参数传递给 unittest main 例如 foo py unittest args to pass to unittest main 以及其他子命令 foo p
AppEngine 警告 - OpenBLAS 警告 - 无法确定该系统上的 L2 缓存大小

我尝试在 GC AppEngine 上部署应用程序部署过程中没有错误但应用程序无法运行仅显示加载页面日志中唯一一个奇怪的原始日志 OpenBLAS WARNING could not determine the L2 cache s
如何在 Python 中连接两个列表？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动如何在 Python 中连接两个列表 Example listone 1 2 3 lis
启动客户端时，代码要求提供电话/机器人令牌

使用 Telethon 库运行我的第一个代码时它要求提供机器人令牌这是实际的代码 from telethon import TelegramClient events sync api id 1234567 api hash xxxxx
如何从 PyObject 获取指向字符串的 char*

我怎样才能得到一个char from a PyObject它指向一个字符串例如这是 python 脚本 Test Connect 272 22 20 65 1234 这是 C 代码 static PyObject Connect PyO
重写 __cmp__ python 函数

嗨我是压倒一切的 cmp 如果传递的第二个对象是None 或者如果它不是一个实例someClass 然后返回 1 我不明白这里到底发生了什么 class someClass def cmp self obj if obj None ret
在不同进程之间共享列表？

我有以下问题我编写了一个函数它将列表作为输入并为列表中的每个元素创建一个字典然后我想将这本字典附加到一个新列表中这样我就得到了一个字典列表我正在尝试为此生成多个进程我的问题是我希望不同的进程访问由其他进程更新的字典列表例如
我可以以某种方式“编译”一个Python脚本以在没有安装Python的PC上运行吗？

所以我有一个Python脚本 myscript py 我是这样执行的 python D myscript py 但是我必须安装 Python 并将其包含在PATH使其工作的环境变量是否有可能以某种方式将 Python 可执行文件与 Py

随机推荐

为什么 JSON_UNESCAPED_LINE_TERMINATORS 没有转义我的换行符？

基于文档 http docs php net manual en json constants php 我预计JSON UNESCAPED LINE TERMINATORS保留换行符 n 字符未转义因此在编码 JSON 时作为实际换行符
C# 中的异步递归安全吗（异步 ctp/.net 4.5）？

在使用 async ctp 或 vs net 2011 beta 的 C 中我们可以编写如下递归代码 public async void AwaitSocket var socket await this AcceptSocketAsyn
bindActionCreators 和 mapDispatchToProps - 我需要它们吗？

我正在查看一个 React Redux 应用程序并尝试了解一切是如何工作的在其中一个组件中我看到了以下几行代码 import bindActionCreators from redux function mapDispatchToPr
在本地项目文件夹中加载 JSON 时使用 Angular 2 http 离线

我一直在尝试使用 http get 方法加载 Angular 2 项目文件夹中存在的本地 json 文件看下面的示例代码片段 private productURL api products products json getProduct
如何在 WinDbg 的启动命令行中打开转储时转义引号

下列的这个答案 https stackoverflow com questions 2655168 how do i make a cmdtree window dock at startup in windbg 我正在尝试建立一个 dmp
mkdir()：权限被拒绝

我的服务器上的所有文件都有 777 PHP 5 4 无安全模式网站可以在其他服务器上运行这是 Yii 框架 mkdir Permission denied var www html project framework web CAsse
Mod Rewrite，将参数从 URL1 传递到 URL2

我正在尝试重写以下网址 test php par1 foo par2 bar Into newtest php hidden par blah par1 foo par2 bar 我有这条规则但不起作用 RewriteRule test
无法确定要使用哪个版本的 ASP.NET 网页

我的 VS2013 项目发生了奇怪的事情我最近将我的项目分支之一从 NET 4 0 升级到 4 5 1 并使用 NuGet 包管理器安装带有 Razor 的 MVC 5 这样我就可以拥有 WebForms MVC 混合体到目前为止它运
Wpf GridSplitter 替换 row.height 属性上的绑定

我在网格分割器方面遇到了困难我已经绑定了RowDefinition Height模型的 clr 属性的依赖属性如下所示
有没有办法将 jq 输出到 bash 脚本的多个变量中？

基本上我有一个 bash 脚本它在某一时刻进行 API 调用并生成证书和密钥并以 json 形式返回我将其通过管道传输到 jq 并可以选择证书或密钥并将其存储在变量中像这样的事情 CERT API call jq r certifi
Go 运行时错误：“分配给 nil 映射中的条目”

我是 go lang 的新手我正在尝试读取 csv 文件并收集数据但运行后我得到了这个错误 panic assignment to entry in nil map goroutine 1 running panic 0x4dedc0
登录 DBCP

我正在使用 Apache Commons DBCP 有一个任务来跟踪 DBCP 的内部行为活动和空闲连接的数量我发现 DBCP 根本没有任何此类日志记录是的当从池中借用连接时可以编写输出 BasicDataSource 状态的代码
替换 JQueryUI 对话框的关闭图标

经过对这个主题的广泛搜索后我无法找到答案所以希望有人可以帮助我解决这个问题我有一个相对基本的对话框 dialog search dialog resizable false height dimensionData height wi
使用掺杂向量访问多维数组的任意轴向切片？

我正在构建一套功能来与多维数组数据结构 https stackoverflow com questions 30023867 how can i work with dynamically allocated arbitrary dimen
“enum class”是 C++ 中的类类型吗？

我读到了 C 中的枚举声明使用参考参数 http en cppreference com w cpp language enum 然后我做了枚举类并使用检查它是否是类类型std is class include
有没有更简单的方法来访问 R 中类的属性，我可以使用点表示法吗？

我在 R 中创建了一个包含多个属性的对象我怎样才能轻松访问它们我可以 attr x attributeName or attributes x attributeName 但它们都不是真正方便的有没有更快的方法如 C 或 Java
无法让属性字符串在 Swift 中工作

我试图在代码中设置字符串的一些属性但无法得到NSAttributedString上班这是应该更改字符串的函数 func getAttributedString string String gt NSAttributedString va
实体框架代码首先迁移抛出错误

这是我在收到此错误之前所做的操作安装了 EF 预发布版本可能是 6 我不知道决定我不想要所以卸载它并重新安装稳定版本 5 通过 SSMS 截断我的数据库这是错误 Exception calling CreateInstanceFr
使用 Spring MVC 应用程序实现 Tiles 3

我正在尝试在 Spring MVC 应用程序中实现 Apache Tiles 3 因此我在 pom xml 文件中添加了以下依赖项
对多索引 pandas 数据帧上的重复行求和

你好我在处理熊猫方面遇到了麻烦我正在尝试对多索引数据帧上的重复行进行求和我尝试过df groupby level 0 1 sum 还与df stack reset index groupby year product sum 和其他一

对多索引 pandas 数据帧上的重复行求和

对多索引 pandas 数据帧上的重复行求和 的相关文章

随机推荐

热门标签

对多索引 pandas 数据帧上的重复行求和的相关文章