过滤 Pandas 数据框聚合

2024-02-17

我有一个 pandas 数据框，我对其进行分组，然后执行聚合计算以获得平均值：

grouped = df.groupby(['year_month', 'company'])
means = grouped.agg({'size':['mean']})

这给了我一个数据框，但我似乎无法将其过滤到我想要的特定公司和year_month：

means[(means['year_month']=='201412')]

给了我一个 KeyError

问题是您的分组基于'year_month' and 'company'。因此在means数据框，year_month and company将成为索引 (MutliIndex) 的一部分。您无法像访问其他列那样访问它们。

一种方法是获取级别的值'year_month'的索引 .例子 -

means.loc[means.index.get_level_values('year_month') == '201412']

Demo -

In [38]: df
Out[38]:
   A  B   C
0  1  2  10
1  3  4  11
2  5  6  12
3  1  7  13
4  2  8  14
5  1  9  15

In [39]: means = df.groupby(['A','B']).mean()

In [40]: means
Out[40]:
      C
A B
1 2  10
  7  13
  9  15
2 8  14
3 4  11
5 6  12

In [41]: means.loc[means.index.get_level_values('A') == 1]
Out[41]:
      C
A B
1 2  10
  7  13
  9  15

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

过滤 Pandas 数据框聚合的相关文章

通过 Python 与 Windows 控制台应用程序交互

我在 Windows 上使用 python 2 5 我希望通过 Popen 与控制台进程交互我目前有一小段代码 p Popen console app exe stdin PIPE stdout PIPE issue command 1
使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
OpenCV Python 删除图像中的某些对象

我正在使用带有 opencv 和 numpy 的 python 来检测天文中的星星例如这个1 https i stack imgur com AKwEJ jpg图片使用模板匹配我可以用阈值检测星星单击 2 2 https i sta
使用 Flask SQLAlchemy 进行表（模型）继承

我遵循了这个建议question https stackoverflow com questions 1337095 sqlalchemy inheritance但我仍然收到此错误 sqlalchemy exc NoForeignKeysE
如何编写高效的配对算法？

我需要一种算法的帮助该算法可以有效地将人们分组并确保以前的配对不会重复例如假设我们有 10 位候选人 candidates 0 1 2 3 4 5 6 7 8 9 并假设我们有一个先前匹配的字典这样每个键值对即candidate
将 stdout 重定向到 Python 中的文件？ [复制]

这个问题在这里已经有答案了如何将 stdout 重定向到 Python 中的任意文件当长时间运行的 Python 脚本例如 Web 应用程序从 ssh 会话内启动并处于后台并且 ssh 会话关闭时应用程序将引发 IOError
Python 中的二进制相移键控

我目前正在编写一些代码以使用音频转换通过激光传输消息文件和其他数据我当前的代码使用 python 中 binascii 模块中的 hexlify 函数将数据转换为二进制然后为 1 发出一个音调为 0 发出不同的音调这在理论上是
Python：如何重构循环导入

我有件事可以帮你做engine setState
使用 Pandas 查找自滚动高点以来的周期数

我在 Pandas 中使用rolling max函数 http pandas pydata org pandas docs stable computation html moving rolling statistics moments
python 语言环境奇怪的错误。这究竟是怎么回事？

所以今天我升级到了 bazaar 2 0 2 我开始收到这条消息顺便说一句我在雪豹上 bzr warning unknown locale UTF 8 Could not determine what text encoding to
检查对象数组中的多个属性匹配

我有一个对象数组它们都是相同的对象类型并且它们有多个属性有没有办法返回一个较小的对象数组其中所有属性都与测试用例字符串匹配无论该属性类型是什么使用列表理解all http docs python org 3 library f
keras 预测内存交换无限期增加

我使用keras实现了一个分类程序我有一大组图像我想使用 for 循环来预测每个图像然而每次计算新图像时交换内存都会增加我尝试删除预测函数内部的所有变量并且我确信该函数内部存在问题但内存仍然增加 for img in ima
超时时杀死或终止子进程？

我想尽可能快地重复执行子进程然而有时这个过程会花费太长的时间所以我想杀死它我使用 signal signal 如下所示 ppid pipeexe pid signal signal signal SIGALRM stop handl
Python将csv数据导出到文件中

我有以下运行良好的代码但我无法修剪数据并将其存储在数据文件中 import nltk tweets love this car this view amazing not looking forward the concert def g
pandas apply：函数名是否带引号的区别

简单数据框定义示例 df pd DataFrame A 2 4 1 B 8 4 1 C 6 2 7 df A B C 0 2 8 6 1 4 4 2 2 1 1 7 尝试理解以下块中函数参数调用的差异 df apply sum df app
写入 UDP 套接字会被阻塞吗？

如果是的话在什么条件下或者换句话说在twisted 中运行此代码是否安全 class StatsdClient AbstractStatsdClient def init self host port super StatsdCli
从 subprocess.Popen 获取整个输出

我通过调用 subprocess Popen 得到了一个有点奇怪的结果我怀疑这与我对 Python 的陌生有很大关系 args cscript USERPROFILE tools jslint js USERPROFILE tools j
如何在 Python 中解析损坏的 XML？

我无法影响的服务器发送的 XML 非常损坏具体来说 Unicode WHITE STAR 将被编码为 UTF 8 E2 98 86 然后使用 Latin 1 转换为 HTML 实体表我得到的是 acirc 98 86 9 个字节位于声
在 Gensim 中通过 ID 检索文档的字符串版本

我正在使用 Gensim 进行一些主题建模并且已经达到使用 LSI 和 tf idf 模型进行相似性查询的程度我取回 ID 集和相似点例如 299501 0 64505910873413086 如何获取与 ID 在本例中为 29950
使用Python的timeit获取“全局名称'foo'未定义”

我想知道执行一条Python语句需要多少时间所以我上网查了一下发现标准库提供了一个名为timeit http docs python org library timeit html旨在做到这一点 import timeit def fo

随机推荐

如何通过C代码从绝对地址读取值

我想读取存储在绝对值已知的地址处的值我想知道我怎样才能实现这一目标例如如果一个值存储在 0xff73000 处那么是否可以通过C代码取出这里存储的值呢提前致谢两种方式 1 将地址文字转换为指针 char value char 0
处理 CUDA 中的大型 switch 语句

我知道不建议在 CUDA 中进行分支因为它会对性能产生不利影响在我的工作中我发现自己必须实现包含数十个案例的大型 switch 语句有谁知道这会对性能产生多么严重的影响官方文档不是很具体还有人有更有效的方法来处理这部分吗 GPU
我应该如何使用 Swift 枚举实现默认关联值？

Swift 的问题是有一种方法可以让枚举类型具有一个可以具有关联值的情况我有一个 API 可以为我提供可用的过滤器该 API 不太可能但有可能添加其他过滤器类型因此如果 API 发送未知的过滤器类型我希望将该信息与枚举相关联以下
“模块”对象没有属性“PortScanner”

我使用 Ubuntu 12 04 并安装了 python nmap 来创建脚本如果我使用 IDLE 并输入以下内容它运行良好 import nmap nm nmap PortScanner nm scan 127 0 0 1 22 44
为什么 unsignedshort（乘法）unsignedshort 转换为signedint？ [复制]

这个问题在这里已经有答案了 Why is unsigned short unsigned short转换成int在 C 11 中 The int太小而无法处理最大值如这行代码所示 cout lt lt USHRT MAX USHRT MA
使用 Javascript 以编程方式创建 SVG 标记

是否可以使用 Javascript 在 SVG 中创建标记然后将其应用到新创建的行如果是这样请告诉我下面的代码有什么问题我希望红线和绿线都有箭头但在 Chrome 和 Firefox 3 6 中只有绿线有 gt
承诺是否会被延迟评估？

下面的代码是否保证输出HERE var p new Promise gt console log HERE 也就是说 var p new Promise fn 总是执行fn if p then 从未被要求对结果做某事更具体地说在服务人员
如何检测 jQuery UI 对话框的 (X) 关闭按钮被单击，与dialogclose/dialogbeforeclose 事件分开？

我希望能够检测到被单击的 jQuery UI 对话框的 x 关闭按钮但我不想使用dialogclose dialogbeforeclose事件因为我相信无论对话框如何关闭这些事件都会触发 I tried ui dialog title
使用python日志记录模块将消息发送到一个文件并将错误发送到另一个文件[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我发现了一些类似的示例将消息记录到多个文件但没有什么完全符合我想要的我正在使用日志记录模块并将所有信息消息记录到控制台和文件中我稍后
登录一次并在首次登录后每次应用程序启动时跳过登录布局

我正在编写一个 android 应用程序我想使用 facebook sdk 3 集成 facebook 登录我已经尝试了很多教程但现在成功了任何人都可以给我一个完整的指南通过它我可以实现以下目标登录活动如果用户从此活动登录一
Spring boot 2.0.0.M6 OAuth2 Web 应用程序客户端。不再有@EnableOauth2Sso；如何更换？

我已经在 Spring 5 和 Spring boot 2 0 0 M3 中构建了身份验证服务和 Web 应用程序我正在尝试将其移植到Spring boot 2 0 0 M6 now 我注意到 EnableOauth2Sso不再可用spr
完成 UI Activity 分配 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我有一个 Android 编程 UI 实验室我正在尝试完成它我想我很近但又很远我正在处理四项活动但只需要完成其中三项这是我所拥有
titan 1.0.0 中的 gremlin 并未在 Windows 上开箱即用

我正在关注http s3 thinkaurelius com docs titan 1 0 0 getting started html http s3 thinkaurelius com docs titan 1 0 0 getting
SNS 的自我限制消息长时间未发送会怎样？

假设我有一个 SNS 我使用该属性进行自我限制maxReceivesPerSecond 假设我们的生产率非常高但由于节流消耗非常慢这可能会导致某些消息在 SNS 中停留很长时间我看到了这个所以答案 https stackoverfl
如何针对特定来电提供定制振动

该程序的功能如下用户有一个电话号码列表只有当没有其他系统范围的应用程序提供振动例如在静音模式下时手机才会在来电时振动我知道这在某种程度上违反了规则因为应用程序应该尊重用户的设置但应用程序仅限于某些有此需求的用户我尝试了两种
返回此意外输出的 CUDA 代码发生了什么情况？

终于让动态并行性启动并运行后我现在正在尝试用它来实现我的模型我花了一段时间才发现一些奇怪的输出是由于需要使用 cudaDeviceSynchronize 让父内核等待子内核完成而导致的我定义为 arrAdd 的设备函数似乎有问题下面
如何更改删除+添加以在git历史记录中移动

我有一个 git 存储库它是一些旧的 svn 存储库的混合体当我混合所有内容时我没有意识到要执行 git mv 而不是仅仅移动文件所以现在大多数文件的 svn 历史记录都丢失了有办法解决这个问题吗旧的结构是这样的 svn1 ap
如何从 Linux 访问 Team Foundation Server (TFS)

如果这个问题不是特定于 VCS 的因此程序员比系统管理员更了解这种问题那么我会问有关服务器故障或超级用户的问题也就是说如何从 Linux 访问 TFS 是否有一个可以在 Linux 上运行的客户端应用程序或者一个可以在 Windo
SQL Server 的数据生成器？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
过滤 Pandas 数据框聚合

我有一个 pandas 数据框我对其进行分组然后执行聚合计算以获得平均值 grouped df groupby year month company means grouped agg size mean 这给了我一个数据框但我似乎无

过滤 Pandas 数据框聚合

过滤 Pandas 数据框聚合 的相关文章

随机推荐

热门标签

过滤 Pandas 数据框聚合的相关文章