过滤 Pandas 数据框聚合

2024-02-17

我有一个 pandas 数据框,我对其进行分组,然后执行聚合计算以获得平均值:

grouped = df.groupby(['year_month', 'company'])
means = grouped.agg({'size':['mean']})

这给了我一个数据框,但我似乎无法将其过滤到我想要的特定公司和year_month:

means[(means['year_month']=='201412')]

给了我一个 KeyError


问题是您的分组基于'year_month' and 'company'。因此在means数据框,year_month and company将成为索引 (MutliIndex) 的一部分。您无法像访问其他列那样访问它们。

一种方法是获取级别的值'year_month'的索引 .例子 -

means.loc[means.index.get_level_values('year_month') == '201412']

Demo -

In [38]: df
Out[38]:
   A  B   C
0  1  2  10
1  3  4  11
2  5  6  12
3  1  7  13
4  2  8  14
5  1  9  15

In [39]: means = df.groupby(['A','B']).mean()

In [40]: means
Out[40]:
      C
A B
1 2  10
  7  13
  9  15
2 8  14
3 4  11
5 6  12

In [41]: means.loc[means.index.get_level_values('A') == 1]
Out[41]:
      C
A B
1 2  10
  7  13
  9  15
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

过滤 Pandas 数据框聚合 的相关文章

  • 通过 Python 与 Windows 控制台应用程序交互

    我在 Windows 上使用 python 2 5 我希望通过 Popen 与控制台进程交互 我目前有一小段代码 p Popen console app exe stdin PIPE stdout PIPE issue command 1
  • 使用 Marshmallow 中的数据更新行 (SQLAlchemy)

    我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法 我还没有找到任何使用 SQLA 和 Marshmallow
  • OpenCV Python 删除图像中的某些对象

    我正在使用带有 opencv 和 numpy 的 python 来检测天文中的星星 例如这个1 https i stack imgur com AKwEJ jpg图片 使用模板匹配 我可以用阈值检测星星 单击 2 2 https i sta
  • 使用 Flask SQLAlchemy 进行表(模型)继承

    我遵循了这个建议question https stackoverflow com questions 1337095 sqlalchemy inheritance但我仍然收到此错误 sqlalchemy exc NoForeignKeysE
  • 如何编写高效的配对算法?

    我需要一种算法的帮助 该算法可以有效地将人们分组 并确保以前的配对不会重复 例如 假设我们有 10 位候选人 candidates 0 1 2 3 4 5 6 7 8 9 并假设我们有一个先前匹配的字典 这样每个键值对即candidate
  • 将 stdout 重定向到 Python 中的文件? [复制]

    这个问题在这里已经有答案了 如何将 stdout 重定向到 Python 中的任意文件 当长时间运行的 Python 脚本 例如 Web 应用程序 从 ssh 会话内启动并处于后台 并且 ssh 会话关闭时 应用程序将引发 IOError
  • Python 中的二进制相移键控

    我目前正在编写一些代码 以使用音频转换通过激光传输消息 文件 和其他数据 我当前的代码使用 python 中 binascii 模块中的 hexlify 函数将数据转换为二进制 然后为 1 发出一个音调 为 0 发出不同的音调 这在理论上是
  • Python:如何重构循环导入

    我有件事可以帮你做engine setState
  • 使用 Pandas 查找自滚动高点以来的周期数

    我在 Pandas 中使用rolling max函数 http pandas pydata org pandas docs stable computation html moving rolling statistics moments
  • python 语言环境奇怪的错误。这究竟是怎么回事?

    所以今天我升级到了 bazaar 2 0 2 我开始收到这条消息 顺便说一句 我在雪豹上 bzr warning unknown locale UTF 8 Could not determine what text encoding to
  • 检查对象数组中的多个属性匹配

    我有一个对象数组 它们都是相同的对象类型 并且它们有多个属性 有没有办法返回一个较小的对象数组 其中所有属性都与测试用例 字符串匹配 无论该属性类型是什么 使用列表理解all http docs python org 3 library f
  • keras 预测内存交换无限期增加

    我使用keras实现了一个分类程序 我有一大组图像 我想使用 for 循环来预测每个图像 然而 每次计算新图像时 交换内存都会增加 我尝试删除预测函数内部的所有变量 并且我确信该函数内部存在问题 但内存仍然增加 for img in ima
  • 超时时杀死或终止子进程?

    我想尽可能快地重复执行子进程 然而 有时这个过程会花费太长的时间 所以我想杀死它 我使用 signal signal 如下所示 ppid pipeexe pid signal signal signal SIGALRM stop handl
  • Python将csv数据导出到文件中

    我有以下运行良好的代码 但我无法修剪数据并将其存储在数据文件中 import nltk tweets love this car this view amazing not looking forward the concert def g
  • pandas apply:函数名是否带引号的区别

    简单数据框定义示例 df pd DataFrame A 2 4 1 B 8 4 1 C 6 2 7 df A B C 0 2 8 6 1 4 4 2 2 1 1 7 尝试理解以下块中函数参数调用的差异 df apply sum df app
  • 写入 UDP 套接字会被阻塞吗?

    如果是的话 在什么条件下 或者 换句话说 在twisted 中运行此代码是否安全 class StatsdClient AbstractStatsdClient def init self host port super StatsdCli
  • 从 subprocess.Popen 获取整个输出

    我通过调用 subprocess Popen 得到了一个有点奇怪的结果 我怀疑这与我对 Python 的陌生有很大关系 args cscript USERPROFILE tools jslint js USERPROFILE tools j
  • 如何在 Python 中解析损坏的 XML?

    我无法影响的服务器发送的 XML 非常损坏 具体来说 Unicode WHITE STAR 将被编码为 UTF 8 E2 98 86 然后使用 Latin 1 转换为 HTML 实体表 我得到的是 acirc 98 86 9 个字节 位于声
  • 在 Gensim 中通过 ID 检索文档的字符串版本

    我正在使用 Gensim 进行一些主题建模 并且已经达到使用 LSI 和 tf idf 模型进行相似性查询的程度 我取回 ID 集和相似点 例如 299501 0 64505910873413086 如何获取与 ID 在本例中为 29950
  • 使用Python的timeit获取“全局名称'foo'未定义”

    我想知道执行一条Python语句需要多少时间 所以我上网查了一下 发现标准库提供了一个名为timeit http docs python org library timeit html旨在做到这一点 import timeit def fo

随机推荐

  • 如何通过C代码从绝对地址读取值

    我想读取存储在绝对值已知的地址处的值 我想知道我怎样才能实现这一目标 例如 如果一个值存储在 0xff73000 处 那么是否可以通过C代码取出这里存储的值呢 提前致谢 两种方式 1 将地址文字转换为指针 char value char 0
  • 处理 CUDA 中的大型 switch 语句

    我知道不建议在 CUDA 中进行分支 因为它会对性能产生不利影响 在我的工作中 我发现自己必须实现包含数十个案例的大型 switch 语句 有谁知道这会对性能产生多么严重的影响 官方文档不是很具体 还有人有更有效的方法来处理这部分吗 GPU
  • 我应该如何使用 Swift 枚举实现默认关联值?

    Swift 的问题是有一种方法可以让枚举类型具有一个可以具有关联值的情况 我有一个 API 可以为我提供可用的过滤器 该 API 不太可能但有可能添加其他过滤器类型 因此 如果 API 发送未知的过滤器类型 我希望将该信息与枚举相关联 以下
  • “模块”对象没有属性“PortScanner”

    我使用 Ubuntu 12 04 并安装了 python nmap 来创建脚本 如果我使用 IDLE 并输入以下内容 它运行良好 import nmap nm nmap PortScanner nm scan 127 0 0 1 22 44
  • 为什么 unsignedshort(乘法)unsignedshort 转换为signedint? [复制]

    这个问题在这里已经有答案了 Why is unsigned short unsigned short转换成int在 C 11 中 The int太小而无法处理最大值 如这行代码所示 cout lt lt USHRT MAX USHRT MA
  • 使用 Javascript 以编程方式创建 SVG 标记

    是否可以使用 Javascript 在 SVG 中创建标记 然后将其应用到新创建的行 如果是这样 请告诉我下面的代码有什么问题 我希望红线和绿线都有箭头 但在 Chrome 和 Firefox 3 6 中只有绿线有 gt
  • 承诺是否会被延迟评估?

    下面的代码是否保证输出HERE var p new Promise gt console log HERE 也就是说 var p new Promise fn 总是执行fn if p then 从未被要求对结果做某事 更具体地说 在服务人员
  • 如何检测 jQuery UI 对话框的 (X) 关闭按钮被单击,与dialogclose/dialogbeforeclose 事件分开?

    我希望能够检测到被单击的 jQuery UI 对话框的 x 关闭按钮 但我不想使用dialogclose dialogbeforeclose事件 因为我相信无论对话框如何关闭 这些事件都会触发 I tried ui dialog title
  • 使用python日志记录模块将消息发送到一个文件并将错误发送到另一个文件[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我发现了一些类似的示例将消息记录到多个文件 但没有什么完全符合我想要的 我正在使用日志记录模块 并将所有信息消息记录到控制台和文件中 我稍后
  • 登录一次并在首次登录后每次应用程序启动时跳过登录布局

    我正在编写一个 android 应用程序 我想使用 facebook sdk 3 集成 facebook 登录 我已经尝试了很多教程 但现在成功了 任何人都可以给我一个 完整的指南 通过它我可以实现以下目标 登录活动 如果用户从此活动登录一
  • Spring boot 2.0.0.M6 OAuth2 Web 应用程序客户端。不再有@EnableOauth2Sso;如何更换?

    我已经在 Spring 5 和 Spring boot 2 0 0 M3 中构建了身份验证服务和 Web 应用程序 我正在尝试将其移植到Spring boot 2 0 0 M6 now 我注意到 EnableOauth2Sso不再可用spr
  • 完成 UI Activity 分配 [关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我有一个 Android 编程 UI 实验室 我正在尝试完成它 我想我很近 但又很远 我正在处理四项活动 但只需要完成其中三项 这是我所拥有
  • titan 1.0.0 中的 gremlin 并未在 Windows 上开箱即用

    我正在关注http s3 thinkaurelius com docs titan 1 0 0 getting started html http s3 thinkaurelius com docs titan 1 0 0 getting
  • SNS 的自我限制消息长时间未发送会怎样?

    假设我有一个 SNS 我使用该属性进行自我限制maxReceivesPerSecond 假设我们的生产率非常高 但由于节流 消耗非常慢 这可能会导致某些消息在 SNS 中停留很长时间 我看到了这个所以答案 https stackoverfl
  • 如何针对特定来电提供定制振动

    该程序的功能如下 用户有一个电话号码列表 只有当没有其他系统范围的应用程序提供振动 例如在静音模式下 时 手机才会在来电时振动 我知道这在某种程度上违反了规则 因为应用程序应该尊重用户的设置 但应用程序仅限于某些有此需求的用户 我尝试了两种
  • 返回此意外输出的 CUDA 代码发生了什么情况?

    终于让动态并行性启动并运行后 我现在正在尝试用它来实现我的模型 我花了一段时间才发现一些奇怪的输出是由于需要使用 cudaDeviceSynchronize 让父内核等待子内核完成而导致的 我定义为 arrAdd 的设备函数似乎有问题 下面
  • 如何更改删除+添加以在git历史记录中移动

    我有一个 git 存储库 它是一些旧的 svn 存储库的混合体 当我混合所有内容时 我没有意识到要执行 git mv 而不是仅仅移动文件 所以现在大多数文件的 svn 历史记录都丢失了 有办法解决这个问题吗 旧的结构是这样的 svn1 ap
  • 如何从 Linux 访问 Team Foundation Server (TFS)

    如果这个问题不是特定于 VCS 的 因此程序员比系统管理员更了解这种问题 那么我会问有关服务器故障或超级用户的问题 也就是说 如何从 Linux 访问 TFS 是否有一个可以在 Linux 上运行的客户端应用程序 或者一个可以在 Windo
  • SQL Server 的数据生成器? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 过滤 Pandas 数据框聚合

    我有一个 pandas 数据框 我对其进行分组 然后执行聚合计算以获得平均值 grouped df groupby year month company means grouped agg size mean 这给了我一个数据框 但我似乎无