多索引数据帧删除每组最大值的行

2024-01-11

我有一个像这样的多索引数据框：

PID    Fid    x      y

  A      1    2      3
         2    6      1
         3    4      6
  B      1    3      5
         2    2      4
         3    5      7

我想删除每个患者 (PID) 具有最高 x 值的行。我需要获取一个包含剩余行和所有列的新数据框，以继续对这些数据进行分析，例如剩余 y 值的平均值。数据框应如下所示：

PID    Fid    x      y

  A      1    2      3
         3    4      6
  B      1    3      5
         2    2      4

我使用的代码来自Python多索引数据框删除最大值 https://stackoverflow.com/questions/49669129/python-multiindex-dataframe-remove-maximum

idx = (df.reset_index('Fid')
                   .groupby('PID')['x']
                   .max()
                   .reset_index()
                   .values.tolist())
df_s = df.loc[df.index.difference(idx)]

我可以获取 idx，但不能将它们从数据框中删除。它说 TypeError: unhashable type: 'list'

我做错了什么？

你可以试试这个：

idx = df.groupby(level=0)['x'].idxmax()
df[~df.index.isin(idx)]

         x  y
PID Fid      
A   1    2  3
    3    4  6
B   1    3  5
    2    2  4

您可以使用pd.Index.difference here.

df.loc[df.index.difference(df['x'].groupby(level=0).idxmax())] #Use level=0 if index is unnamed
                                         #('PID').idxmax())] 
         x  y
PID Fid      
A   1    2  3
    3    4  6
B   1    3  5
    2    2  4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

multiindex

多索引数据帧删除每组最大值的行的相关文章

如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
Python grpc protobuf 存根生成问题：--grpc_out: protoc-gen-grpc: 插件失败，状态代码 1

正如问题所说我从源代码编译了 grpc 并且也做了sudo pip install grpcio 但是那which grpc python plugin不返回任何内容这是一个问题因为route guide的grpc python示例
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
蜘蛛内的Scrapyd jobid值

Scrapy 框架 Scrapyd 服务器我在获取蜘蛛内部的 jobid 值时遇到一些问题将数据发布到后http localhost 6800 schedule json http localhost 6800 schedule jso
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
在python中安装scipy模块时出错

我正在尝试使用 pip 在 python 中安装 scipy 模块它显示以下错误 Command c users sony appdata local programs python python35 32 python exe u c
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
Python matplotlib 在鼠标悬停时不显示完整日期

我有一个数据框日期索引 and 温度值 Date Temperature 2015 10 21 9 118 2015 10 22 9 099 2015 10 23 8 945 2015 10 26 8 848 2015 10 27 8 84
通过 ManyToManyField = Value 对 django 查询集进行排序

如果有一些模型例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many

随机推荐

函数默认模板参数可以放在非默认模板参数之前吗？

以下代码在 gcc 4 7 1 上编译 struct X template
如何使用设备相机在 iPhone 应用程序中以编程方式拍照？

在 iPhone 应用程序中我们可以采取pictures在某些特定的时间间隔以编程方式通过使用iPhone 设备相机如果是的话请告诉我如何在 iPhone 应用程序中以编程方式拍照请帮助和建议 Thanks UIImagePicker
Python 习语“if __name__ == '__main__'”在 clojure 中的等价物是什么？

我正在涉足 clojure 并且在尝试确定与这种常见 python 习惯用法等效的 clojure 和或 Lisp 时遇到了一些麻烦习惯用法是在 python 模块的底部通常有一些测试代码然后是运行该代码的语句例如 mymodul
片段已添加，对话框片段？

我有一个显示良好的对话框片段但有时当我尝试显示它时我不断收到IllegalStateException 下面是日志猫 java lang IllegalStateException Fragment already added Sele
如何阻止 PHP sleep() 影响我的整个 PHP 代码？

所以在我的街机上 howlingdoggames com 我有一个积分系统每次您访问正在进行游戏的页面时都会给您一个积分为了减少滥用我想进行某种延迟因此仅在 45 秒后授予这是我尝试过的 if SESSION lastgame
当没有这样的条件调用时，useEffect Hook 条件调用的 React 错误

React 正在抱怨下面的代码说它useEffect有条件地被调用 import React useEffect from react import ReactDOM from react dom function App const d
AWS 快照和 AMI 之间的区别

所以我很难弄清楚这两者之间的具体区别是什么据我了解快照只是磁盘驱动器的备份而 AMI 是整个系统或者我应该说的实例的备份但整个系统在技术上不是完全位于磁盘驱动器上吗如果是这样的话那么没有明显的区别我错过了一些东西吗有两种
获取 AWS CodeBuild 的 GitHub git 分支

我将 AWS CodeBuild 设置为从 GitHub 自动构建其他 CI 服务为分支提供了环境变量但我找不到适用于 AWS CodeBuild 的环境变量有一个CODEBUILD SOURCE VERSION设置为pr 7 whe
Bash 不会自动完成文件（Tab）

bash 中的自动完成功能使用 Tab 适用于文件夹但是not与文件我运行的是 Ubuntu 13 10 我还没碰过我的 bashrc file 底部的部分是这样的 bashrc文件看起来与bash 完成安装和更新的部分 enabl
Javascript深度复制对象[重复]

这个问题在这里已经有答案了可能的重复克隆 JavaScript 对象最有效的方法是什么 https stackoverflow com questions 122102 what is the most efficient way to
在 Qt 中显示图像以适合标签大小

我已经尝试了几种在表单上显示图像的方法但没有一个能按照我想要的方式工作我读过很多地方最简单的方法是创建标签并使用它来显示图像我有一个标签其大小由布局指定但是如果我使用像素图将图像加载到其中则标签的大小将调整为图像的大小如果我
如何使用 Boost 库智能指针管理对象生命周期？

有一个场景我需要使用shared ptr和weak ptr智能指针来解决两个线程线程 1 和 2 正在使用名为 A 的共享对象每个线程都有对该对象的引用线程 1 决定删除对象 A 但同时线程 2 可能正在使用它如果我使用share
SignalR 连续消息传递

我有一个网络项目需要从外部肥皂服务更新网页上的统计信息日志我决定采用的方法是使用 signalR 通过使用执行服务方法并将结果返回给所有连接的客户端的代码该代码将连续执行在服务调用之间有一定的延迟我无法将所有部分放在一起可能是
为什么 Visual Studio Code Git 显示驱动器上的所有更改？

我在 Macbook 上使用 Visual Studio Code 1 6 0 我发现 VS Code 的 Git 列出了大量更改甚至是那些不在我的工作文件夹中的更改当我将鼠标悬停在这些上时我会得到一个工具提示该文件位于当前工作区之
按顺序拆分 Parallel.Foreach 循环上的负载

我需要处理列表中的一百万个元素将它们粗暴地扔进并行 ForEach只会让CPU饱和相反我将元素主列表分成几部分并将子列表放入并行循环中 List
我可以在 SSRS 中跨数据源“加入”吗？

我有两个数据源一个 Oracle 和一个 Sql Server 由于我之前的情况就像我发现它时的情况一样 Oracle 数据库中的某些列包含来自 Sql Server 数据库中的查找表的 PK 我正在尝试创建一个 Sql Server
如何在Notepad++中删除当前行并添加新行？

如何在Notepad 中删除当前行并添加新行这两个操作很常见但我找不到任何关键设置如何在 Notepad 中执行它们任何插件都可以完成这项工作吗 Ctrl L cuts the current line and Ctrl Shift
我可以 gzip 压缩所有 html 内容（页面）吗

我试图找出定义哪些页面应该进行 gzip 压缩以及何时发送纯 html 内容是否有任何原则如果你们可以分享您在 gzip 压缩项目的一部分时所做的决定那将会很有帮助一个好主意是进行基准测试对比数据下降的速度有多快压缩得有多好如果
MIPS：求 5 个整数的平均值

客观的根据用户输入使用五个寄存器查找平均值 Example 1 3 2 9 4 Output 3 输出是 3 因为 3 8 是小数我希望它是整数我的目标是不使用数组但我在添加所有 5 个寄存器时遇到问题 data prompt1
多索引数据帧删除每组最大值的行

我有一个像这样的多索引数据框 PID Fid x y A 1 2 3 2 6 1 3 4 6 B 1 3 5 2 2 4 3 5 7 我想删除每个患者 PID 具有最高 x 值的行我需要获取一个包含剩余行和所有列的新数据框以继续对这些数

多索引数据帧删除每组最大值的行

多索引数据帧删除每组最大值的行 的相关文章

随机推荐

热门标签

多索引数据帧删除每组最大值的行的相关文章