Python pandas dataframe：找到另一列的每个唯一值的最大值

2024-02-20

我有一个大型数据框（从 500k 到 1M 行），其中包含例如这 3 个数字列：ID、A、B

我想过滤结果以获得如下图所示的表格，其中对于列 id 的每个唯一值，我都有 A 和 B 的最大值和最小值。我能怎么做？

编辑：我已经更新了下面的图像以便更清楚：当我从列中获取最大值或最小值时，我还需要获取与其他列相关的数据

示例数据（请注意，您发布了一张图像，如果不重新输入，潜在的回答者就无法使用该图像，因此我在其位置上做了一个简单的示例）：

df=pd.DataFrame({ 'id':[1,1,1,1,2,2,2,2],
                   'a':range(8), 'b':range(8,0,-1) })

关键是使用idxmax and idxmin然后修改索引，以便您可以以可读的方式合并内容。这是完整的答案，您可能希望检查中间数据帧以了解其工作原理。

df_max = df.groupby('id').idxmax()
df_max['type'] = 'max'
df_min = df.groupby('id').idxmin()
df_min['type'] = 'min'

df2 = df_max.append(df_min).set_index('type',append=True).stack().rename('index')

df3 = pd.concat([ df2.reset_index().drop('id',axis=1).set_index('index'), 
                  df.loc[df2.values] ], axis=1 )

df3.set_index(['id','level_2','type']).sort_index()

                 a  b
id level_2 type      
1  a       max   3  5
           min   0  8
   b       max   0  8
           min   3  5
2  a       max   7  1
           min   4  4
   b       max   4  4
           min   7  1

特别注意 df2 看起来像这样：

id  type   
1   max   a    3
          b    0
2   max   a    7
          b    4
1   min   a    0
          b    3
2   min   a    4
          b    7

最后一列保存索引值df是由idxmax & idxmin。所以基本上你需要的所有信息都在df2。剩下的只是合并回来的问题df并使其更具可读性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

GROUPING

Python pandas dataframe：找到另一列的每个唯一值的最大值的相关文章

Python设置1和True的解释

在 IPython 3 交互式 shell 中 In 53 set2 1 2 True hello In 54 len set2 Out 54 3 In 55 set2 Out 55 hello True 2 是因为 1 和 True 得到
在 PhotoImage 下调整图像大小

我需要调整图像大小但我想避免使用 PIL 因为我无法使其在 OS X 下工作不要问我为什么无论如何因为我对 gif pgm ppm 感到满意所以 PhotoImage 类对我来说没问题 photoImg PhotoImage fi
打印一份拥有多个家庭的人员名单，每个家庭都有多个电话号码

我有一类 Person 它可以有多个 Home 每个 Home 都有一个或多个电话号码我已经定义了类但现在我正在尝试创建一个视图其中列出每个人的所有家庭以及每个家庭地址的所有电话号码类似于 john smith 123 fake s
Django Web 应用程序中的 SMTP 问题

我被要求向使用 Django Python 框架实现的现有程序添加一个功能此功能将允许用户单击一个按钮该按钮将显示一个小对话框表单以输入值我确实编写了一些代码显示电子邮件已发送的消息但实际上它没有发送 My code from
使用 stargazer 分析包含时间序列的数据帧

我有一个面板数据集共 10 个观测值和 3 个变量观测值 30 的数量 10 行国家地区 2 列迁移参数相应年份的 1 列可以这么说我的数据框由 3 个年度数据框组成我该如何申请观星者考虑到它是一个面板数据集所以最大 N
Django 1.7 应用程序配置导入错误：没有名为 appname.apps 的模块

我正在尝试按照以下文档为我的一个名为文章的 Django 应用程序设置自定义应用程序配置https docs djangoproject com en dev ref applications https docs djangoproj
Python：“直接”调用方法是否实例化对象？

我是 Python 新手在对我的对象进行单元测试时我注意到一些奇怪的东西 class Ape object def init self print ooook def say self s print s def main Ape
Jupyter笔记本突然变得很慢

我以前在anaconda环境下运行jupyter运行得很好显示警告后 IOPub data rate exceeded The notebook server will temporarily stop sending output to
分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country
使用 Windows 任务计划程序安排 [Virtualenv 相关] Python 脚本

I want to schedule a python script to start at 3AM and break at 5PM every weekday However the problem arises when I need
python中将对象数据类型转换为字符串问题

如何将对象数据类型结构转换为字符串数据类型下面的方法不起作用该列仍然存在object转换为字符串后 astype import pandas as pd df pd DataFrame country A B C D E df dtyp
在 Shiny 应用程序中过滤数据时，长度为 1 的字符向量除了第一个元素之外的所有元素都将被忽略错误

我有以下闪亮的应用程序 library shiny library rhandsontable library shinydashboard library ggplot2 library dplyr setwd C Users Marc
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
在 for 循环中访问 itertools 产品的元素

我有一个列表列表是附加 itertools 产品的一些其他结果的结果我想要的是能够使用 for 循环访问列表列表中列表的每个元素但我无法访问所有元素我只能访问最后一个列表的元素结果是一个非常巨大的列表列表例如 1 2 4 3 6
重定向 python 交互式帮助()

我正在为使用 Qt 的应用程序开发交互式 python shell 但是我似乎无法获得重定向的交互式帮助我的 python 代码中有这个 class OutputCatcher def init self self data def wr
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
如何使用logging.conf文件使用RotatingFileHandler将所有内容记录到文件中？

我正在尝试使用RotatingHandler用于 Python 中的日志记录目的我将备份文件保留为 500 个这意味着我猜它将创建最多 500 个文件并且我设置的大小是 2000 字节不确定建议的大小限制是多少如果我运行下面的代码
Python RE（总之检查第一个字母是否区分大小写，其余部分不区分大小写）

在下面的情况下我想匹配字符串 Singapore 其中 S 应始终为大写其余单词可能为小写或大写但在下面的字符串 s 是小写的它在搜索条件中匹配任何人都可以让我知道如何实施吗 import re st Information in
PYTHON：从 txt 文件中删除 POS 标签

我有以下 txt 文件其中包含 POS 词性 http en wikipedia org wiki Part of speech tagging 每个单词的标签不用 jj到说 vb 我 ppss是 bedz愤怒 jj在在 dt无与伦
OSError: [WinError 193] %1 不是有效的 Win32 应用程序，同时使用 CTypes 在 python 中读取自定义 DLL

我正在尝试编写用 python 封装 C 库的代码我计划使用 CTypes 来完成此操作并使用 Visual Studio 来编译我的 DLL 我从一个简单的函数开始在 Visual Studio 内的标头中添加了以下内容然后将其构

随机推荐

了解 Go 通道死锁

package main import fmt time func main p producer for c range p fmt Println c func producer lt chan string ch make chan
如何在Android Studio中制作选择器

在学习课程时我被指示为 Button 制作一个 xml 选择器课程说要在 Eclipse 中制作新的 Android xml 但我使用的是 Android Studio 另外当我自定义编写代码时它会给我一个错误它说必须声明元素选
如何使用JS下载视频标签？

我有一个链接我想从中下载视频
uitableview 在 iOS 中删除按钮图像

我想更改 uitableview 单元格的滑动按钮图像我已经搜索过了但没有得到想要的结果我用过这段代码 void willTransitionToState UITableViewCellStateMask state super w
在一次调用中从多个表中选择

在我的代码中我有一个页面其中包含来自 3 个不同表的信息为了显示此信息我进行了 3 个 SQL 选择调用并将它们合并在一个列表中以作为模型传递到我的视图我可以通过一次 SQL 调用来完成此操作吗数据之间没有任何联系 My c
如何创建特定（R、G、B）颜色的 openCV 图像并获取该颜色名称？

我需要创建一个填充一些 R G B 颜色的图像并获得该颜色名称例如 R G B 黑色或红色等我们可以用 openCV 做这样的事情吗如何做具有静态方法的静态颜色图类两个答案相结合只需复制并使用即可 pragma once in
按时间范围删除数据存储中的行

我有一个 CKAN 数据存储其中有一个名为 recvTime 的时间戳类型列即在 datastore create 时使用 timestamp 作为类型如这个链接所示 https github com telefonicaid fiw
在php中从json_decode()获取值时出错？

我有一个示例代码 description 2G Network GSM 850 900 1800 1900 3G Network HSDPA 850 900 1700 1900 2100 data json decode descripti
haskell中完整的缩进规则集

从哪里可以获得 Haskell 代码编写的完整缩进规则集过去的问题与我的以下问题类似导致我提出上述问题错误消息背后的原因是什么 parse error on input something 我收到的错误消息 Baby hs 103 2
如何获取 git 中多个项目的任何分支中特定用户的提交列表？

我在多个 git 项目的多个分支工作我想获得所有这些项目和分支中特定日期的提交列表用于时间表目的虽然我可以为此目的编写实用程序脚本但我不想重新发明轮子有没有一种简单的方法可以使用现有的基于 UNIX 的工具或一些 git 高级用户
选择两个 IP 范围之间的记录

我有一张桌子里面存放着ID Name Code IPLow IPHigh例如 1 Lucas 804645 192 130 1 1 192 130 1 254 2 Maria 222255 192 168 2 1 192 168 2 25
将类型添加到 std 命名空间

是否可以接受向std命名空间例如我想要一个 TCHAR 友好的字符串那么以下可以接受吗 include
sass 无法编译，文件不可读或找不到

转换错误 Jekyll Converters Sass 在转换时遇到错误 ng assets css all sass 找不到或无法读取要导入的文件 1 tools tools dir 1号线这是我每次运行 Jekyll 时都会遇到的错误
根据名称选择列表元素

我有一个指定的向量列表表示源自 2 个样本 A 和 B 的事件 l temp lt list SF1 t A c rep 1 10 SF2 t A c rep 9 15 SF1 t B c rep 8 12 l temp SF1 t A
如何在 PDFSharp 中遍历 Pdf 对象树？

我正在尝试使用 C 中的 PDFSharp 遍历现有 PDF 文档中的 PdfItem 对象树我想创建一个所有对象的层次结构类似于 PDF Explorer 示例所做的但我希望它是一棵树而不是所有对象的平面列表根节点是 docume
函数模板的 typedef 的最佳替代方案？

我想做的是这样的 template
Rails 5 Action Cable 与 Nginx、Puma 和 Redis 一起部署

我正在尝试使用 Capistrano 将启用 Action Cable 的应用程序部署到 VPS 我正在使用 Puma Nginx 和 Redis 用于电缆经过几个障碍后我能够让它在本地开发环境中运行我正在使用默认的进程内 cable
ASP.Net 6自定义WebApplicationFactory抛出异常

我正在将现有的 ASP Net 5 Web 应用程序迁移到 ASP Net 6 并遇到了通过集成测试的最后障碍我自定义 WebApplicationFactory 并抛出异常 Changing the host configuration
打印浮点型/双精度型而不带尾随零？ [复制]

这个问题在这里已经有答案了有几个与此相关的问题但我还没有看到正确回答这个问题的人我想打印一个浮点数但我希望小数位数是自适应的举个例子 0 gt 0 1234 gt 1234 0 1234 gt 0 1234 0 3 gt 0 3
Python pandas dataframe：找到另一列的每个唯一值的最大值

我有一个大型数据框从 500k 到 1M 行其中包含例如这 3 个数字列 ID A B 我想过滤结果以获得如下图所示的表格其中对于列 id 的每个唯一值我都有 A 和 B 的最大值和最小值我能怎么做编辑我已经更新了下面的图像以

Python pandas dataframe：找到另一列的每个唯一值的最大值

Python pandas dataframe：找到另一列的每个唯一值的最大值 的相关文章

随机推荐

热门标签

Python pandas dataframe：找到另一列的每个唯一值的最大值的相关文章