按一列分组并在 pandas 中查找另一列的总和和最大值

2024-02-12

我有一个像这样的数据框：

Name  id  col1  col2  col3  cl4 
PL    252  0     747   3     53  
PL2   252  1     24    2     35 
PL3   252  4     75    24    13 
AD    889  53    24    0     95 
AD2   889  23    2     0     13  
AD3   889  0     24    3     6  
BG    024  12    89    53    66 
BG1   024  43    16    13    0   
BG2   024  5     32    101   4

现在我需要按 ID 进行分组，对于列 col1 和 col4 找到每个 id 的总和并将其放入靠近父列的新列中（例如：col3(sum)），但对于 col2 和 col3 找到最大值。期望的输出：

Name  id  col1 col1(sum) col2 col2(max) col3 col(max) col4 col4(sum)
PL    252  0       5      747    747     3     24    6    18
PL2   252  1       5      24     747     2     24    12   18
PL3   252  4       5      75     747     24    24    0    18
AD    889  53      76     24     24      95    95    23   33
AD2   889  23      76     2      24      13    95    5    33
AD3   889  0       76     24     24      6     95    5    33
BG    024  12      60     89     89      66    66    0    67   
BG1   024  43      60     16     89      0     66    63   67    
BG2   024  5       60     32     89      4     66    4    67

计算这个最简单、最快的方法是什么？

最（熊猫）本地的方法是使用.agg() https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.agg.html方法，允许您指定要对每列应用的聚合函数（就像在 SQL 中所做的那样）。

文档中的示例：

df.groupby('A').agg({'B': ['min', 'max'], 'C': 'sum'})

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

groupby

按一列分组并在 pandas 中查找另一列的总和和最大值的相关文章

Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
为什么我应该使用 WSGI？

使用 mod python 一段时间了我读了越来越多关于 WSGI 有多好的文章但没有真正理解为什么那么我为什么要切换到它呢有什么好处这很难吗学习曲线值得吗为了用 Python 开发复杂的 Web 应用程序您可能会使用更全面
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

.NET 桌面应用程序的最佳崩溃报告框架？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有几个简单的 Windows 窗体应用程序我想向其中添加崩溃报告可以为我提供有关用户计算机当然
Serilog不将日志输出到txt文件中

我使用 dotnet 工作服务 net 5 我集成了 Serilog 以及浓缩器和接收器但由于某种原因我在文件日志中看不到任何输出这是我的 appsettings json ConnectionStrings DefaultConne
使用数组和对象将多个值插入到雪花表中

我试图使用数组和结构插入多行通过 SQL 语句转换为 Snowflake 要将值数组插入到列中我正在使用ARRAY CONSTUCT函数并插入我正在使用的结构字典对象OBJECT CONSTRUCT功能 E g insert int
新版本上传到 iTunes Connect 后消失

我正在尝试使用 Xcode 8 将构建版本上传到 iTunesConnect Xcode 显示上传成功在 iTunesConnect 的活动选项卡中我看到我的构建出现了并且被标记为正在处理但几分钟后这个构建就消失了我在任何
对 CountedCompleter 的文档和来源感到困惑

这是一个代码片段java util concurrent CountedCompleter类 JDK 1 8 0 25 If the pending count is nonzero decrements the count otherwi
使用 JodaTime 自动将秒转换为年/日/小时/分钟？

当 x 超过 3600 秒时有没有办法将 x 秒转换为 y 小时和 z 秒同样当x超过60但小于3600秒时使用JodaTime 将其转换为 a分b秒我知道我必须在 periodFormatter 中指定我需要的内容但我不想指定
传递常量矩阵

参考this https stackoverflow com questions 546860 passing arrays and matrices to functions as pointers and pointers to poi
对象内部字段的 Arangodb AQL 更新

给出以下集合文档示例 timestamp 1413543986 message message readed 8 null 9 null 22 null type 1014574149174 如何使用键 readed 更新对象中特定键的值
我可以使用 groovy 的默认 getter/setter 来帮助实现 java 接口吗？

我正在从导入的库扩展一个非常简单的 Java 接口该接口非常简单它声明的唯一方法是属性列表的 getter 和 setter 我的应用程序是用 Groovy 编写的因此我想使用 Groovy 类来实现这个 Java 接口我的印象是
CryptoAPI 返回 HMAC_SHA1 的错误结果

我将下面的代码与 Crypto API 一起使用但根据其他 API 和库的测试我没有得到预期的结果我正在使用钥匙 key 数据是 message 例如使用 Indy 的 TidHMACSHA1 我得到 2088df74d5f2146
使用数组绘制 D3 简单折线图

我正在尝试实现这段代码 http bl ocks org 3883245 http bl ocks org 3883245 但我不是加载 TSV 文件而是从数组加载数据数组如下所示 2012 10 02 2 2012 10 09 2 2
什么时候应该在非成员函数之前写入关键字“static”？

我最近在 SO 上看到了一些关于static函数之前的关键字我想知道如何正确使用它 1 什么时候应该写关键字static在非成员函数之前 2 在头文件中定义静态非成员函数有危险吗为什么不附带问题 3 是否可以以某种方式在头文件中定义一
没有路线匹配 [POST]“/sessions/new”（rails 4 正在运行）

我正在阅读 Rails 4 In action 一书但遇到了以下错误 No route matches POST sessions new 我不知道为什么因为我已经按照教程进行了操作这让我相信教程本身是有缺陷的无论如何由于某种原因
接下来是 Revolution R 的 foreach 包？

我已经浏览了很多文档并进行了大量的谷歌搜索但找不到以下问题的答案是否有一种方法可以并行诱导类似下一个功能foreach循环使用foreach包裹具体来说我想做一些类似的事情这不适用于next但没有 foreach i 1 10
对 Rails/Heroku 上的 Postgres 数据库进行意外的 SQL 查询

我正在使用 NewRelic 深入研究对我的 Rails 应用程序之一的非常长的请求并发现许多看起来完全陌生的 SQL 查询占用了相当长的时间我用谷歌搜索过但我一无所获不知道它们是什么更不用说我是否可以阻止它们发生 SELECT
Powershell - 如何编辑自定义对象中的现有属性

我正在寻找如何更新现有 psobject 中的 noteproperty 的方法例如我有 psobjects 的 system array a Group Assigment Group1 Home Group2 Office 问题是如何
Android向服务器发送https post请求而不使用不推荐的方法

在我的应用程序中使用以下方式通过 https 发送请求这个来源的答案 https stackoverflow com questions 14051304 send https post request to the server 现在其
如何从 FilesMatch 中排除目录

我有以下 htaccess 指令
ASCII 压缩器适用于短测试文件，不适用于长测试文件

系统编程中当前的项目是提出一个 ASCII 压缩器它可以删除顶部的零位并将内容写入文件为了方便解压将原始文件大小写入file 然后是压缩后的char字节有两个文件要运行测试一个文件长度为 63 字节另一个文件长度为 534421
按一列分组并在 pandas 中查找另一列的总和和最大值

我有一个像这样的数据框 Name id col1 col2 col3 cl4 PL 252 0 747 3 53 PL2 252 1 24 2 35 PL3 252 4 75 24 13 AD 889 53 24 0 95 AD2 889

按一列分组并在 pandas 中查找另一列的总和和最大值

按一列分组并在 pandas 中查找另一列的总和和最大值 的相关文章

随机推荐

热门标签

按一列分组并在 pandas 中查找另一列的总和和最大值的相关文章