Python-按多列分组并获取最大值或总和

2024-05-07

我有兴趣获得产品价格的最大值。

这是输入数据。

我想按州、国家/地区分组

我如何对这两列进行分组以获得价格的最大值。

import csv
import locale
from itertools import groupby

locale.setlocale( locale.LC_ALL, 'en_US.UTF-8' ) 

total_price = 0
max_price = 0
reader = csv.DictReader(open('/Users/myuser/Downloads/SalesData.csv', 'rU'), dialect='excel')

groups = groupby(reader, lambda d: d['State'])

result = [max(g, key=lambda d: d['State']) for k, g in groups]

for row in reader:
    print row["State"], row["Country"], locale.atoi(row["Price"])
    max_price = max(row.iteritems(), key=operator.itemgetter(1))
    total_price += locale.atoi(row["Price"])

与熊猫的使用。我可以在不使用 pandas 的情况下得到这个吗？

import pandas as pd
from pandas import DataFrame
import locale

locale.setlocale( locale.LC_ALL, 'en_US.UTF-8' ) 


df = pd.read_csv('/Users/myuser/Downloads/SalesData.csv', index_col=False, header=0,thousands=',')

print df.groupby(["Country","State"]).max()["Price"]

itertools.groupby仅适用于使用与 groupby 相同的键函数排序的列表，如文档 https://docs.python.org/2/library/itertools.html#itertools.groupby -

itertools.groupby(iterable[ key])

创建一个迭代器，从可迭代对象中返回连续的键和组。键是计算每个元素的键值的函数。如果未指定或为 None，则 key 默认为恒等函数并返回未更改的元素。一般来说，可迭代对象需要已经在相同的键函数上进行排序。

所以为了实现你想要的itertools.groupby，您很可能需要首先根据两者对数据进行排序'Country' and 'State'，然后对其进行 groupby 。

另外，在服用时max()你应该使用'Price' not 'State'。例子 -

reader = csv.DictReader(open('/Users/myuser/Downloads/SalesData.csv', 'rU'), dialect='excel')

sortedreader = sorted(reader, key=lambda d: (d['Country'], d['State']))

groups = groupby(sortedreader, key=lambda d: (d['Country'], d['State']))

result = [(k, max(g, key=lambda d: d['Price'])) for k, g in groups]

我将密钥添加到结果中，以识别哪个Country/State每个最大值对应。之后你可以迭代result并打印每个（如果这是您真正想要的）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

groupby

Python-按多列分组并获取最大值或总和的相关文章

为什么 Python 在导入脚本时只保存脚本的字节码？

既然执行Python字节码会比运行原始源代码更快因为Python不需要重新编译为什么Python在导入脚本时只保存编译后的字节码呢为每个执行的脚本保存 pyc 文件不是更好吗无论如何 Python 解释器的启动时间都需要时间即使您
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
来自 pandas 数据帧的烛台图，用日期替换索引

此代码给出了带有移动平均线的烛台图但 x 轴位于索引中我需要 x 轴位于日期中需要做什么改变 import numpy as np import pandas as pd import matplotlib pyplot as plt
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
是否可以在Python中将日+月（不是年）与当前日+月进行比较？

我正在获取 5 月 10 日格式的数据我试图弄清楚它是今年还是明年该日期仅一年因此 5 月 10 日表示 2015 年 5 月 10 日而 5 月 20 日表示 2014 年 5 月 20 日为此我想将字符串转换为日期格式并进
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
使用 MPI 的 Allreduce 对 Python 对象求和

我正在使用使用 Python 中的字典和计数器构建的稀疏张量数组操作我想让并行使用这个数组操作成为可能最重要的是我最终在每个节点上都有计数器我想使用 MPI Allreduce 或另一个不错的解决方案将其添加在一起例如使用计数
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些

随机推荐

如何在位置中使用 Nginx Regexp

Web 项目将静态内容放入 some content img 文件夹中 url规则为 img some md5 但文件夹中的位置 content img 前两位数字 Example url example com img fe5afe048
Rails——自我与@

我正在关注 Michael Hartl 的 RoR 教程它涵盖了密码加密的基础知识这是当前的用户模型 class User lt ActiveRecord Base attr accessor password attr accessi
实现用户定义的算术函数

如何添加函数例如汉明权重并在右侧出现的表达式中使用它是一些 is 2 goal 像 goal expansion 或 term expansion 这样的东西可以帮助这里吗我承认这不是一个大功能但它可以提高我的一些 Prolog 程
如何从 dll 导出 C++ 类？ [复制]

这个问题在这里已经有答案了我有一个有两个重载函数的类如何从 dll 导出它以及如何由其他 C 类使用它我的班级是这样的 define DECLDIREXP declspec dllexport define DECLDIRIMP de
如何在 Spring RestTemplate 中禁用 URL 编码？

String url serverUrl metadata getUri response restTemplate exchange url metadata getAction requestEntity metadata getRes
MySQL GROUP 通过还是使用 PHP？

我有一个看起来很简单的问题但我只是想问你如何解决它在 MySQL 表中有以下结构 provider artist a 1 a 2 a 3 b 4 现在需要在 HTML 中回显一个列表例如 provider a 1 2 3 provid
Python 调度一个作业，每个工作日开始，每小时运行一次

我目前有一个示例代码定义为 import schedule import time def job t print I m working t return schedule every day at 01 00 do job It is
如何替换cloudinary中的图像并保持相同的URL？

我在 cloudinary 中有一个图像我想替换它但保留原始 URL 可能吗是的可以更新图像并保持相同的 URL 当您上传新图像时您希望使其 public id 与您尝试替换的现有图像相同然后您的 Cloudinary 帐户将被更
如何在 Azure 中调试测试发送？

I am trying to setup a successfull push notifications between my Net backend and ios client in azure I followed this htt
MonoDevelop - 代码窗口颜色方案

MonoDevelop 中有没有办法自定义代码窗口配色方案我想要类似的东西黑曜石之子 http studiostyl es schemes son of obsidian如果可能的话是的转到 MonoDevelop 语法突出显示选项面
继承模板的排序顺序

使用 Sitecore 6 6 我们正在构建一些继承许多基本模板的模板这对于重用和标准化我们的代码非常有用因为所有字段都存储在常量文件中以便于引用然而我们似乎无法定义这些继承模板的显示顺序无论如何模板似乎都遵循它们添加的原始顺序
如何在cxf-maven-plugin中定义wsdl的密码

我想使用 cxf maven plugin 根据此文档从 WSDL 生成 Java 代码 http cxf apache org docs maven cxf codegen plugin wsdl to java html http cx
Dingo API 删除“数据”信封

有没有一种简单的方法可以从 Dingo API 响应中删除数据信封当我使用这个 Transformer 来转换用户模型时 class UserTransformer extends EloquentModelTransformer L
尝试 SSH 时设备的 ioctl 不合适

我正在尝试通过 SSH 连接几台服务器并尝试获取sudo l每个服务器的输出下面是我正在执行的脚本 bin bash serverlist tmp servers while IFS read r server netgroup user
unity 3d 根据加速度计旋转游戏对象

我想做一款类似神庙逃亡的游戏我需要根据设备倾斜的程度来旋转播放器的平台我正在尝试加速计但无法使游戏对象倾斜请指导我谢谢这是我的代码我之前在注释中使用了代码现在我尝试使用注释中的代码 public class tilt M
如何将 Enzyme Shallow 与 Jest 快照结合使用

我正在尝试使用shallow https github com airbnb enzyme blob master docs api shallow md from enzyme https github com airbnb enzyme
如何在 iText 中获取新页面

去新页面有点问题pdfContentByte 我使用下面的代码将数据放在第一页之后到下一页但不幸的是iText不生成新页面 step1 itextDocument new com itextpdf text Document PageSi
使用 Metro 风格应用程序启动桌面应用程序

有没有办法从 Windows 8 上的 Metro 风格应用程序启动桌面应用程序我正在尝试创建一些简单的桌面应用程序快捷方式以替换开始屏幕上看起来不合适的桌面图标我只需要一些超级简单的东西最好是用 C 编写以便在应用程序加载后立即
如何比较 ASCII 值

我想将字母的 ASCII 值存储到变量中我该怎么做例如 r ASCII variable 82 main character character read from a file variable r ascii in this cas
Python-按多列分组并获取最大值或总和

我有兴趣获得产品价格的最大值这是输入数据我想按州国家地区分组我如何对这两列进行分组以获得价格的最大值 import csv import locale from itertools import groupby locale se

Python-按多列分组并获取最大值或总和

Python-按多列分组并获取最大值或总和 的相关文章

随机推荐

热门标签

Python-按多列分组并获取最大值或总和的相关文章