在 pandas 数据帧上运行 sql 查询

2024-04-17

我有一个数据框 df

ID	Price	Region
1	23	AUS
1	45	DXB
2	25	GER
2	18	TUN

我想用 python 编写代码以获得以下输出

ID	Price	Region
1	45	DXB
2	25	TUN

我尝试使用 pandasql 来获取输出，但它没有给出我想要的输出

我尝试过的代码是

import pandas as pd
import pandasql as ps

#to read table
df=pd.read_excel("test.xlsx")

ps.sqldf("select ID, max(Price), Region from df order by ID")

如果 python 本身（不使用 pandasql）有任何其他代码可以得到上述输出，请告诉我

您可以使用groupby.transform

output_df = df[df['Price'].eq(df.groupby("ID")['Price'].transform("max"))]

Or with ps.sqldf使用窗口函数获取最高价格，然后返回价格等于最高价格的行：

output_df  = ps.sqldf("""select ID,Price,Region from 
                        (select *, max(Price) over (partition by ID) max_Price from df)
                        where Price = max_Price""")

    ID  Price Region
0   1     45    DXB
1   2     25    GER

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandasql

在 pandas 数据帧上运行 sql 查询的相关文章

如何更改 FacetGrid 中的边距标题颜色

使用 Seaborn Facet Grids 如何仅更改边距标题的颜色注意g set titles color red 更改两个标题 p sns load dataset penguins sns displot data p x fli
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j

随机推荐

LD_PRELOAD 和 strace 有什么区别？

这两种方法都用于收集系统调用及其参数和返回值当我们更愿意LD PRELOAD为什么也许我们可以说我们只能通过以下方式收集系统调用strace但我们可以收集图书馆的电话LD PRELOAD诡计然而还有另一个库的跟踪器其名称是ltra
Bundler 不会安装 mysql2

首先我在 SO 和谷歌上浏览了数十篇帖子但未能找到答案我正在尝试使用捆绑器安装 mysql2 但它不会这样做运行于Ubuntu 服务器 11 04 纳蒂以下是一些背景信息 ruby v ruby 1 8 7 2012 02 08
使用 pdb 调试 Python 时如何打印所有变量值，而不指定每个变量？

我正在使用以下命令调试我的 Python 脚本pdb手册说我可以使用p 变量命令打印指定变量在某一点的值但是如果我有很多变量例如 20 个变量并且我想跟踪所有变量的值该怎么办如何在不手动指定每一项的情况下打印所有这些以这个脚本
Visual Studio 中不会引发异常

由于某种原因我的异常不再在 Visual Studio 中抛出我在响应中收到 JSON 错误但调试模式下的 Visual Studio 不再抛出错误并在发生该错误时停止 Visual Studio 我查看过这样的帖子 Visual
“location.reload()”丢失 POST/SESSION 数据？（F5 / Ctrl+R 保留数据？）

我想创建一个按钮来重新加载页面而不丢失 POST数据和 SESSION 在网上我找到了这段代码 onclick document location reload 这是我的按钮的代码 a class button href style fo
将字符串转为运算符

我怎样才能转动一个字符串例如进入运营商加号使用查找表 import operator ops operator add operator sub etc print ops 1 1 prints 2
Global.asax - Application_Error - 如何获取页面数据？

我有这个代码 using System Configuration void Application Error object sender EventArgs e Exception ex Server GetLastError GetB
国内良好的安全备份开发人员[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于在家进行研发且不能丢失任何工作的程序员来说什么是良好安全的备份方法状况备份必须始终位于相当容易访问的范围内无法保证互联网连接
使用地图提取和重新插入的限制性规则的基本原理

从 C 17 开始关联容器 https en cppreference com w cpp container支持节点的提取及其重新插入可能插入到相同类型的另一个容器中返回的对象extract key is a 节点句柄 https
如何用python拟合非线性函数？

我用 R 编写了以下代码来估计三个系数 a b 和 c y lt c 120 125 158 300 350 390 2800 5900 7790 t lt 1 9 fit lt nls y a b c 2 b exp b c t 1 c
无法在 cygwin32 上使用 gcc 编译任何内容；缺少 cygisl-10.dll

我在 32 位 cygwin 上使用 gcc 进行编译时遇到问题消息是 C cygwin lib gcc i686 pc cygwin 4 9 3 cc1plus exe error while loading shared librar
Vis.js 网络图不随节点更改而更新

我有一个函数可以清除节点或边数据集中可能存在的任何数据然后继续用新数据重新填充它们它是一个分层网络级别是在创建所有节点和边后动态设置的因此节点的级别属性最终是由nodes update 调用添加节点的级别设置正确可以在我的控制
可变参数模板参数：我可以根据类型选择引用还是值？

edit这是不是重复的 of 对静态类成员的未定义引用 https stackoverflow com questions 272900 undefined reference to static class member 这个问题探讨了c
TensorFlow 中的梯度概念与梯度的数学定义有何关系？

The TensorFlow 文档 https www tensorflow org api docs python tf gradients解释了功能 tf gradients ys xs grad ys None name gradi
Android Studio 性能低下

我昨天将 Android Studio 更新到了 2 3 版本自从经历了性能缓慢之后它之前工作得很好虽然在 gradle 构建时很慢但现在它占用了 100 的处理器资源 Android Studio 流畅运行需要什么条件我的电脑运
无法使用unixodbc、libmyodbc连接到远程mysql服务器

我对此有点陌生我希望我遇到的问题是一个简单的问题编辑底部的新信息我需要连接到远程 mysql Amazon RDS 数据库在学习了一些教程后我在客户端上安装并配置了 unixodbc 和 libmyodbc 但是当我尝试通过 i
无法将 go tool pprof 与现有服务器一起使用

我有一个现有的 http 服务器我想对其进行分析我已经包括了 net http pprof 到我的导入并且我已经运行了 http 服务器 router createRouter server http Server Addr 8080
如何使用 Linux 帧缓冲区旋转 Qt5 应用程序？

我有一个直接在 Linux 帧缓冲区无 x Windows 上运行的嵌入式 Linux 应用程序现在我们必须将显示屏物理旋转 180 度如何让我的 Qt 应用程序旋转使其不会出现颠倒我看到参考使用以下选项 platform lin
如何解决 ORA-00911: 无效字符错误？

我试图执行一个SQL INSERT with Toad for oracle INSERT INTO GRAT ACTIVITY UUID IP ADRESS SEND MAIL DATE CREA DATE UPD CREATOR CEN
在 pandas 数据帧上运行 sql 查询

我有一个数据框 df ID Price Region 1 23 AUS 1 45 DXB 2 25 GER 2 18 TUN 我想用 python 编写代码以获得以下输出 ID Price Region 1 45 DXB 2 25 TUN

在 pandas 数据帧上运行 sql 查询

在 pandas 数据帧上运行 sql 查询 的相关文章

随机推荐

热门标签

在 pandas 数据帧上运行 sql 查询的相关文章