pandas groupby - 返回满足条件的组中的第一行

2023-12-10

鉴于下面的示例数据集，我想每个返回一行group这表明obsnum第一行的score小于0.4。

import pandas as pd
import numpy as np

np.random.seed(42)

df = pd.DataFrame({'group': ['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b', 'c', 'c', 'c', 'c'],
'obsnum': [1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4],
'score' : np.random.rand(12)})

数据框如下所示：

df
  group obsnum  score
0   a     1   0.374540
1   a     2   0.950714
2   a     3   0.731994
3   a     4   0.598658
4   b     1   0.156019
5   b     2   0.155995
6   b     3   0.058084
7   b     4   0.866176
8   c     1   0.601115
9   c     2   0.708073
10  c     3   0.020584
11  c     4   0.969910

返回的结果应该像这样并存储在另一个数据框中。

group   obsnum  score
a         1     0.374540
b         1     0.156019
c         3     0.020584

我已经尝试过这个df.groupby('group').apply(lambda x: x['score'] <= 0.4)和这个df.groupby('group')['obsnum', 'score'].min()但两者都不是我所追求的。

您可以使用

df[df['score'].le(0.4)].groupby('group').first()

     obsnum     score
group                  
a           1  0.374540
b           1  0.156019
c           3  0.020584

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandasgroupby

pandas groupby - 返回满足条件的组中的第一行的相关文章

使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型

随机推荐

如何通过.NET验证xml代码文件？ + 如果我使用 XML 序列化，我该怎么做？

我希望用户能够将数据导出为 XML 文件当然我希望他们稍后能够导入相同的 XML 文件但他们总是可以更改它或者它可能是不同的 XML 文件所以我想验证 XML 文件以检查它是否采用我期望的格式所以我想我需要像模式这样的东西来检查
Java 数学运算语法（按位或等于）

谷歌似乎没有帮助解决以下问题在Java中以下是什么意思 long num1 long num2 Means long num1 long num1 long num2 The 是按位或
JPA 和 JSF：注入 EntityManager 的正确方法

我已经花了几个小时来处理这个问题但我仍然没有弄清楚将 JPA 与 JSF 结合使用的正确方法是什么我有一个会话范围的托管 bean 它可以做很多事情其中之一就是保存一些实体对象一开始我创建了一个请求范围的生产者方法用于构建我的
在 IDLE (Python 3.4) 中运行模块而不重新启动

看来在过去当您运行脚本模块时 IDLE 不会重新启动清理环境然而今天的情况却是这样但对于原型设计我希望环境分配的变量导入的模块函数能够在运行不同的模块文件时生存示例我正在开发一个函数我们称之为 f7 它需
将 C++ dll 导入 Windows Phone 项目

我是 Windows Phone 开发新手我有一个问题不知道如何解决问题是我有一个 C 项目我用 Visual C 2010 编译了它这创建了一个带有编译代码的 DLL 所以我知道 C 导入 dll 库但是当我添加引用时会出现
向 ListView 添加元素时如何设置动画/过渡？

我有一个 ListView 我通过绑定添加了元素 ListView 看起来像
CRTP编译错误

以下内容将使用 GCC 5 2 进行编译但不能使用 Visual Studio 2015 进行编译 template
如何从 res/raw 文件夹打开 PDF 文件？

我正在编写一个应用程序当您单击按钮时它会打开 pdf 文件下面是我的代码 File pdfFile new File android resource com dave pdfviewer R raw userguide Uri pa
将从 Oracle Java 切换到 OpenJDK，以避免支付 2019 年 1 月工作费用 [已关闭]

Closed 这个问题需要多问focused 目前不接受答案我有几个在生产中使用 JDK 1 8 的项目不过 Java 从 2019 年 1 月起开始收费如果我将项目迁移到 OpenJDK 1 8 因为它是开源的我的问题是否可以解决
不允许使用 HTTP 谓词 POST 来访问路径“/test.html”

下面是我的代码
如何将NameValueCollection转换为JSON字符串？

I tried NameValueCollection Data new NameValueCollection Data Add foo baa string json new JavaScriptSerializer Serialize
“由于‘内部’保护级别，‘isSuccess’无法访问”，AlamoFire 无法像以前一样工作

我在 swift 上使用 alamoFire 但遇到了这个问题由于内部保护级别 isSuccess 无法访问我努力了this我也尝试过this 这是我的代码 AF request jsonURL method get paramet
如何在非零价格行之前重复数据框中价格为 0 的行？

我有一个数据 WEEK PRICE QUANTITY SALE PRICE 4992 3 49 1908 750 0 00 4999 2 50 5681 000 2 50 5001 3 00 3187 000 3 00 5002 3 49
如果我在录音期间播放 AVPlayer，iOS ReplayKit 会停止录音麦克风

我正在使用 ReplayKit 的RPScreenRecorder shared startCapture录制屏幕和麦克风的方法但我面临一个问题如果我在屏幕录制时播放 AVPlayer 麦克风会停止录制音频下面是两种情况首先一切工
通过 API 网关从 AWS lambda 返回二进制正文和 http 标头

我有一个 lambda 需要通过 api 网关使用 lambda 集成返回二进制对象和一些 http 标头例如内容类型或重定向到另一个 URL 在二进制支持示例中例如https aws amazon com blogs compu
bgiframe 与 jQuery UI 1.8.9 对话框和 jQuery 1.5

所以我使用 jQuery UI 的对话框但正如我所读到的 IE6 中有一个常见的错误不幸的是我必须确保它适用其中下拉列表不关注 z index 队列我还读到有一个名为 bgiframe 的方便插件可以解决我的覆盖问题我发现人们说有
Git 操作缓慢

我有一个放在 Git 下的测试存储库大多数文件都非常小但数量非常多简单的 Git 操作例如添加和状态需要数十分钟才能完成我可以选择哪些选项来将这些内容置于修订控制之下并获得合理的性能我应该尝试使用子模块还是应该避开 DVCS
如何防止WKWebView重复请求访问位置的权限？

我有一个WKWebView在我的应用程序中当我开始浏览 www google com 或任何其他需要位置服务的网站时会出现一个弹出窗口请求访问设备位置的权限即使我已经同意共享我的位置我为管理这个位置所做的唯一一件事就是添加了NSL
链接并执行 GitHub 上托管的外部 JavaScript 文件

当我尝试将本地 JavaScript 文件的链接引用更改为 GitHub 原始版本时我的测试文件停止工作错误是拒绝执行来自的脚本因为它的 MIME 类型 text plain 不可执行并且启用了严格的 MIME 类型检查有没有
pandas groupby - 返回满足条件的组中的第一行

鉴于下面的示例数据集我想每个返回一行group这表明obsnum第一行的score小于0 4 import pandas as pd import numpy as np np random seed 42 df pd DataFrame

pandas groupby - 返回满足条件的组中的第一行

pandas groupby - 返回满足条件的组中的第一行 的相关文章

随机推荐

热门标签

pandas groupby - 返回满足条件的组中的第一行的相关文章