pandas groupby().head(n) 其中 n 是组标签的函数

2023-12-06

我有一个数据框，我想按列分组并获取每个组的头部，但我希望头部的深度由组标签的函数定义。如果不是可变的组大小，我可以轻松做到df.groupby('label').head(n)。我可以想象一个涉及迭代的解决方案df['label'].unique()，切片数据帧并构建一个新的数据帧，但我所处的环境对性能非常敏感，因此我希望尽可能避免这种迭代。

这是一个示例数据框：

  label   values
0  apple       7
1  apple       5
2  apple       4
3    car       9
4    car       6
5    dog       5
6    dog       3
7    dog       2
8    dog       1

以及我的示例设置的代码：

import pandas as pd
df = pd.DataFrame({'label': ['apple', 'apple', 'apple', 'car', 'car', 'dog', 'dog', 'dog', 'dog'],
          'values': [7, 5, 4, 9, 6, 5, 3, 2 ,1]})
def depth(label):
    if label == 'apple': return 1
    elif label == 'car': return 2
    elif label == 'dog': return 3

我想要的输出是一个数据框，其中包含该函数定义的每个组的行数：

   label  values
0  apple       7
3    car       9
4    car       6
5    dog       5
6    dog       3
7    dog       2

我会在这里使用字典并使用<group>.name in groupby.apply:

depth = {'apple': 1, 'car': 2, 'dog': 3}

out = (df.groupby('label', group_keys=False)
         .apply(lambda g: g.head(depth.get(g.name, 0)))
       )

注意。如果你确实需要一个函数，你可以通过函数调用来做同样的事情。确保在每种情况下都返回一个值。

替代选项groupby.cumcount和布尔索引：

out = df[df['label'].map(depth).gt(df.groupby('label').cumcount())]

output:

   label  values
0  apple       7
3    car       9
4    car       6
5    dog       5
6    dog       3
7    dog       2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

groupby

pandas groupby().head(n) 其中 n 是组标签的函数的相关文章

Python：用中值替换异常值

我有一个 python 数据框其中有一些异常值如果这些值不存在的话我想用数据的中值替换它们 id Age 10236 766105 11993 288 9337 205 38189 88 35555 82 39443 75 10762
在Python中用空格分割字符串——保留带引号的子字符串

我有一个像这样的字符串 this is a test 我正在尝试用 Python 编写一些内容以将其按空格分开同时忽略引号内的空格我正在寻找的结果是 this is a test 附言我知道您会问如果引号内有引号会发生什么嗯在
pandas：使用运算符链接过滤 DataFrame 的行

大多数业务在pandas可以通过操作符链接来完成 groupby aggregate apply等但我发现过滤行的唯一方法是通过普通的括号索引 df filtered df df column value 这没有吸引力因为它需要我分配d
检查字符串是否以 XXXX 开头

我想知道如何在Python中检查字符串是否以 hello 开头在 Bash 中我通常这样做 if string hello then do something here fi 我如何在Python中实现同样的效果 aString hell
在python中浏览ftp目录

我正在尝试使用 ftplib 使用 Python 3 从 ftp 服务器下载多个文件夹我有一个文件夹名称列表它们都位于文件夹 root 中问题是我不知道如何浏览它们当我使用cwd我可以进入更深的目录但是如何再次起来呢我正在尝试得
如何在 pySpark 数据框中添加行 ID [重复]

这个问题在这里已经有答案了我有一个 csv 文件我在 pyspark 中将其转换为 DataFrame df 经过一番改造后我想在 df 中添加一列这应该是简单的行 ID 从 0 或 1 开始到 N 我将 df 转换为 rdd 并使
类型错误：无法连接“str”和“instance”对象（python urllib）

写一个python程序我在使用时遇到了这个错误urllib urlopen功能 Traceback most recent call last File ChurchScraper py line 58 in
如何读取 sql 查询到 pandas dataframe / python / django

我在下面使用这个views py获取应用程序 from django db import connection def test request cursor connection cursor sql SELECT x n from ta
Altair 条形图具有可变宽度的条形？

我正在尝试在 Python 中使用 Altair 制作条形图其中条形的宽度根据源数据帧列中的数据而变化最终目标是获得如下所示的图表条形的高度对应于每种能源技术的边际成本在源数据框中以列形式给出条形宽度对应于每种能源技术的容量也以
如何将文本文件中的十六进制行转换为数组（Python）？

我有一个文本文件每行包含一个十六进制明文我的文件如下所示 7a8e5dc390781eab8df2c090bf4bebca dbac0fba55d3d4fc177161bfe24dc7fb 82e5a7a021197f6fbe94a86
您能否从函数、args 和 kwargs 确定变量将如何分配？

我有一些样板逻辑我想包装几个具有相同可选关键字的函数现在看起来像下面的代码但是这仅处理 opt key 作为关键字传递的情况而不是按位置传递解决这个问题的一种方法是了解如何解决参数分配是否有一些元函数接受函数 args 和 k
如何使用 Python Flask-Security 使用 bcrypt 加密密码？

我正在尝试使用 Flask Security 文档中的标准基本示例并使其正常工作除了密码以明文形式存储之外我知道这一行 user datastore create user email email protected cdn cgi
SQL查询中的Python列表作为参数[重复]

这个问题在这里已经有答案了我有一个 Python 列表比如说 l 1 5 8 我想编写一个 SQL 查询来获取列表中所有元素的数据例如 select name from students where id IN THE LIST l
FileAllowed 不显示错误消息

我正在使用 WTForms 我正在对文件上传应用验证并将其限制为仅 jpg png 和 pdf 格式但是如果我输入不正确则不会出现错误消息我按照这个教程https flask wtf readthedocs io en stabl
从另一个列表的元素创建一个新列表，引用后者的元素

我想从前一个元素创建一个新列表但不复制它们这就是发生的事情 In 23 list range 10 In 24 list2 list 0 4 In 25 list Out 25 0 1 2 3 4 5 6 7 8 9 In 26 lis
如果我更改当前工作目录，为什么 __file__ 会变成无效路径？

执行中test py from tmp import os print os path abspath file os chdir var print os path abspath file output tmp test py var
vtkPythonAlgorithm 控制管道执行

我正在尝试用 python 编写一个 vtk 过滤器ProjectDepthImage进行投影不是问题它控制 vtk 管道的执行基本上我对 UserEvent 有一个回调当用户在渲染窗口处于活动状态时按下 u 键时会触发该回调这将
每次 apache 重新启动时，flask-login 会话都会被破坏

我正在使用烧瓶登录https github com maxcountryman flask login https github com maxcountryman flask login和领域记住登录用户 http packages py
pylint：忽略 rcfile 中的多个

在我的 django 项目中我使用的是外部编写的应用程序但编写得很糟糕现在我想从我的 pylint 报告中忽略这个应用程序但是我无法让 pylint 忽略它 Pylint 已经忽略了南方的迁移如下所示 MASTER ignore
Python 线程与 Linux 中的多处理

基于此question https stackoverflow com questions 807506 threads vs processes in linux我假设创建新流程应该几乎和创造新线程在Linux中然而很少的测试显示出截

随机推荐

Android 4.4.2 仅在完整的 Java 代码动画期间在视图对象边界外部创建黑色遮罩

在这方面确实需要一些帮助请看一下这个简单的 ImageView 淡入动画使用完整的 java 代码使用 API 21 18 17 16 重新创建它效果非常好现在尝试使用 API 19 android 4 4 2 创建有趣的掩码参
Highcharts 仪表使工具提示可见并居中

当屏幕大小调整时我无法让 Highcharts 仪表的牙尖出现并保持可见并在仪表内居中在我的小提琴中您可以看到工具提示出现然后在一小段时间后消失此外当调整窗口大小时它不会保留在仪表的中心任何帮助表示赞赏我的JSFIDDLE
Flutter 将文件作为流读取

我希望用户在文本字段中输入文本当用户单击 fab 时文本将作为新行写入文件附加我希望我的应用程序读取文件的内容并将每一行显示为列表视图中输入文本字段下方的列表图块当用户输入新文本时该文本应立即出现在列表视图中我能够将文本写入
使用资源适配器调用大型机的 Jboss CICS 交互

我已经在 J boss EAP 6 2 上安装了 cicseci rar 该资源适配器是从下载的http www 01 ibm com support docview wss uid swg24008817 sthash 3k4M8smo
在不知道结构的情况下以通用方式读取 xml 文件/字符串

我想将 XML 层次结构读入内存对象树中 XML 树可以有 n 层子级我不知道确切的数字我的内存中对象具有要绑定到树控件的子属性和父属性当我不知道 xml 元素标签是如何准确调用写入时如何以通用方式将 xml 文件字符串读取到内
谁能解释一下 MySQL 外键

我知道它们是什么我的问题是如何链接它们或者当您在不同的表中具有相同的名称时它们是否会自动链接这是一个例子假设我有一个 orders 表和一个 customer 表 orders 表中的每一行都有一个 customer id 编号
QUIC 流量生成

我想知道这个社区中是否有人知道找到一种模拟 QUIC 流量配置文件的方法为了通过 WLAN WiFi 分析模拟 youtube 我想知道是否有像 iperf 这样方便的软件包谢谢巴拉特 CP 目前还没有任何模拟框架可用于测试 QU
如何在颤动中添加选项卡顶部和底部

顶部选项卡仅显示主页并且通过滚动或点击显示 3 个不同的页面底部选项卡则显示整个应用程序如菜单当我编写代码时我会得到如下图所示的视图但我无法点击或重定向页面导航代码我只给出了顶部或底部选项卡而不是两个选项卡主页 dart
使用 JavaScript 进行表单验证？

我正在尝试使用 JavaScript 进行表单验证但是我似乎没有得到任何响应甚至没有收到警报即使它在那里
user.admin 在哪里？在 Rails-devise-pundit 入门应用程序中定义？

I used RailsApps Rails composer创建一个 Rails devise pundit 入门应用程序我对 Ruby on Rails 还有点陌生对 pundit 和 Rails 4 的设计也比较陌生我正在查看代
如何在android搜索栏中添加数字刻度？

我正在尝试使用内部具有数字比例的自定义搜索栏但不起作用该搜索栏必须支持所有屏幕分辨率我怎样才能做到这样请提出您的宝贵意见我的custom seekbar xml
如何在 Google 应用引擎数据库中过滤具有空引用的行

我有一个 Model UnitPattern 它引用另一个 Model UnitPatternSet e g class UnitPattern db Model unit pattern set db ReferenceProperty
中心操作栏标题

如何在 Android 中将 Activity 的操作栏标题居中我已经看到很多关于这个特定主题的问题每个答案都回到使用自定义视图并拥有自己的工具栏我找到了一种无需创建自定义视图即可工作的解决方案在你的中有这个方法Activity
在 WooCommerce 订单编辑页面中显示产品运输类别

我正在使用一个函数该函数允许我根据每种产品的运输类别计算购物车中的多个运费功能没有问题很完美但是当我在 woocommerce 管理区域检查请求时我需要在提交方法中识别每个项目对应的类名称也就是说我需要区分每个类别的商品因
在 MS IE11 中启用全屏时无法滚动

我有一个使用 Bootstrap3 具有固定页眉和页脚的页面下面的内容是可滚动的用户可以通过 F11 或按钮使用 FullScreen API 启用全屏模式这在 Chrome 和 FF 中工作正常但在 IE11 中出现问题 F11
复制构造函数未调用

当我读到复制初始化与直接初始化时here 复制构造函数应该在复制初始化中调用为什么这里没有调用复制构造函数 include
导入且未使用错误

我使用以下导入代码收到以下错误代码包主 import log net http os github com emicklei go restful github com emicklei go restful swagger api E
Hibernate 实体中的 CDI 注入

我们在应用程序中使用 CDI JSR 299 JSF2 Seam3 0 Hibernate 3 5 6 GlassFish 3 1 1 虽然我们无法使用 Inject 在托管 bean 中注入资源 Helper POJO 但我们也无法在 H
对新创建的文档使用 Get() 时 Firestore 规则失败

在新创建的文档上使用 Firestore 规则中的 get 会导致返回值为 false 如果您等待几秒钟并命中在同一个新文档上调用 get 的安全规则则 get 将返回预期值我是否在规则和或代码中遗漏了某些内容或者这是 Firest
pandas groupby().head(n) 其中 n 是组标签的函数

我有一个数据框我想按列分组并获取每个组的头部但我希望头部的深度由组标签的函数定义如果不是可变的组大小我可以轻松做到df groupby label head n 我可以想象一个涉及迭代的解决方案df label unique 切片数

pandas groupby().head(n) 其中 n 是组标签的函数

pandas groupby().head(n) 其中 n 是组标签的函数 的相关文章

随机推荐

热门标签

pandas groupby().head(n) 其中 n 是组标签的函数的相关文章