如何将 groupby.first() 与变换函数一起使用

2023-11-21

我想使用 groupby.first() 函数查找组的第一个非空值并将该值转换为组中的每一行。

我尝试过以下代码:

import pandas as pd
import numpy as np
raw_data = {'col1': ['a','a','a','b','b','b','b','b','b','c','c','c','c','c'],
            'col2': [np.nan,np.nan,6,0,2,0,8,2,2,3,0,0,4,5]}
df=pd.DataFrame(raw_data)
df['col3'] = df.groupby('col1')['col2'].transform(lambda x: x.first())
df

我想要一个看起来像这样的 df :

  col1 col2 col3
    a NaN   6
    a NaN   6
    a 6     6
    b 0     0
    b 2     0
    b 0     0
    b 8     0
    b 2     0
    b 2     0
    c 3     3
    c 0     3
    c 0     3
    c 4     3
    c 5     3

我收到以下错误: 类型错误:first() 缺少 1 个必需的位置参数:'offset'

有趣的是,如果我运行相同的代码并将 first() 替换为 sum(),那么它将返回该组的每一行的每个组的总和。第一个()函数将不起作用。为什么不?任何帮助将不胜感激!


和你的lambda你正在尝试使用Series.first,这仅对具有 DatetimeIndex 的 Series 有意义。

你要GroupBy.first,可以使用命名别名来访问'first'.

df['col3'] = df.groupby('col1')['col2'].transform('first')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将 groupby.first() 与变换函数一起使用 的相关文章

  • 在 Mac OS 10.14.2 上的 Python 3.7 中安装 JPype1 时出错

    我在系统中安装 JPype1 时遇到错误 我正在使用Python 3 7 JPype1 是 Jaydebeapi 的依赖项 pip install Jpype1 以下是错误消息 Collecting jpype1 Using cached
  • 如何在Python中获得更精确的十进制值[重复]

    这个问题在这里已经有答案了 from math import sqrt a 1e 8 b 10 c 1e 8 x1 b sqrt b 2 4 a c 2 a x2 b sqrt b 2 4 a c 2 a print x1 format x
  • swig char ** 作为指向 char * 的指针

    我在使用 swig 和 char 作为指向变量 char 的指针时遇到问题 而不是作为 char 的列表 我找不到将指针包装到 char 的方法 目的是将连接的结果写入指针引用的 char 中 以下是我的代码 文件指针 cpp includ
  • pandas:使用运算符链接过滤 DataFrame 的行

    大多数业务在pandas可以通过操作符链接来完成 groupby aggregate apply等 但我发现过滤行的唯一方法是通过普通的括号索引 df filtered df df column value 这没有吸引力 因为它需要我分配d
  • PySerial 和多个 Python 安装出现问题

    我的 Windows 7 计算机上有 Python 2 4 4 和 3 1 3 我想使用 PySerial 听说是内置的 所以我尝试了一下import serial在两个版本中 两者都造成了Import Error 然后我从以下位置下载了w
  • 如何在 pySpark 数据框中添加行 ID [重复]

    这个问题在这里已经有答案了 我有一个 csv 文件 我在 pyspark 中将其转换为 DataFrame df 经过一番改造后 我想在 df 中添加一列 这应该是简单的行 ID 从 0 或 1 开始到 N 我将 df 转换为 rdd 并使
  • Pandas Dataframe.to_csv 小数=',' 不起作用

    在 Python 中 我正在将 Pandas Dataframe 写入 csv 文件 并希望将小数分隔符更改为逗号 像这样 results to csv D Data Kaeashi BigData ProcessMining Voorbe
  • 检查对象是否是字符串列表的列表?

    是什么elegant检查对象是否是字符串列表列表的方法 没有嵌套循环 也许这里必须是构造结构化迭代的常规方法 UPD 像这样的东西 l a b c d 1 3 e 2 f def recurse iterable levels result
  • Python:选择多个已安装模块版本之一

    在我的系统上 我多次安装了多个模块 举个例子 numpy 1 6 1安装在标准路径中 usr lib python2 7 dist packages 我有一个更新版本numpy 1 8 0安装于 local python lib pytho
  • 中断QThread睡眠

    我想知道如何暂停 QThread 然后在收到信号时恢复 我已阅读并知道我可以做这样的事情 def run self self ready False while not self ready self sleep 1 QtCore Slot
  • Django外键:获取相关模型?

    是否可以通过外键字段本身获取外键的相关模型 例如 如果我有 3 个模型 class ModelA models Model field1 models CharField max length 10 class ModelB models
  • Django:上传前调整图像大小

    我想调整图像大小 Pillow 在上传之前 我在下面编写了代码但不起作用 并得到错误 myapp list 处的属性错误 坚定的 请求方式 POST 请求网址 http 127 0 0 1 8000 myapp list http 127
  • 在 PyQt 中使用 Windows 7 任务栏功能

    我正在寻找有关将一些新的 Windows 7 任务栏功能集成到我的 PyQt 应用程序中的信息 具体来说 如果已经存在使用新进度指示器的可能性 see here http www petri co il wp content uploads
  • VS Code Pylance 不突出显示变量和模块

    我正在使用带有 Python 和 Pylance 扩展的 VS Code 我遇到的问题是 Pylance 扩展没有对模块和数据框等内容进行语法突出显示 我希望顶部的模块为绿色 df 变量为蓝色 我正在使用默认的深色 颜色主题 这是我的 VS
  • 导入pytorch时,未安装microsoft Visual C++ Redistributable

    我在一台带有 GPU 的 Windows 机器上工作 我已经在 conda 环境中安装了 pytorch conda install pytorch torchvision cudatoolkit 10 1 c pytorch 然后我运行
  • 纯Python库读写jpeg格式

    伙计们 我正在寻找 jpeg 写入 阅读会很好 但不是必需的 库的纯 python 实现 我只在以下位置创建了 TonyJPEG 库端口 http mail python org pipermail image sig 2004 Novem
  • 通过 Tweepy 在 Twitter 上更新状态时的回溯

    我一直在尝试使用 Twitter 在 Twitter 上发布我的 Rpi 读数tweepy 但首先我想检查一下是否tweepy本来可以正常工作 但事实并非如此 我正确安装了软件包 但是当我尝试运行简单的代码来发布某些内容时 出现错误 是的
  • 使用 PyCharm 分析 Django

    即使在开发环境中 我的应用程序也相当慢 所以我想找出是什么导致它变慢 以便我可以尝试修复它 我了解调试工具栏 根据它的报告 数据库查询和下载的源都不是问题 所以它一定是业务逻辑 但是 我无法使用 Django 服务器运行 PyCharm 分
  • 从另一个列表的元素创建一个新列表,引用后者的元素

    我想从前一个元素创建一个新列表 但不复制它们 这就是发生的事情 In 23 list range 10 In 24 list2 list 0 4 In 25 list Out 25 0 1 2 3 4 5 6 7 8 9 In 26 lis
  • 从 s3 获取 ogg 轨道的长度而不下载整个文件

    如何在不下载整个文件的情况下获取 ogg 文件的播放长度 我知道这是可能的 因为 HTML5 标签和 VLC 都可以在加载 URL 后立即显示整个播放长度 而无需下载整个文件 有标题或我可以阅读的内容吗 也许甚至是比特率 我可以将其除以文件

随机推荐

  • 为什么我收到错误无法等待“void”?

    private Queue
  • 一个或多个实体的验证失败。有关更多详细信息,请参阅“EntityValidationErrors”属性[重复]

    这个问题在这里已经有答案了 我在使用代码优先方法为数据库播种时遇到此错误 一个或多个实体的验证失败 有关更多详细信息 请参阅 EntityValidationErrors 属性 说实话我不知道如何检查验证错误的内容 Visual Studi
  • 双向多对多关系中的循环引用

    我的实体中存在双向多对多关系 请参阅下面的示例 public class Collaboration JsonManagedReference COLLABORATION TAG private Set
  • Meteor 通过邮件查询其他用户

    我正在尝试使用以下命令通过电子邮件查询用户Meteor users findOne emails address email protected 它在 mongo shell 中工作 但在 Meteor 中返回未定义 有任何想法吗 UPDA
  • 固定元素在 Chrome 中消失

    当在我构建的网站上滚动时 使用 CSS 属性position fixed按预期工作 将导航栏保留在页面的最顶部 然而 在 Chrome 中 如果您使用导航栏中的链接 有时消失 通常 您单击的项目仍然可见 但并非总是如此 有时整个事情都会消失
  • AVPlayer 顶部绘制按钮

    我必须在视频顶部绘制标签或按钮relay next previous leave comment 视频列表有它 一旦用户从表中选择一项 就需要播放 播放器播放完成后 这些按钮或标签应该出现在视频顶部 这是我的代码 comPlayerCont
  • 在 LINQ 查询中使用 DateTime?.Value.TimeOfDay

    我正在尝试在 ASP NET MVC 3 上使用 LINQ 进行查询 我有一个模型 我们称之为事件 此 Event 对象有一个 Date 属性 即 DateTime 我想要的是获取 2 个时间跨度之间的事件 现在我的代码如下所示 TimeS
  • 对 3 个具有关系的实体进行建模

    假设我们的环境中有三个实体 Teacher Student and Course 每位教师拥有 教授 1 门或以上课程 且每门课程由 0 名或以上教师提供 每个学生已选修 1 门或多门课程 每门课程由 0 名或更多学生选修 每个教师有 0
  • 使用 AndroidHttpClient 的 SSL/TLS 协议和密码套件

    编辑 如果我原来的帖子措辞不好 我深表歉意 这导致了一些混乱 表现为对原始帖子的评论 那么让我再试一次 我从一个问题开始 我想解决 Android 上的问题 但不知道如何解决 我花了很多时间在网上寻找解决方案 但没有发现任何关于这个问题的讨
  • 如何使用 CMake 链接到 C 数学库?

    我如何添加math库到我的 CMake 文件 这post参考文献添加一个目标链接库 但我对 C An 不太熟悉附加帖子 有人可以举个例子吗 文档我正在使用 C 并且收到一个undefined reference to pow 使用数学标题的
  • 同一页面上具有相同选项的多个传单地图

    我对 leaflet js 还很陌生 我试图弄清楚如何将具有相同选项和图层集的相同地图分配给不同的 HTML 容器 而不必每次都删除并添加新的容器 我曾经处理 Open Layers 2 13 并且我有 map render div 每次我
  • phpmyadmin:如何取消导入大数据库的时间限制

    如何删除 phpmyadmin 中导入操作的时间限制 由于限制 我无法上传大数据库 我必须再次登录数据库 Thanks 我使用MySQLBigDump 昨天对我来说效果很好
  • 带注释的控制器中的动态命令类

    从 Spring MVC 3 开始 AbstractCommandController已弃用 因此您不能再在中指定命令类setCommandClass 相反 您可以在请求处理程序的参数列表中对命令类进行硬编码 例如 RequestMappi
  • 如何合并/扩展不同 JAR 中的持久性单元?

    我将 JPA 持久性用于我的数据模型 并使用 Eclipselink 作为持久性提供程序 我有一个模块化 OSGi 应用程序 其中一个模块包含标准数据模型和一个持久单元 该单元自动包含包中的所有实体 持久性提供程序位于另一个模块中 该模块运
  • MySQL 中的交集

    我有两个表 记录和数据 记录有多个字段 名字 姓氏等 这些字段中的每一个都是存储实际值的数据表的外键 我需要搜索多个记录字段 下面是一个使用 INTERSECT 的示例查询 但我需要一个可以在 MySQL 中运行的查询 SELECT rec
  • 从 Android Activity 调用 javascript 函数

    我想从 android 活动调用 javascript 函数 但它似乎不起作用 我使用了 android webview 函数 webview loadUrl javascript function 这是我的安卓代码 package com
  • 在 Delphi XE 中构建事件宏

    根据Delphi的帮助文件 当我打开对话框将构建事件添加到项目选项时 该对话框应显示我可以在构建事件的命令行上使用的宏 占位符 列表 当我在 Delphi XE 中尝试此操作时 宏列表为空 帮助文件也没有说明哪些宏可用 我可以找到 那么 哪
  • 如何将字符串转换为字典或列表?

    我有诸如以下的字符串 1 2 3 and a 1 b 2 如何将它们转换为列表 字典 有人提到ast literal eval or eval可以解析转换为列表 字典的字符串 有什么区别ast literal eval and eval a
  • Firestore - 检查模块与服务器的连接状态

    我注意到关闭互联网连接并重新打开后 while my Android app仍在运行 无论是否在后台 则需要Firestore模块需要很长时间才能重新获得与服务器的连接 大约一分钟 并且我无法进行任何操作Firestore操作直到恢复连接
  • 如何将 groupby.first() 与变换函数一起使用

    我想使用 groupby first 函数查找组的第一个非空值并将该值转换为组中的每一行 我尝试过以下代码 import pandas as pd import numpy as np raw data col1 a a a b b b b