Python - Pandas：选择每组的第一个观察结果

2023-12-14

我想使用以下命令将我以前的 SAS 代码改编为 Pythondataframe框架。在 SAS 中，我经常使用这种类型的代码（假设列按 group_id 排序，其中 group_id 取值 1 到 10，其中每个 group_id 有多个观察值）：

data want;set have;
by group_id;
if first.group_id then c=1; else c=0;
run;

所以这里发生的是我为每个 id 选择第一个观察结果并创建一个新变量c这需要价值1 and 0对于其他人。数据集如下所示：

我怎样才能在Python中使用dataframe？假设我从group_id仅矢量。

如果您使用的是 0.13+，您可以使用cumcount分组方法：

In [11]: df
Out[11]: 
   group_id
0         1
1         1
2         1
3         2
4         2
5         2
6         3
7         3
8         3

In [12]: df.groupby('group_id').cumcount() == 0
Out[12]: 
0     True
1    False
2    False
3     True
4    False
5    False
6     True
7    False
8    False
dtype: bool

您可以强制数据类型为 int 而不是 bool：

In [13]: df['c'] = (df.groupby('group_id').cumcount() == 0).astype(int)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

Python - Pandas：选择每组的第一个观察结果的相关文章

使用python编辑html，但是lxml将漂亮的html实体转换为奇怪的编码

我正在尝试使用 python 带有 pyquery 和 lxml 来更改和清理一些 html Eg html div p It 146 s a spicy meatball p div lxml html clean 函数 clean ht
导入 SciPy 或 scikit-image，“from scipy.linalg import _fblas：导入错误：DLL 失败”

我正在导入 from scipy import misc io 但我收到这些错误 Traceback most recent call last File C work asaaki code generateProposals py li
让 python 脚本打印到终端而不作为标准输出的一部分返回

我正在尝试编写一个返回值的 python 脚本然后我可以将其传递给 bash 脚本问题是我想要在 bash 中返回一个单一值但我想要一些东西一路打印到终端这是一个示例脚本我们称之为 return5 py usr bin env p
如何进行重定向并保留查询字符串？

我想进行重定向并保留查询字符串就像是self redirect加上发送的查询参数那可能吗 newurl my new route urllib urlencode self request params self redirect ne
python win32com.client 调整窗口大小

我正在使用 Python 3 4 1 通过 win32com client 控制 Windows 应用程序我可以激活它我可以发送击键点击等现在我想知道是否有办法调整窗口大小并将其设置到特定位置我找不到方法这里有一些代码片段所以
matplotlib - 将文本包装在图例中

我目前正在尝试绘制一些pandas数据通过matplotlib seaborn 然而我的一个专栏标题特别长拉长了情节考虑以下示例 import random import pandas as pd import matplotlib p
Python正则表达式替换引号中的文本（引号本身除外）

例如我有一个测试字符串 content I opened my mouth Good morning I said cheerfully 我想使用正则表达式删除双语音标记之间的文本但不删除语音标记本身所以它会返回 I opened m
Plotly：如何设置文本格式（下划线、粗体、斜体）

使用注释时我尝试在绘图中为文本添加下划线我使用添加注释 import plotly graph objects as go g go FigureWidget make subplots rows 1 cols 1 g update l
python os.fork 使用相同的 python 解释器吗？

据我所知 Python 中的线程使用相同的 Python 解释器实例我的问题是与创建的流程相同os fork 或者每个进程创建的os fork有自己的翻译吗每当你 fork 时整个 Python 进程都会在内存中复制包括Python
如何在 tkinter 后台运行函数[重复]

这个问题在这里已经有答案了我是 GUI 编程新手我想用 tkinter 编写一个 Python 程序我想要它做的就是在后台运行一个可以通过 GUI 影响的简单函数该函数从 0 计数到无穷大直到按下按钮为止至少这是我想要它做的但
在添加数据之前使用 Python gdata 清除工作表中的行

我有一个 Google 电子表格我使用 python 脚本和 gdata 库填充值如果我多次运行脚本它会将新行附加到工作表中我希望脚本在填充之前首先清除行中的所有数据这样每次运行时我都会有一组新的数据脚本我尝试过使用 Updat
类型错误：无法连接“str”和“int”对象有人可以帮助新手使用他们的代码吗？

感谢任何帮助还有任何重大缺陷或您在格式或基本方面看到的任何重大缺陷请指出谢谢 day raw input How many days locations raw input Where to days str day location
我应该在哪里对对象和字段进行 django 验证？

我正在创建一个 Django 应用程序它使用 Django Rest Framework 和普通的 django views 作为用户的入口点我想对模型的独立字段以及整个对象进行验证例如字段根据正则表达式函数输入的车牌是否正确与
从函数在 python 3 中创建全局变量

我想知道为什么在函数结束后我无法访问变量 variable for raw data 代码是这样的 def htmlfrom Website URL import urllib request response urllib request
model.predict() 返回类而不是概率

Hello 我是第一次使用 Keras 我训练并保存了一个模型作为 json 文件及其权重该模型旨在将图像分为 3 个类别我的编译方法 model compile loss categorical crossentropy optim
如何在Python中不使用库函数将字符串转换为整数？

我正在尝试转换 a 546 to a 546 不使用任何库函数我能想到的最纯粹 gt gt gt a 546 gt gt gt result 0 gt gt gt for digit in a result 10 for d in 01
为什么我的 Python 散点图不起作用？

我使用 pylab 创建了一个非常简单的散点图 pylab scatter engineSize fuelMile pylab show 该程序的其余部分不值得发布因为正是该行给我带来了问题当我将散点更改为绘图时它会绘制数据图
如何将另一整列作为参数传递给 pandas fillna()

我想用另一列中的值填充一列中的缺失值使用fillna方法我读到循环遍历每一行将是非常糟糕的做法最好一次完成所有事情但我不知道如何使用fillna 之前的数据 Day Cat1 Cat2 1 cat mouse 2 dog eleph
如何从 Pandas 数据框函数调用中回顾之前的行？

我正在研究回测交易系统我有一个包含 OHLC 数据的 Pandas 数据框并添加了几个计算列 https stackoverflow com questions 12376863 adding calculated columns t
处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

我正在尝试加载 CSV 文件这个文件 https drive google com file d 13a eVeSzy6HkhffQw32S57U hm5YCj0 view usp sharing 创建一个多索引多级数据帧它有5 五指

随机推荐

FMX - Trayicon 消息处理

我在使用 FMX XE3 Windows 设置托盘图标时遇到问题我使用的代码可以在无数线程中找到但我没有得到图标工作的消息处理为了说明这一点我创建了一个测试应用程序它在 FormCreate 中设置 TrayIcon 数据并使用按
伪元素中是什么使伪元素成为伪元素？

在我的另一个问题中CSS 中的伪是什么意思我得到了这个答案伪元素是行为类似于元素但不是元素的东西是什么使得伪元素不是元素伪元素不在 dom 中这就是它不是元素的原因它是由 CSS 创建的元素伪元素无法被各种技术看到或操纵
使两个重叠的 div 都可点击？

是否可以制作两个重叠的 div 并且都可以点击我已将 div 附加到两个容器 container and container2 他们的风格一模一样只是有一个不同flex direction column 其中之一是flex direct
使用 pyodbc 从 WSL2 连接到 Windows 上的 SQL Server - 连接超时

我正在尝试从 WSL2 连接到 Windows 上的 SQL 服务器但收到连接超时错误我正在使用这段代码 import pyodbc server DESKTOP LFOSSEF database sportsanalytics use
如何因不活动而注销用户

纯服务器端 PHP 每次用户提交表单时我都会更新数据库中的上次活动时间我想进行定期检查并强制注销非活动用户以释放许可证我该怎么做呢我是否还应该将会话 ID 存储在数据库中然后销毁会话这将为另一个用户释放许可证当第一个用户最
对齐捕获的深度和 RGB 图像

之前有过提问 here here and here 与我的问题相关但是我的问题有一个不同的方面我在之前提出的任何问题中都没有看到过我使用 Kinect 深度传感器获取了用于研究的数据集该数据集采用 png 图像格式用于特定时刻的深
Swagger-ui 与 Spring 安全性

我有一个带有身份验证服务的简单 REST 应用程序我尝试向其中添加 swagger 和 swagger ui 但我只能看到我的端点 v2 api docs In swagger ui html我只看到端点组但无法扩展任何列表在 chr
本地化 (l10n)：为我的 mozilla 插件设置默认语言

我正在开发一个 Mozilla 插件并实现 l10n 我的问题是如何为我的插件设置默认语言当我的插件不支持语言时它会切换到默认语言当 Mozilla Firefox 的语言改变时插件会改变它的语言环境吗如何更改我的 Firefo
图像周围的 Silverlight 文本

我正在尝试将文本包裹在图像周围就像使用 html float 属性一样有没有办法在 silverlight 3 中实现这一点 Thanks 我不久前解决了这个问题据我所知确实没有什么好方法这会起作用尽管只是很痛苦为了简化解释
如何配置 PyCharm 在没有 ^space 的情况下自动完成代码？

When typing in PyCharm I used to automatically get code completion suggestions without having to hit Ctrl Space I must h
没有提升的 WCF wsdualhttpbinding 客户端

我创建了一个 Windows 服务服务器和一个使用 WCF wsdualhttpbinding 回调功能的 WPF 客户端两个软件之间的所有内容都可以正常工作但我遇到的问题是客户端需要以管理员权限运行才能工作这是可以理解的因为它
适用于 VB6 和 .net 应用程序的最佳 IPC

在我们的应用程序文档管理系统中我们应该收到屏幕更改的通知或通知其他程序屏幕更改以便使两个应用程序查看相同的数据一个是订单履行应用程序另一个是订单履行应用程序原始传真的文档查看器履行应用程序是用 vb6 编写的文档管理器是用
SQL Server 文件名和版本[关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案我很幸运能够成为一台服务器的管理员但我不知道这台服务器上有多少个版本的sql server 当我打开Microsoft SQL Server文件时有一些名为80 90 100 1
线性渐变在 IE 11 中不起作用

我有一个 css 规则可以在 chrome firefox 中正常工作并且曾经在 IE 中工作现在我看似有效的 css 不起作用了 s tour border radius 5px margin 0 auto width 250px
Java HttpClient - 通过代理发布文件

我尝试使用代理从我的网络应用程序调用外部网站此外还需要在此外部网站上执行 POST 请求我正在使用 tomcat7 org apache httpcomponents 4 3 4 spring 在没有代理的情况下进行跟踪是有效的我得
dropwizard 应用程序中的配置更改以与 React browserHistory 配合使用

我有一个react应用程序运行在dropwizard服务器这bundle js在 ui 上提供当我打开 ui 上的 url 并导航应用程序并转到 ui content 时它工作正常但是当我尝试刷新特定页面例如 app conte
在 ssrs 中显示 10 行的最大值

我有一份报告其中我想显示 10 名具有最高薪水的员工数据我想通过 SSRS 来完成此操作请帮助我请通过 SSRS 而不是 SSMS 来完成提前致谢我假设您有一个数据集每个员工一行按工资降序排序您可以申请一个TOP N过滤到
如何在 Swift 中使用 CTFontCopyCharacterSet() 获取字体的所有字符？

如何获取字体的所有字符CTFontCopyCharacterSet 在斯威夫特对于 macOS 在实施该方法时出现了该问题OSX CGGlyph 到 UniChar用斯威夫特回答 func createUnicodeFontMap Get
禁用的文本框丢失视图状态

我根据所选的下拉菜单动态生成表单该表格由字段组成十进制值的数据输入几个文本字段必须在末尾添加所有小数值并用该值更新 Total TextBox 总计文本框被禁用当用户输入值后单击表单上的保存按钮时除了禁用的文本框之外整个表
Python - Pandas：选择每组的第一个观察结果

我想使用以下命令将我以前的 SAS 代码改编为 Pythondataframe框架在 SAS 中我经常使用这种类型的代码假设列按 group id 排序其中 group id 取值 1 到 10 其中每个 group id 有多个观

Python - Pandas：选择每组的第一个观察结果

Python - Pandas：选择每组的第一个观察结果 的相关文章

随机推荐

热门标签

Python - Pandas：选择每组的第一个观察结果的相关文章