如何迭代 pandas DataFrameGroupBy 并选择特定列的每个分组变量的所有条目？

2023-12-27

假设有一个这样的表：

Id | Type | Guid

我在这样的表上执行以下操作：

df = df.groupby('Id')

现在我想先迭代一遍n行和每个特定的Id as a list打印列中所有相应的条目Guid。请帮我解决问题。

我想我会这样做：

创建一些数据进行测试

df = pd.DataFrame({'Id':np.random.randint(1,10,100),'Type':np.random.choice(list('ABCD'),100),'Guid':np.random.randint(10000,99999,100)})

print(df.head()
   Id Type   Guid
0   2    A  89247
1   4    B  39262
2   3    C  45522
3   1    B  99724
4   4    C  51322

选择 n 作为要返回的记录数并进行分组

n = 5
df_groups = df.groupby('Id')

使用 for 循环迭代 df_group 并打印

for name,group in df_groups:
    print('ID: ' + str(name))
    print(group.head(n))
    print("\n")

Output:

ID: 1
    Id Type   Guid
3    1    B  99724
5    1    B  74182
37   1    D  49219
47   1    B  81464
65   1    C  84925


ID: 2
    Id Type   Guid
0    2    A  89247
6    2    A  16499
7    2    A  79956
34   2    C  56393
40   2    A  49883
.
.
.

编辑要打印列表中每个 ID 的所有 Guid，您可以使用以下命令：

for name,group in df_groups:
    print('ID: ' + str(name))
    print(group.Guid.tolist())
    print("\n")

Output:

ID: 1
[99724, 74182, 49219, 81464, 84925, 67834, 43275, 35743, 36478, 94662, 21183]


ID: 2
[89247, 16499, 79956, 56393, 49883, 97633, 11768, 14639, 88591, 31263, 98729]


ID: 3
[45522, 13971, 75882, 96489, 58414, 22051, 80304, 46144, 22481, 11278, 84622, 61145]


ID: 4
[39262, 51322, 76930, 83740, 60152, 90735, 42039, 22114, 76077, 83234, 96134, 93559, 87903, 98199, 76096, 64378]


ID: 5
[13444, 55762, 13206, 94768, 19665, 75761, 90755, 45737, 23506, 89345, 94912, 81200, 91868]
.
.
.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

SQLite

sklearnpandas

如何迭代 pandas DataFrameGroupBy 并选择特定列的每个分组变量的所有条目？的相关文章

virtualenvwrapper 函数在 shell 脚本中不可用

所以我再一次制作了一个很棒的 python 程序它让我的生活变得更加轻松并节省了大量时间当然这涉及到一个 virtualenv 用mkvirtualenvvirtualenvwrapper 的功能该项目有一个requiremen
我可以在 matplotlib 中的绘图左侧放置一个垂直颜色条吗？

来自颜色条方法的 matplotlib 命令摘要 http matplotlib org api pyplot api html highlight colorbar matplotlib pyplot colorbar我知道关键字参数or
在多核上运行 python 线程

我知道Python 2 7不允许在不同的内核上运行多个线程你需要使用multiprocessing模块以实现某种程度的并发性我正在看concurrent futuresPython 3 4 中的模块是否使用ThreadPoolExec
Python Apache Beam 端输入断言错误

我对 Apache Beam Cloud Dataflow 还很陌生所以如果我的理解不正确我深表歉意我正在尝试通过管道读取大约 30 000 行长的数据文件我的简单管道首先从 GCS 打开 csv 从数据中提取标题通过 ParDo
将列表值转换为 pandas 中的行

我有数据帧其中一列具有相同长度的 numpy ndarray 值 df list 0 Out 92 array 0 0 0 0 29273096 0 30691767 0 27531403 我想将这些列表值转换为数据框并从 df iloc
lmfit模型拟合然后预测

我正在领养lmfit进行曲线拟合并使用拟合模型进行预测然而下面的代码并没有达到我想要的效果能否请你帮忙谢谢 import numpy as np from lmfit import Model def linearModel x a0
matplotlib：渲染到缓冲区/访问像素数据

我想使用 matplotlib 生成的图作为 OpenGL 中的纹理到目前为止我遇到的 matplotlib 的 OpenGL 后端要么不成熟要么已经停止使用所以我想避免使用它们我当前的方法是将图形保存到临时 png 文件中并从
Python FTP下载550错误

我编写了一个 ftp 爬虫来下载特定文件它会一直工作直到找到要下载的特定文件然后抛出此错误 ftplib error perm 550 该文件存在于我的下载文件夹中但文件大小为 0 kb 我需要转换某些内容才能下载吗我可以访问 f
提高光线追踪命中功能的性能

我有一个简单的 python 光线追踪器渲染 200x200 的图像需要 4 分钟这对于我的口味来说绝对是太多了我想改善这种情况几点我为每个像素发射多条光线以提供抗锯齿功能每个像素总共发射 16 条光线 200x200x16
matplotlib vlines 图中未应用 y 轴的最小值

我正在 matplotlib 中绘制 vlines 图数据集中的所有 y 值如下 gt 0 我希望 y 轴最底部的刻度能够读取0 但相反我得到 500 这是代码 usr bin env python import numpy as np
使用 Python-VLC 的 PyInstaller：无属性“media_player_new”错误

我使用 Python VLC 创建视频播放器并使用 PyInstaller 在 Windows 10 计算机上生成可执行文件最初它给了我错误 Import Error Failed to load dynlib dll libvlc
机器学习的周期性数据（例如度角 -> 179 与 -179 相差 2）

我使用 Python 进行核密度估计并使用高斯混合模型对多维数据样本的可能性进行排名每一条数据都是一个角度我不确定如何处理机器学习的角度数据的周期性首先我通过添加 360 来删除所有负角因此所有负角都变成了正角 179 变成了
Django 1.7：如何使用 html/css 文件作为模板发送电子邮件

从 Django 1 7 开始可以send email 使用新参数 html message 不幸的是没有关于如何使用它的全面指南新手友好或者至少我找不到它我需要使发送的电子邮件变得漂亮因此我试图弄清楚如何将我的消息包含到 h
在Python中随机交错2个数组

假设我有两个数组 a 1 2 3 4 b 5 6 7 8 9 我想将这两个数组交错为变量 c 注意 a 和 b 不一定具有相同的长度但我不希望它们以确定性的方式交错简而言之仅仅压缩这两个数组是不够的我不想要 c 1 5 2 6 3
为数据集生成随机 JSON 结构排列

我想生成 JSON 结构的许多不同排列作为同一数据集的表示最好不需要对实现进行硬编码例如给定以下 JSON name smith occupation agent enemy humanity nemesis neo 应该产生许多不同
如何创建简单的梯度下降算法

我正在研究简单的机器学习算法从简单的梯度下降开始但在尝试用 python 实现它时遇到了一些麻烦这是我试图重现的示例我获得了有关房屋的数据居住面积以英尺为单位和卧室数量以及最终的价格居住面积英尺2 2104 卧室 3 价
在自定义 keras 层的调用函数中传递附加参数

我创建了一个自定义 keras 层目的是在推理过程中手动更改前一层的激活以下是基本层它只是将激活值乘以一个数字 import numpy as np from keras import backend as K from keras
JSONDecodeError：额外数据：Python [重复]

这个问题在这里已经有答案了我使用以下代码从文件加载 json file file name obj list with open file as f for json obj in f obj list append loads json
如何在不同的目录中执行python脚本？

Solved对于可能觉得这有帮助的人请参阅下面我的答案我有两个脚本 a py 和 b py 在我当前的目录 C Users MyName Desktop MAIN 中我运行 gt python a py 第一个脚本 a py 在我当前
在Python中使用os.makedirs创建目录时出现权限问题

我只是想处理上传的文件并将其写入工作目录中该目录的名称是系统时间戳问题是我想以完全权限创建该目录 777 但我不能使用以下代码创建的目录755权限 def handle uploaded file upfile cTimeStamp

随机推荐

使用渲染插件将模板转换为 pdf 时，css 背景不起作用

我正在使用渲染插件在 grails 中生成 pdf 我正在使用由 css 准备的背景颜色代码在这里 container content mainContent block backgroundStyle background ffffff
android：将字节转换为dex时出错

因此在升级 build gradle 项目后运行项目时出现以下错误 dependencies classpath com android tools build gradle 2 0 0 alpha2 NOTE Do not place
Rspec：如何在控制器规范中分配实例变量

class TestController lt AplicationController private def some method unless my variable nil return true end end end 我想测试
如何在Visual Studio中生成aspx.designer.cs？ [复制]

这个问题在这里已经有答案了我当前的 aspx designer cs 无法正常工作有人知道如何在解决方案资源管理器中重新生成 aspx designer cs 吗 Found here http labs kaliko com 2010
有没有办法在Java中声明一个方法“友好”？

我知道可以设置属性public friendly or private指定其可见性有没有办法我可以声明friendly方法我希望它只能从同一包的类的对象访问谢谢你这里是初学者通过不输入可见性修饰符 Java 使用包私有范围查看以
如何创建具有共享表结构的多租户数据库？

我们的软件目前运行在 MySQL 上所有租户的数据都存储在同一个schema中由于我们使用 Ruby on Rails 我们可以轻松确定哪些数据属于哪个租户然而当然也有一些公司担心他们的数据可能会受到损害因此我们正在评估其他解决方
如何限制对 codeigniter 文件夹中文件的访问

您好我已经使用 codeigniter 来开发我的网站但是当在 google 中搜索我的网站时 google 会显示特定文件夹中文件 pdf 的链接用户可以直接查看这些文件 pdf 而无需登录我想限制谷歌直接显示这些文件的链接例如
Windows 身份验证与表单身份验证

我试图了解 Windows 身份验证表单身份验证的概念及其差异我很困惑有人可以帮我澄清这一点吗 Thanks Windows 身份验证Provider 是 ASP NET 应用程序的默认身份验证提供程序当使用此身份验证的用户登录到应
变量值由函数调用决定

这可能很奇怪但我想声明一个没有固定值的变量但以某种方式链接到函数的结果目标是让最终用户操作变量但每次使用变量的值时其值可能会发生变化这是我得到的当前结果 from random import randint def rand
如何根据 pandas 中另一列的条件生成具有值的新列

我有一个如下数据框我需要生成一个名为 Comment 的新列对于指定的值它应该显示 Fail Input Tel MC WT AAA Rubber 9999 BBB Tree 0 CCC Rub 12 AAA Other 20 BBB
依赖项和latest.release

我们目前使用 grails 2 2 并尝试升级到 2 4 但遇到了问题在BuildConfig groovy中我们有一些使用latest release的依赖项和插件例如 com example myplugin latest rel
XCode 4.2 clang 段错误

刚刚升级到 Lion 和 xcode 4 2 现在当我重新编译程序时我收到以下错误 Users XXX Code iPhone XXX Code Scenes GameScene mm 1806 35 current parser to
在哪里可以访问 Django Rest Framework 中的请求参数？

我使用 Django Rest Framework 和 python requests 并通过 URL 传递多个变量如下所示 GET api boxobjects format json make Prusa model i3 plast
如何符号化Xcode崩溃日志？

Xcode 5 管理器有一个视图可以列出所有崩溃日志我们可以将崩溃日志拖放到此处但从 Xcode 6 开始我知道他们已经将设备移出了组织并为其提供了一个新窗口但我没有找到一个地方可以查看我在升级到 Xcode 6 后拖放到 Xc
Gmail Android 应用程序如何为邮件对话视图发挥 webview-header-overlay 的魔力？

Using 层次结构查看器 http developer android com guide developing debugging debugging ui htmlGmail 对话视图上显示了一个有趣且不寻常的布局层次结构 All单个
具有背压的 RxJava 主题 - 仅在下游完成消费后才发出最后一个值

我有一个 PublishSubject 调用onNext 在某些 UI 事件上订阅者通常需要 2 秒才能完成其工作我需要忽略所有来电onNext 除了订户忙时的最后一个我尝试了以下方法但是我无法控制流量请求似乎排队并且每个请求都得
由于 SassError: 找不到要导入的样式表，ng 测试失败

我有一些 scss我在模块中包含的组件中导入的文件当我为开发或生产构建项目时一切都很好但是当我运行时ng test我看到一堆错误内容如下 SassError SassError Can t find stylesheet to im
获取2个html标签之间的文本c#

我试图获取提供的 html span 之间的数据在本例中为 31 这是原始代码来自 Chrome 中的检查元素 span class tooltip 31 span 我有一个包含页面源代码的富文本框这里是相同的代码但位于富文本框的第
在 Laravel 上使用 Sail 时出现无匹配清单错误

我正在尝试使用 Laravel Sail 在 Laravel 中设置一个基本项目根据Laravel 官方文档 https laravel com docs 8 x getting started on macos以下命令将创建一个名为 e
如何迭代 pandas DataFrameGroupBy 并选择特定列的每个分组变量的所有条目？

假设有一个这样的表 Id Type Guid 我在这样的表上执行以下操作 df df groupby Id 现在我想先迭代一遍n行和每个特定的Id as a list打印列中所有相应的条目Guid 请帮我解决问题我想我会这样做创建一些数

如何迭代 pandas DataFrameGroupBy 并选择特定列的每个分组变量的所有条目？

编辑要打印列表中每个 ID 的所有 Guid，您可以使用以下命令：

如何迭代 pandas DataFrameGroupBy 并选择特定列的每个分组变量的所有条目？ 的相关文章

随机推荐

热门标签

如何迭代 pandas DataFrameGroupBy 并选择特定列的每个分组变量的所有条目？的相关文章