使用 pandas 从每组中随机选择一行

2024-03-15

我有一个熊猫数据框df显示如下：

Month   Day mnthShape
1      1    1.016754224
1      1    1.099451003
1      1    0.963911929
1      2    1.016754224
1      1    1.099451003
1      2    0.963911929
1      3    1.016754224
1      3    1.099451003
1      3    1.783775568

我想从以下位置获得以下信息df:

Month   Day mnthShape
1       1   1.016754224
1       2   1.016754224
1       3   1.099451003

哪里的mnthShape值是从索引中随机选择的。即，如果查询是 df.loc[(1, 1)]，它应该查找 (1, 1) 的所有值，并从中随机选择一个要在上面显示的值。

Use groupby with apply每组随机选择一行。

np.random.seed(0)
df.groupby(['Month', 'Day'])['mnthShape'].apply(np.random.choice).reset_index()

   Month  Day  mnthShape
0      1    1   1.016754
1      1    2   0.963912
2      1    3   1.099451

如果您想知道采样的行来自哪个索引，请使用pd.Series.sample with n=1:

np.random.seed(0)
(df.groupby(['Month', 'Day'])['mnthShape']
   .apply(pd.Series.sample, n=1)
   .reset_index(level=[0, 1]))

   Month  Day  mnthShape
2      1    1   0.963912
3      1    2   1.016754
6      1    3   1.016754

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

Random

使用 pandas 从每组中随机选择一行的相关文章

将 for 循环转换为列表理解

我有一个for循环将字符串列表中每个元素的子字符串与另一个字符串列表中的元素进行比较 mylist for x in list1 mat False for y in list2 if x 14 in y mat True if not
Cassandra：在 session.execute() 期间“无法完成对任何主机的操作”

卡桑德拉版本 1 2 2Thrift API 版本 19 35 0CQL支持的版本 2 0 0 3 0 1 默认 3 0 1 适用于 python 3 4 的 cassandra 驱动程序使用 sudo 运行 cassandra bin c
是否有与 f 字符串语法等效的可调用函数？

每个人都喜欢 Python 3 6 的新 f 字符串 In 33 foo blah bang In 34 bar blah In 35 f foo bar Out 35 bang 然而虽然在功能上非常相似但它们的语义并不完全相同str
IP保持不变

我正在尝试通过代码连接到 Tor 并更改我的身份到目前为止我得到的结果是我连接成功但无法更改我的身份这是我的代码 import socket import socks import httplib def connectTor sock
Pycharm 出现 Kivy 错误 [严重] [应用程序] 无法获取窗口，中止

我正在尝试让示例 Kivy 代码之一在我的机器上运行我使用的是 Pycharm 社区版 2017 1 安装了 anaconda python 2 7 和 Kivy 1 9 我已使用项目设置将 Kivy 模块和 Pygame 模块安装到项目
为什么tcl/tkinter只支持BMP字符？

我正在尝试在基于 tkinter 和 tcl 构建的 gui 中查询和显示 utf 8 编码字符但是我发现 tkinter 无法显示 4 字节字符即大于 U FFFF 的 unicode 代码点为什么会这样呢实现非 BMP 字符对
Flask / Werkzeug - 套接字卡在 CLOSE_WAIT 中

我遇到过一种情况 API 构建于Flask 宁静 https github com flask restful flask restful间歇性变得无反应目前它从 Werkzeug 运行我知道它仅用于非生产用途并且是单线程的让事情变
为什么del是Python中的指令而不是方法？ [复制]

这个问题在这里已经有答案了为什么Python的创建者更喜欢这种语法指令 del list index 超过这个方法 list del index 在我看来这del属于同一类别 append remove find ETC 因此应该
“unicode”对象没有属性“_meta”

我正在尝试创建一个视图用户在其中从下拉菜单中选择一个选项提交它然后返回一些数据具体来说他们将从数据库中的模型中进行选择并返回该类的所有实例我使用 django tables2 输出数据以便可以排序但这是我的症结所在 Vie
Django：在管理界面中显示多对多项目的列表

这可能是一个简单的问题但我似乎无法理解我在 models py 中有两个简单的模型 Service 和 Host Host services 与 Service 具有 m2m 关系换句话说一台主机有多个服务一个服务可以驻留在多个主
动态组装 Python 模块，动态导入

我正在努力让自己熟悉importlib钩子我想实现直接导入用其他语言编写的非Python文件并维护源映射的能力因此提高SyntaxError带有行号的 s 仍然会给出有意义的堆栈跟踪我加载外部文件的方法是组装 Pythonic 源代码
使用 Python 访问 MP3 音乐数据

我正在尝试编写一个 Python 脚本用于使用歌曲的数据作为比较的基础来搜索重复的 mp3 4 文件我的情况涉及许多文件名相似但 ID3 标签不同的 mp3 4 文件起初我尝试循环并使用 md5 来查找重复文件忽略文件名当然当
包含文件中的块未被扩展模板填充

我有一个如下所示的模板 include base top html with context include base nav html with context div Stuff block content endblock div i
从 DST 感知日期时间对象在 Dataframe 中创建 pandas DatetimeIndex

我从在线 API 收集了一系列数据点每个数据点都有一个值和一个 ISO 时间戳不幸的是我需要循环它们所以我将它们存储在临时的dict然后从中创建一个 pandas 数据帧并将索引设置为时间戳列简化示例 from datetime i
在 C++ 中运行 python [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个用 C 编写的应用程序和一个测试系统也是用 C 编写的测试系统非常复杂并且很难改变我只想做一些小的改变我的班级是这样的
将2个暗淡数组“列表列表”输出到python中的文本文件

简单的问题我正在创建一个两个暗淡的数组 ddist 0 d for in 0 d 在下面的代码中使用列表它使用 gis 数据输出距离我只是想要一种简单的方法来获取数组列表的结果并将其输出到保持相同的 N N 结构的文本文件我过去曾
为什么for循环只显示最后一个循环的结果

我有这个样本矩阵 X1 X2 X3 X4 1 F F F F 2 C C C C 3 D D D D 4 A A A A 我正在尝试使用 for 循环来获取每列中唯一音高的数量我正在尝试这样做 y lt read csv file fra
异常：AttributeError：使用 Azure Function 和 Python 的“DefaultAzureCredential”对象没有属性“signed_session”

我编写了一个运行 Python3 的 Azure 函数来简单地打开 Azure VM 该函数应用程序具有系统分配的托管标识我已为其授予 VM 贡献者角色为了让该函数使用托管标识我使用了 DefaultAzureCredential 类
我可以在 psycopg2 中使用 md5 身份验证吗？

经过两个小时的阅读文档源代码和帮助线程后我放弃了我无法让 psycopg2 使用 md5 字符串进行身份验证根据this http bytes com topic python answers 42597 psycopg authe
为文件中的每个单词创建字典并计算其后面的单词的频率

我正在尝试解决一个难题却迷失了方向这就是我应该做的 INPUT file OUTPUT dictionary Return a dictionary whose keys are all the words in the file br

随机推荐

Android 上的 UDP 视频流

我有一个 Android 项目需要构建一个客户端应用程序来接收 UDP 或 RTP 单播视频流并播放它们不幸的是我似乎无法使其正常工作并且已经广泛搜索了解决方案我已经在 Xoom Android 3 2 和 Nexus S And
AutoMapper 使用私有设置器映射属性

是否可以使用 AutoMapper 通过私有设置器分配属性 AutoMapper 现在允许我不确定从什么时候开始使用私有设置器映射属性它使用反射来创建对象示例类 public class Person public string N
AWS Elastic Beanstalk EFS 挂载错误：未知文件系统类型“efs”

我正在尝试使用 Dockerrun aws json 的任务定义将我的 EFS 安装到多 Docker Elastic Beanstalk 环境另外我已将 EFS 的安全组配置为接受来自 EC2 EB 环境安全组的 NFS 流量但是
检测通知托盘中的向左滑动？

我想检测用户何时在通知上向左滑动它可以在任何通知上因为我将使用通知侦听器检测最近取消了哪个通知是否有一个全局手势滑动我可以监听并且仅在检测到我的通知被忽略时触发我的应用程序特定事件尝试以下 1 创建一个接收器来处理滑动关闭事件
如何更改日期范围选择器的样式？

在颤振中添加this https pub dev packages date range picker插件这是我的代码 onPressed async final List
在 iOS 应用程序的文档文件夹中创建一个文件夹

我只想在 iPhone 应用程序的文档文件夹中创建新文件夹有人知道该怎么做吗感谢你的帮助我通过以下方式做到这一点 NSError error NSArray paths NSSearchPathForDirectoriesInDoma
PHP计数，每2个字符添加冒号

我有这个字符串 1010081 COP 8 27 20110616214459 我需要计算从该字符串末尾开始的最后 6 个字符因为从开头开始可能会很长然后我需要在每 2 个字符后添加冒号所以从末尾算起 6 个字符后它将是 21445
如何允许 DIV 的文本选择，但阻止父 DIV 的文本选择？

我想允许用户选择驻留在多个 DIV 中的文本这些 DIV 一个接一个地排列它们之间有很小的间隙问题是当用户拖动鼠标执行选择时他们会越过间隙这会导致整个父 DIV 被瞬间选中直到进入下一个子 DIV 这会导致闪烁行为和糟糕
动态调整行内按钮的文本大小

我正在使用本地化来支持我的应用程序中的多种语言这会导致按钮中的文本长度不同所以我需要让它具有响应能力我有两个按钮Row 我想调整这些按钮内的文本大小这样它们就不会产生任何溢出目前在某些语言中它看起来像这样我尝试使用自动大小文本
使用snakemake条件执行多重分析

我在Snakemake上遇到了一些麻烦到目前为止我还没有找到相关信息在文档中或其他地方事实上我有一个包含不同样本多重分析的大文件我想根据规则后找到的结果停止某些样本的管道执行我已经尝试从规则定义中更改此值使用检查点或 d
在 .NET Core 类库的 Microsoft.AspNetCore.Hosting.Abstractions 程序集中找不到 IWebHostEnvironment

我无法引用 NET Core 类库中的 IWebHostEnvironment 元素我已经添加了 NuGet 包Microsoft AspNetCore Hosting Abstractions and Microsoft Extensi
EasyZip 生成的 Zip 无法正常工作

我使用 Easyzip 生成了一个 zip 文件我可以直接从下载文件夹打开它但是当下载后尝试打开它时我收到此错误提取文件时发生错误这是我的后端代码 var zip2 new EasyZip zip2 zipFolder downl
如何在 QListWidget 中显示没有文本的图标？

我只想显示我的图标QListWidget 我将文本设置为空字符串当我选择一个图标时我会在文本位置看到一个空的选定方块看截图我怎样才能摆脱这个空白空间使用 NULL 代替 ui gt listWidget gt addItem ne
如何记录作为参数的闭包的参数

我尝试记录函数的闭包参数 sends the request out Parameter pzurl request description including url method formdata Parameter responseP
Java正则表达式提取带或不带引号的字段

我正在尝试以两种基本形式从长字符串中提取键值对一种带引号一种不带引号例如 a First Field b SecondField 使用Java正则表达式 b a b s s b 但是运行以下测试代码 public static vo
如何确保特征等距保持等距？

我目前正在调查Eigen Isometry3f 定义为typedef Transform
不使用 EOF 位作为我们的流提取条件的真正原因是什么？

Inspired by my previous question https stackoverflow com q 14591203 150634 新 C 程序员的一个常见错误是从文件中读取以下内容 std ifstream file f
Jquery中的asp标签文本更改事件

当asp标签的值发生变化时如何触发jquery方法我已经尝试过这个但它不起作用 lbladdsupplier change function alert Changed The change仅当表单元素值更改时才会触发事件在这种情况下
用于编码 RGB 值的位移位和按位运算

我想将 RGB 颜色编码为单个整数值假设编码算法如下 int code blue 256 256 green 256 red 如何使用位移位和或按位运算符对 RGB 分量进行编码解码 int blueMask 0xFF0000 gre
使用 pandas 从每组中随机选择一行

我有一个熊猫数据框df显示如下 Month Day mnthShape 1 1 1 016754224 1 1 1 099451003 1 1 0 963911929 1 2 1 016754224 1 1 1 099451003 1 2

使用 pandas 从每组中随机选择一行

使用 pandas 从每组中随机选择一行 的相关文章

随机推荐

热门标签

使用 pandas 从每组中随机选择一行的相关文章