在 pandas groupby 之后对每个组进行采样

2023-11-26

groupby操作后如何对每个组进行采样?

import pandas as pd

df = pd.DataFrame({'a': [1,2,3,4,5,6,7],
                   'b': [1,1,1,0,0,0,0]})

grouped = df.groupby('b')

鉴于上述设置,我想从每个组中采样,例如,我想要每个组的 30%。


应用 lambda 并调用sample带参数frac:

In [2]:
df = pd.DataFrame({'a': [1,2,3,4,5,6,7],
                   'b': [1,1,1,0,0,0,0]})
​
grouped = df.groupby('b')
grouped.apply(lambda x: x.sample(frac=0.3))

Out[2]:
     a  b
b        
0 6  7  0
1 2  3  1
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 pandas groupby 之后对每个组进行采样 的相关文章

随机推荐

  • 防止存储过程同时执行两次

    我有一个 SQL Server 2000 的存储过程 在任何给定时刻只能执行一个实例 有什么方法可以检查并确保该过程当前没有在执行吗 理想情况下 我希望代码是独立且高效 快速 的 我也不想做一些事情 比如创建一个全局临时表来检查它是否存在
  • 如何在C++中生成随机顶点以形成凸多边形?

    我需要为一个简单的凸多边形生成一组顶点 以便使用动态编程对该多边形进行最小权重三角剖分 我考虑取一个半径为 r 的圆 然后取 20 个顶点逆时针移动 然后我将形成一个20个顶点凸多边形但我该怎么做 我怎么知道半径为 r 的圆上的顶点 除了这
  • Asp.Net core 2.0 MVC 锚标记帮助器不工作

    我正在尝试创建一个演示页面 但无法解决下一个问题 并且我尝试了在网络上找到的所有内容 我有一个带有标签助手的锚标签 a class menu link Telefonok a 我还添加了一个 ViewImports cshtml我在其中添加
  • C# WebClient 下载字符串 https

    在网络浏览器中我通常可以加载以下网址 https security ultimatxxxx com 443 Serverstatus ashx 当我这样做时 Webclient DownloadStringAsync https secur
  • 从内存而不是磁盘向 CompilerParameters ReferencedAssemblies 提供程序集?

    我有一个CompilerParameters我用来喂食的物体Microsoft CSharp CSharpCodeProvider对象和一个ICodeCompiler从中派生出的对象 一切正常 我可以即时编译代码 我的问题是引用的程序集 现
  • 如何在 Google App Engine 上使用 Python 发送 JSON 格式的 cookie 数据?

    我正在尝试在 Python 脚本中编码一个对象并将其设置为 cookie 以便我可以使用客户端 JavaScript 读取它 我尝试的各种方法都遇到了问题 一般来说 cookie 的格式化方式会导致 JSON parse 中断 我当前的脚本
  • Angular 6“mat-button-toggle”不是已知元素

    我已经检查过这些问题 mat toolbar 不是已知元素 Angular 5 Jhipster md button 不是已知元素 模板解析错误 mat icon 不是已知元素 材质 2 md datepicker toggle 不是已知元
  • 将选定的文本复制到剪贴板而不使用 Flash - 必须是跨浏览器

    我想要一个按钮来选择文本textarea并将其复制到剪贴板 我似乎找不到任何适用于所有浏览器且不使用 Flash 的解决方案 这当然可行吗 我到处都见过它 但我猜他们使用闪光灯 如果可能的话我真的想远离它 因为有些人没有它 这就是我到目前为
  • grunt uglify 任务失败

    运行 grunt 时 出现以下错误 警告 无法写入 client dist js build js 文件 错误代码 未定义 使用 force 继续 我的 uglify 的配置Gruntfile js uglify build src cli
  • 有没有办法仅使用 CSS 生成给定范围内的随机数?

    例如 类似 div margin left random 100 100 目前无法在纯 CSS 中执行此操作 但是如果您使用 CSS 预处理器 例如LESS 那么您可以执行以下操作 randomMargin Math round Math
  • 隐式与显式链接到 DLL

    何时应隐式或显式链接到 DLL 常见做法或陷阱是什么 显式链接 DLL 的情况相当罕见 主要是因为它很痛苦并且容易出错 您需要为导出的函数编写函数指针声明 并正确获取 LoadLibrary GetProcAddress FreeLibra
  • 重新连接断开连接的 SignalR 客户端 (JS) 的最佳实践

    我想提高 signalR 客户端的客户端实现的弹性 目前 我这样做 hub server sendClientNotification string appSettings username 然而 偶尔会引发与连接相关的异常 因为服务器没有
  • 将纪元时间(毫秒)转换为日期时间

    我使用 ruby 脚本将 iso 时间戳转换为纪元 我正在解析的文件具有以下时间戳结构 2009 03 08T00 27 31 807 因为我想保留毫秒 所以我使用以下 ruby 代码将其转换为纪元时间 irb main 010 0 gt
  • JQuery Mobile - 用户登录最佳实践

    我正在使用 JQuery Mobile 为现有的 Web 应用程序构建一个移动界面 该应用程序需要用户身份验证 但我无法确定实现登录过程的最佳方法 我不太关心服务器端身份验证 而是如何在用户端实现它 经过一番尝试 似乎有以下选项 使用 PO
  • 如何在 Eclipse 启动配置中使用变量进行类路径定义?

    在我们的项目中 我们使用 Eclipse 启动配置 这些配置受版本控制 可与所有开发人员共享 现在需要将外部存档包含到启动配置文件的类路径中 幸运的是 所需的存档位于每个开发人员的本地 Maven 存储库中 我已经发现有一个名为的类路径变量
  • WPF 图像工具提示

    我在列表框内的图像上有一个工具提示 工具提示设置如下
  • 如何强制maven更新?

    我在另一台计算机上导入了已经工作的项目 它开始下载依赖项 显然我的互联网连接崩溃了 现在我得到以下信息 gt Build errors for comics org apache maven lifecycle LifecycleExecu
  • 无法加载目标的共享库“gdx”

    我遇到了同样的问题这个问题 但那里的答案并没有解决我的问题 我没有通过 gdxsetup jar 创建项目 我只是包含了 gdx jar 和 gdx backend android jar 我将 libgdx so 添加到 libs x86
  • 如何找出elasticsearch解析query_string的结果?

    有没有办法通过弹性搜索API如何查询字符串查询实际上被解析了吗 您可以通过查看手动执行此操作lucene查询语法 但是如果您可以查看解析器实际结果的一些表示 那就太好了 正如 javaanna 在评论中提到的那样 证实API 以下是我的本地
  • 在 pandas groupby 之后对每个组进行采样

    groupby操作后如何对每个组进行采样 import pandas as pd df pd DataFrame a 1 2 3 4 5 6 7 b 1 1 1 0 0 0 0 grouped df groupby b 鉴于上述设置 我想从