当条件为真时，Pandas 将数据帧拆分为多个

2024-03-08

我有一个数据框，如下面的 df 。我想为条件为真的每个数据块创建一个新的数据帧，以便它将返回 df_1、df_2....df_n。

|      df           |       |  df_1 |   | df_2  |
| Value | Condition |       | Value |   | Value |
|-------|-----------|       |-------|---|-------|
| 2     | True      |   |   | 2     |   | 0     |
| 5     | True      |   |   | 5     |   | 5     |
| 4     | True      |   |   | 4     |   |       |
| 4     | False     |   |   |       |   |       |
| 2     | False     |   |   |       |   |       |
| 0     | True      |   |   |       |   |       |
| 5     | True      |   |   |       |   |       |
| 7     | False     |   |   |       |   |       |
| 8     | False     |   |   |       |   |       |      
| 9     | False     |   |   |       |   |       |

我唯一的想法是循环遍历数据帧，返回每个 True 值块的开始和结束索引，然后创建新的数据帧，并循环遍历返回的索引，为每个开始/结束对返回类似这样的内容：

newdf = df.iloc[start:end]

但这样做似乎效率很低。

这是一个替代解决方案。请注意consecutive_groups http://more-itertools.readthedocs.io/en/latest/api.html#more_itertools.consecutive_groups食谱来自更多_iter工具 http://more-itertools.readthedocs.io/en/latest/api.html图书馆。

from itertools import groupby
from operator import itemgetter

def consecutive_groups(iterable, ordering=lambda x: x):
    for k, g in groupby(enumerate(iterable), key=lambda x: x[0] - ordering(x[1])):
        yield map(itemgetter(1), g)

grps = consecutive_groups(df[df.Condition].index)

dfs = {i: df.iloc[list(j)] for i, j in enumerate(grps, 1)}

# {1:    Value Condition
# 0      2      True
# 1      5      True
# 2      4      True,
# 2:    Value Condition
# 5      0      True
# 6      5      True}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pandas

split

当条件为真时，Pandas 将数据帧拆分为多个的相关文章

如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
带有 mkdocs 的本地 mathjax

我想在无法访问互联网的计算机上使用 MathJax 和 Mkdocs 因此我不能只调用 Mathjax CDN Config mkdocs yml site name My Docs extra javascript javascripts
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
Django 多对多关系（类别）

我的目标是向我的 Post 模型添加类别我希望以后能够按不同类别有时是多个类别查询所有帖子模型 py class Category models Model categories 1 red 2 blue 3 black title
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
导入 pandas 显示 ImportError: 无法导入名称哈希表

我已经在 python 3 3 上安装了 pandas 代码如下 import csv import pandas from pandas import DataFrame csvdata pandas read csv datafile
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

php pdo 绑定参数不起作用[重复]

这个问题在这里已经有答案了我正在使用以下 php pdo 代码将数据插入 mysql 数据库插入成功但是更新的数据库将字符串文字 a b 显示为各自字段中的值怎么了 data array array a gt John b gt
使用谷歌移动视觉 API 检测第一个条形码并将数据发送到另一个活动

您好我在 github 上检查了来自 google 的条形码阅读器示例我试图让条形码检测器检测第一个条形码只有一个当它检测到时它将解码的条形码发送到另一个活动 Mabye 我错了但我需要输入这段代码 BarcodeGraphic
onConnectionFailed 给出 SIGN_IN_REQUIRED(4)

我正在开发一个 Android 应用程序我想在其中使用 Google API 为此我导入了谷歌播放服务库项目我正在关注这个link https developers google com mobile android getting s
将 string 转换为 unsigned int 返回错误的结果

我有以下字符串 sThis 2154910440 unsigned int iStart atoi sThis c str 然而结果是 iStart 2147483647 有人看到我的错误吗 atoi将字符串转换为int 在您的系统上 in
在 Windows 10 上的 WSL 终端中禁用蜂鸣声 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何在 Windows 10 上的 WSL 中禁用视觉和音频铃声蜂鸣声禁用蜂鸣声bash您需要取消注释或添加如果尚未存在该行se
Safari：flexbox 和最小高度

我需要一个带有 Flexbox 子项的滚动 Flexbox 容器容器有一个由 flexbox 定义的高度子级应该和它们的内容一样高这在 Safari 中效果很好在 Safari 中子级不会超出容器的高度实际上 Safari 中
是否可以在React应用程序中忽略fetch api的ssl验证？

我在 React 单页应用程序中使用 fetch API 并且需要访问自签名的 https 微服务由于 SSL 验证而失败是否可以忽略验证以及如何做呢不此错误来自您的浏览器在 JavaScript 中无法避免您必须将自签名证书
缩放内容以适合 UWP WebView

我正在尝试在 UWP 应用程序内的 XAML WebView 控件中实现缩放到内容适合功能作为半官方的缩放解决方案 https code msdn microsoft com windowsapps How to zoom inout t
Android：列表视图上的多个操作 - 焦点问题

我想实现一个 ListView 用我的光标可以毫无问题地做到这一点现在根据您单击的行它会将您带到基于该行上按下的信息的新活动就像它应该的那样并且符合预期但是我希望有一个按钮来删除该行以便用户可以按该行的任何部分来启动新活动
如何使用正则表达式匹配包含表情符号的 URL？

如何编写正则表达式来匹配包含表情符号的 URL 正则表达式应匹配普通字母数字 URL 以及域名路径和或参数中包含表情符号的 URL 例如 http to http www http www to http to I 编码 ref 当今大
.net 中的开源文档管理系统？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有基于 NET 构建的开源文档管理系统我们发现了大量基于 Java 的开源 DMS 但在 NET
为什么这段带有几个“or”语句的代码比在 Java 中使用查找表稍快一些？

在查看我昨天问的一个微优化问题时 here https stackoverflow com questions 295579 fastest way to determine if an integers square root is an
Ruby On Rails libyaml

我在 Linux 上运行 Rails 版本 3 2 8 和 ruby 版本 1 9 3 p286 email protected cdn cgi l email protection rails apps myapp rails v Rai
创建 REST 子资源来获取列表的最后一个或第一个元素是不好的做法吗？

假设我已经构建了一个用于做笔记的 REST 服务如下所示 GET notes gives me all notes GET notes id gives the note with the identified by id POST no
为什么在任何给定的 .html 文件中换行符都会转换为“ ”？

我有一个与 HTML 相关的问题为了展示我的简单的问题我将使用一个最小的例子考虑以下 HTML 内容 Foo Bar 当您在浏览器中调用它时它会显示 Foo Bar 一条线到目前为止一切都很好然而当你做几乎相同的事情并存储
如何更改拍摄的文档以使其看起来“扫描”

我怎么能够do this http www techcrunch com 2009 03 17 jotnot turns your iphones camera into a document scanner 在 Python PIL 中
Magento：获取所有运费

如何获得包含 magento 中运费的数组对象例如统一费率免费送货等与选择的地址或产品无关这是另一种方法您需要设置邮政编码和国家地区即使这对您的运输方式并不重要 Change to your postcode country
模板依赖 false

我有一个不能直接使用的类模板只允许专业化我想用static assert显示有意义的错误消息我不能只打字static assert false error since false不依赖于值即使从未使用过模板编译器也可能会显示错误消
如何增加 Android 2.3 (Gingerbread) 上的堆大小？

当我尝试创建一个时出现 OutOfMemoryErrorString大于 4MB 使用StringBuilder append 据我所知 StringBuilder没有任何关于大小的限制所以没有String 所以我搜索了如何增加 And
当条件为真时，Pandas 将数据帧拆分为多个

我有一个数据框如下面的 df 我想为条件为真的每个数据块创建一个新的数据帧以便它将返回 df 1 df 2 df n df df 1 df 2 Value Condition Value Value 2 True 2 0 5 True

当条件为真时，Pandas 将数据帧拆分为多个

当条件为真时，Pandas 将数据帧拆分为多个 的相关文章

随机推荐

热门标签

当条件为真时，Pandas 将数据帧拆分为多个的相关文章