迭代 pandas 数据框

2024-03-09

我有一个 pandas 数据框，其中一列表示另一列中的位置值是否在其下方的行中发生更改。举个例子，

2013-02-05 19:45:00   (39.94, -86.159)     True
2013-02-05 19:50:00   (39.94, -86.159)     True
2013-02-05 19:55:00   (39.94, -86.159)    False
2013-02-05 20:00:00  (39.777, -85.995)    False
2013-02-05 20:05:00  (39.775, -85.978)     True
2013-02-05 20:10:00  (39.775, -85.978)     True
2013-02-05 20:15:00  (39.775, -85.978)    False
2013-02-05 20:20:00   (39.94, -86.159)     True
2013-02-05 20:30:00   (39.94, -86.159)    False

所以，我想做的是逐行浏览这个数据框并检查带有False。然后（可能会添加另一列）其中包含在该地方花费的总“连续”时间。可以像上面的示例一样再次访问同一地点。在这种情况下，它被视为一个单独的条件。因此，对于上面的例子，类似：

2013-02-05 19:45:00   (39.94, -86.159)     True    0
2013-02-05 19:50:00   (39.94, -86.159)     True    0
2013-02-05 19:55:00   (39.94, -86.159)    False   15
2013-02-05 20:00:00  (39.777, -85.995)    False    5  
2013-02-05 20:05:00  (39.775, -85.978)     True    0
2013-02-05 20:10:00  (39.775, -85.978)     True    0
2013-02-05 20:15:00  (39.775, -85.978)    False   15
2013-02-05 20:20:00   (39.94, -86.159)     True    0 
2013-02-05 20:25:00   (39.94, -86.159)    False   10

然后，我将绘制每天使用 hist() 函数所花费的“连续”时间的直方图。如何通过迭代数据帧从第一个数据帧获取第二个数据帧？我是 python 和 pandas 的新手，真实的数据文件很大，所以我需要一些相当有效的东西。

这是另一个例子

df['group'] = (df.condition == False).astype('int').cumsum().shift(1).fillna(0)

df
             date    long     lat condition  group
2/5/2013 19:45:00  39.940 -86.159      True      0
2/5/2013 19:50:00  39.940 -86.159      True      0
2/5/2013 19:55:00  39.940 -86.159     False      0
2/5/2013 20:00:00  39.777 -85.995     False      1
2/5/2013 20:05:00  39.775 -85.978      True      2
2/5/2013 20:10:00  39.775 -85.978      True      2
2/5/2013 20:15:00  39.775 -85.978     False      2
2/5/2013 20:20:00  39.940 -86.159      True      3
2/5/2013 20:25:00  39.940 -86.159     False      3

df['result'] = df.groupby(['group']).date.transform(lambda sdf: 5 *len(sdf))

df
             date    long     lat condition  group result
2/5/2013 19:45:00  39.940 -86.159      True      0     15
2/5/2013 19:50:00  39.940 -86.159      True      0     15
2/5/2013 19:55:00  39.940 -86.159     False      0     15
2/5/2013 20:00:00  39.777 -85.995     False      1      5
2/5/2013 20:05:00  39.775 -85.978      True      2     15
2/5/2013 20:10:00  39.775 -85.978      True      2     15
2/5/2013 20:15:00  39.775 -85.978     False      2     15
2/5/2013 20:20:00  39.940 -86.159      True      3     10
2/5/2013 20:25:00  39.940 -86.159     False      3     10

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

迭代 pandas 数据框的相关文章

稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Python Tkinter 模块不显示输出

我正在尝试学习 Python 并尝试使用 Python 中的 GUI 并遇到了这个 Tkinter 模块我的代码运行但运行时窗口没有出现我的代码如下 from Tkinter import to create a root windo
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某

随机推荐

MVC3：从 HtmlHelper 对象获取视图路径的最佳方法是什么？

我有一个 html 扩展方法来检索与视图位于同一文件夹中的文件的 URL Example Views Home Index cshtml Views Home Index js Views Home Index css 这是最好的方法吗我
触发自定义验证指令后，AngularJS ng-model 值丢失

我创建了一个自定义验证指令并在表单中使用它可以正常触发但是触发验证后发现model值就丢了说我有 ng model project key 并在验证后 project key范围内不再存在我认为我对 AngularJS 的理解是错
JPA 实体关系：删除时级联

我正在使用 spring JPA 和 Hibernate 我得到了以下实体 Entity Table name Supplier public class Supplier Id Column name Supplier ID nullab
C++ 代码注入使注入的应用程序崩溃

我试图将一个简单的可执行文件注入到我制作的另一个可执行文件中不幸的是每当我将代码注入到可执行文件中时它都会说 simpleinjected exe 已停止工作然后它就会关闭我在用着CreateRemoteThread来注入代码这
使用 firebase 函数检查数据是否存在

我如何检查是否days使用 Firebase Cloud Function 存在节点里面有伪代码index js if days exists do something outside of function body const fun
使用 pageToken 检索所有播放列表条目 Youtube API V3

所以我有一个函数可以从 ZEND Gdata API 检索所有播放列表条目现在我只是尝试添加 getNextFeed 但 V3 使用 pageToken 来显示下一个条目我遇到的问题是如何检索代码中的 nextPage 并实现它我知
将单词添加到 WordNet 的本地副本

我正在使用 WordNet 通过 Python 的 NLTK 访问来比较社交媒体中单词的同义词集其中许多单词并不包含在 NLTK 连接的 WordNet 版本中当我说我words我指的是特定领域的术语而不是缩写或表情符号我已经编制了
将 HTTP post 请求更改为 HTTPS post 请求：

我有这个方法 public static String getReportMetadata String reportId String sessionId String url throws Exception Map
Swift - IBOutletCollection 等效项

我正在尝试用 Swift 复制 iTunesU 中为 iphone 和 ipad 开发 ios7 应用程序中的斯坦福 Matchismo 游戏第三讲第77页slides https itunes apple com us course
Python 从 powershell 捕获回复

下面的代码在手动输入时有效但是当我运行program py时什么也没有打印我的最终目标是从用户电脑检索这些数据以创建一种简单的方法来重新创建快捷方式我的用户不知何故失去了它们哈哈 import smtplib os subproc
使用 Wicket 在 CSS 中引用数百张图像的图像

正如另一篇不错的文章中所述我们可以对一张单张图像使用类似的内容 mountSharedResource images logo gif new ResourceReference ImageScope class logo gif get
使用 LESS 将样式应用于子元素

这有效 layoutList background color CFCFCF layoutList gt entityCard hover background color FFFFFF border 1px solid yellow 为什
我怎样才能返回并测试哪里出了问题？ [复制]

这个问题在这里已经有答案了我想返回到之前的提交并运行我的程序直到找到问题所在而不删除或影响我的提交一旦我找到它正在工作的最后一次提交我就可以看到发生了什么变化然后返回到当前提交并修复它我该怎么做你应该尝试使用git bisec
求 500 的阶乘并将其存储在变量中...并执行计算...如何存储这么大的数字？

我如何在变量 i 中存储大量数字并且不需要更改程序的大部分内容例如是否有可用的数据类型来存储 100 的阶乘 include
Django 使用 ANSI_X3.4-1968 编码而不是 UTF-8

我正在使用 Django Gunicorn Nginx 运行 Ubuntu 14 04 服务器 Nginx 配置包含 utf 8 字符集行用户 auction 的区域设置输出该用户运行服务器 LANG en US UTF 8 LANGU
如何模拟 Android `Tasks.await()`？

因此我正在编写一个方法来对与 Firebase 身份验证的交互进行单元测试我已成功模拟了所需的所有其他内容但我不确定如何模拟被测方法中的调用Tasks await someTask someValue Because Tasks aw
显示带有用户窗体名称中的变量的 VBA 用户窗体

我正在做一个PPT 我需要点击按钮来显示各种表格我在主模块中创建了一个公共函数 Public Function ShowForm FormName As String Dim oneForm As Object For Each oneF
Lambda 编译抛出“从范围 '' 引用的类型 '' 的变量 ''，但未定义”

当我尝试编译如下所示的 lambda 时它会抛出类型为 System Collections Generic IEnumerable 1 WheelEndCatalogKendo Models SapBasicData 的变量 mode
为什么 Java（Android？）将我的文件的最后修改日期设置为明天？

我正在使用以下方法在 Android 应用程序中创建文件 FileOutputStream fos context openFileOutput fileName Context MODE PRIVATE fos write data fo
迭代 pandas 数据框

我有一个 pandas 数据框其中一列表示另一列中的位置值是否在其下方的行中发生更改举个例子 2013 02 05 19 45 00 39 94 86 159 True 2013 02 05 19 50 00 39 94 86 159

迭代 pandas 数据框

迭代 pandas 数据框 的相关文章

随机推荐

热门标签

迭代 pandas 数据框的相关文章