具有重叠间隔时间序列的 groupby

2024-01-16

我在 python pandas dataframe 对象中有一个时间序列，我想根据索引创建一个组，但我想要重叠的组，即组不不同。 header_sec 是索引列。每组包含一个 2 秒的窗口。输入数据帧

    header_sec
1  17004 days 22:17:13 
2  17004 days 22:17:13 
3  17004 days 22:17:13 
4  17004 days 22:17:13 
5  17004 days 22:17:14
6  17004 days 22:17:14
7  17004 days 22:17:14
8  17004 days 22:17:14
9  17004 days 22:17:15
10 17004 days 22:17:15
11 17004 days 22:17:15
12 17004 days 22:17:15
13 17004 days 22:17:16
14 17004 days 22:17:16
15 17004 days 22:17:16
16 17004 days 22:17:16
17 17004 days 22:17:17
18 17004 days 22:17:17
19 17004 days 22:17:17
20 17004 days 22:17:17

我的第一组应该有

1  17004 days 22:17:13 
2  17004 days 22:17:13 
3  17004 days 22:17:13 
4  17004 days 22:17:13 
5  17004 days 22:17:14
6  17004 days 22:17:14
7  17004 days 22:17:14
8  17004 days 22:17:14

第二组从前一个索引开始，取前一秒记录的 1/2。

7  17004 days 22:17:14
8  17004 days 22:17:14
9  17004 days 22:17:15
10 17004 days 22:17:15
11 17004 days 22:17:15
12 17004 days 22:17:15
13 17004 days 22:17:16
14 17004 days 22:17:16

第三组……

13 17004 days 22:17:16
14 17004 days 22:17:16
15 17004 days 22:17:16
16 17004 days 22:17:16
17 17004 days 22:17:17
18 17004 days 22:17:17
19 17004 days 22:17:17
20 17004 days 22:17:17

如果我对索引进行 groupby，

  dfgroup=df.groupby(df.index)

这每秒给出一组。合并这些组的最佳方法是什么？

这里有一个技巧：

import numpy as np # if you have not already done this

grouped = df.groupby(df.index)

for name, group in grouped:
    try:
        prev_sec = df.loc[(name - pd.to_timedelta(1, unit='s')), :]
    except KeyError:
        prev_sec = pd.DataFrame(columns=group.columns)
    try:
        next_sec = df.loc[(name + pd.to_timedelta(1, unit='s')), :]
    except KeyError:
        next_sec = pd.DataFrame(columns=group.columns)
    Pn = 2 # replace this with int(len(prev_sec)/2) to get half rows from previous second
    Nn = 2 # replace this with int(len(next_sec)/2) to get half rows from next second
    group = pd.concat([prev_sec.iloc[-Pn:,:], group, next_sec.iloc[:Nn,:]])

    # Replace the below lines with your operations
    print(name, group)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

groupby

TimeSeries

具有重叠间隔时间序列的 groupby 的相关文章

组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
根据第三个变量更改散点图中的标记样式

我正在处理多列字典我想绘制两列然后根据第三列和第四列更改标记的颜色和样式我很难改变 pylab 散点图中的标记样式我的方法适用于颜色不幸的是不适用于标记样式 x 1 2 3 4 5 6 y 1 3 4 5 6 7 m k l l
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
使用 SERVER_NAME 时出现 Flask 404

在我的 Flask 配置中我将 SERVER NAME 设置为 app example com 之类的域我这样做是因为我需要使用url for with external网址如果未设置 SERVER NAME Flask 会认为服务器

随机推荐

WPF Datagrid 绑定自定义列标题

我试图弄清楚如何使用 MVVM 模式将 WPF DataGrid 的列标题和主要数据绑定到数据源我正在寻找的结果如下所示 source vallelunga com http brian vallelunga com files data
浮点按位运算的用处

我注意到浮点存在 SSE 指令这让我想知道您可以对 fp integer union 中的标量执行相同的操作我突然想到如果对浮点数数组的各个分量进行按位或运算则可以通过查看结果的符号位来快速确定它们中是否有任何一个为负数浮点值的
获取 TWIG 模板中的控制器名称

我正在学习 symfony2 3 当我尝试在 twig 模板中获取控制器名称时出现错误控制器 namespace Acme AdminBundle Controller use Symfony Bundle FrameworkBundle
Mac OS-X Mountain Lion 上的 GCC-4.2 错误，无法使用 pip / virtualenv 安装某些软件包

我看到一个非常烦人的错误我真的不知道如何处理这似乎很常见我几乎尝试了所有能找到的解决方案但都无济于事我正在尝试使用 pip 安装库 gevent psycopg2 和 greenlet 都遇到过这个问题问题似乎是我的计算机找不到
如何从服务器在 ViewPager 内的 VideoView 上播放视频

我尝试开发一个应用程序从服务器检索视频并在 viewpager 内的 videoview 上播放原始文件夹中的视频工作正常但有两个问题 1 部分视频无法播放或黑色活动显示 2 页面滚动时视频不停止那么如何使用 URL 而不是 and
如何在打开另一个 Javascript 下拉菜单时关闭另一个下拉菜单

我不太熟悉 JavaScript 我希望能得到一些帮助来解决我似乎无法解决的问题目前我的网站上有 2 个下拉菜单一种是用于导航的下拉菜单单击汉堡菜单图标时会激活该菜单第二个下拉列表用于显示我网站上的类别目前当我单击一个下拉列表时
检测浏览器缓存是否已满

我们发现浏览器缓存已满是导致酒店后台出现问题的原因它只影响我们的一小部分用户但我们希望提醒他们该问题并为他们提供一些如何自行解决问题的指导我们希望使用与 GMail 使用的系统类似的系统当它检测到您的浏览器缓存已满表现不正常时它
Kafka中的延迟消息消费

如何使用 Apache Kafka 生成消费延迟消息似乎标准 Kafka 和 Java kafka client 功能没有此功能我知道我可以用标准的等待通知机制自己实现它但它看起来不太可靠因此任何建议和良好实践都值得赞赏 Fou
Android Shake(Sensor) 服务，用于应用程序后台的震动检测

我开发了一个具有晃动功能的应用程序以便某些功能正常工作因此我使用晃动类并实现了主活动以便在应用程序运行时顺利工作但我的问题是当我的应用程序进入睡眠或终止或停止时如何检测背景震动服务我的摇摇班 public class Shak
区别 - “e.preventDefault();”和“返回假；” [复制]

这个问题在这里已经有答案了有什么区别return false and e preventDefault e preventDefault 将防止默认事件发生并且return false停止传播
Android - Firebase 用户身份验证令牌会过期吗？

我决定使用Volley并走 RESTful 路线Firebase因为当没有互联网连接时他们的听众似乎会挂起至少对于 Volley 它可以让我知道网络请求是否由于互联网连接而失败我需要知道是否FirebaseUser身份验证令牌是否过期
在基础对象中构造派生类型的对象

vb net 中是否可以有一个方法来构造 bass 类中任何派生类的对象在此代码中 x Clone 应返回一个 Bar 对象这是使用两种不同对象类型在两个类中重复代码的唯一方法 Module Module1 Sub Main Dim x
.NET：我可以使用 DataContractJsonSerializer 序列化为 JSON 关联数组吗？

使用时数据契约Json序列化器 http msdn microsoft com en us library system runtime serialization json datacontractjsonserializer aspx序
cellForRowAtIndexPath 返回 nil

我正在尝试从表格视图中获取特定的单元格以便我可以更改它的标签并停止活动指示器我遇到的问题是cellForRowAtIndexPath返回零我的表视图只有 1 行 Code id initWithNibName NSString nib
Android Thread.sleep 有时等待时间太长

Edit 这里不是说精度问题从下面的代码和日志可以看到我请求休眠1秒但结果差不多是200秒有时会跳到600秒这不可能是精度问题我之前使用过 handlerthread 有时发布到处理程序的作业没有按时启动为了获得更多详细信息
如何在 Android 中以编程方式启动主屏幕 [重复]

这个问题在这里已经有答案了我想用我的应用程序启动 Android 的主屏幕主要目标是当用户按下专用键时向用户显示所有应用程序其实方式并不重要有想法这样做吗这是启动 HomeActivity 的代码 Intent startMai
devDependency 会影响包大小吗？

我仔细寻找找不到这个问题的直接答案执行我添加的软件包devDependencies实际上最终会出现在生产包 JS 文件中并从而影响其大小或者只是dependencies进入捆绑包不它不会影响您的包大小因为这些包仅在开发模式下使用
ActiveRecord 嵌套 SELECT

我需要有关 SELECT FROM 嵌套 SELECT 的帮助如何以 ActiveRecord 方式重写以下查询并获取 Relation 对象 SELECT candidates FROM SELECT candidates first
stringr、str_extract：如何进行正向后查找？

很简单的问题我只需要使用正则表达式正向查找捕获一些字符串但我没有找到一种方法来做到这一点这是一个例子假设我有一些字符串 library stringr myStrings lt c MFG acme something else M
具有重叠间隔时间序列的 groupby

我在 python pandas dataframe 对象中有一个时间序列我想根据索引创建一个组但我想要重叠的组即组不不同 header sec 是索引列每组包含一个 2 秒的窗口输入数据帧 header sec 1 17004

具有重叠间隔时间序列的 groupby

具有重叠间隔时间序列的 groupby 的相关文章

随机推荐

热门标签