Pandas 时间序列重采样和插值一起

2023-11-21

我有带时间戳的传感器数据。由于技术细节的原因，我从传感器获取数据大约间隔一分钟。数据可能如下所示：

   tstamp               val
0  2016-09-01 00:00:00  57
1  2016-09-01 00:01:00  57
2  2016-09-01 00:02:23  57
3  2016-09-01 00:03:04  57
4  2016-09-01 00:03:58  58
5  2016-09-01 00:05:00  60

现在，本质上，如果我在准确的时刻获得所有数据，我会非常高兴，但我没有。保存分布并获取每分钟数据的唯一方法是插值。例如，行索引 1 和 2 之间有 83 秒，获取精确分钟值的自然方法是在两行数据之间进行插值（在本例中为 57，但事实并非如此）到处）。

现在，我的方法是执行以下操作：

date = pd.to_datetime(df['measurement_tstamp'].iloc[0].date())
ts_d = df['measurement_tstamp'].dt.hour * 60 * 60 +\
       df['measurement_tstamp'].dt.minute * 60 +\
       df['measurement_tstamp'].dt.second
ts_r = np.arange(0, 24*60*60, 60)
data = scipy.interpolate.interp1d(x=ts_d, y=df['speed'].values)(ts_r)
req = pd.Series(data, index=pd.to_timedelta(ts_r, unit='s'))
req.index = date + req.index

但这对我来说感觉相当漫长和漫长。有一些出色的 pandas 方法可以进行重采样、舍入等。我一整天都在阅读它们，但事实证明没有什么可以按照我想要的方式进行插值。resample工作原理就像groupby并对落在一起的时间点进行平均。fillna进行插值，但不在之后resample已经通过平均改变了数据。

我是否遗漏了什么，或者我的方法是最好的吗？

为简单起见，假设我按天和传感器对数据进行分组，因此一次仅对一个传感器的 24 小时周期进行插值。

d = df.set_index('tstamp')
t = d.index
r = pd.date_range(t.min().date(), periods=24*60, freq='T')

d.reindex(t.union(r)).interpolate('index').ix[r]

Note, periods=24*60适用于日常数据，而不适用于问题中提供的样本。对于该样本，periods=6将工作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 时间序列重采样和插值一起的相关文章

如何从列表类别中对 pandas 数据框进行排序？

所以我在下面有这个数据集我想根据我的列表从名称列进行排序以及按 A 升序和按 B 降序排序 import pandas as pd import numpy as np df1 pd DataFrame from items A 1
Pandas 数据框到 Excel 工作表

我有一个包含 5 个工作表的 Excel 文件 xls 格式我想用 pandas 数据框的内容替换第 5 个工作表的内容根据您的上述需求您将需要使用 Python 导出 pandas 数据框和 VBA 删除现有工作表内容并复制粘贴
如何按升序或降序对 Seaborn 条形图进行排序 [重复]

这个问题在这里已经有答案了 EXCEL 文件包含有关 7000 个 Apple App store 的信息如下所示这是我的代码 gt import seaborn as sns import matplotlib pyplot as p
从另一个数据帧创建一个数据帧（使用数据透视）

我对熊猫有疑问我有一个包含三列的数据框 id1 id2 amount 由此我想创建另一个数据框其索引为 id1 其列为 id2 单元格包含相应的金额我们来看一个例子 import pandas as pd df pd DataFr
pandas 中的滚动减法

我正在尝试做类似的事情 ff pd DataFrame uid 1 1 1 20 20 20 4 4 4 date 09 06 10 06 11 06 09 06 10 06 11 06 09 06 10 06 11 06 balance
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
如何在 pandas 中读取并标准化以下 json？

我在 stackoverflow 中使用 pandas 看到了很多 json 读取问题但我仍然无法解决这个简单的问题 Data session id 0 X061RFWB06K9V 1 5AZ2X2A9BHH5U unix timesta
Pandas Groupby：如何使用两个 lambda 函数？

我目前可以在 Pandas 中执行以下操作但 FutureWarning 严厉地摇动着我的手指 grpd df groupby rank agg mean np mean meian np median min np min max np
Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
如何（重新）命名 pandas 数据框中的空列标题而不导出到 csv

我有一个熊猫数据框df1带有一个索引列和一系列未命名的值我想为未命名的系列指定一个名称到目前为止我知道的唯一方法是导出到df1 csv using df1 to csv df1 csv header Signal 然后使用以下命令重新
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
如何在两个 pandas 数据框之间应用函数

如何将自定义函数应用于两个数据框这 apply方法 https pandas pydata org pandas docs version 0 24 2 reference api pandas DataFrame apply html似
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data

随机推荐

何时使用 MySQLdb 关闭游标

我正在构建一个 WSGI Web 应用程序并且有一个 MySQL 数据库我正在使用 MySQLdb 它提供用于执行语句和获取结果的游标获取和关闭游标的标准做法是什么特别是我的光标应该持续多长时间我应该为每笔交易获取一个新的游标吗
XNA Alpha 混合使纹理的一部分透明

我想做的是在 XNA 中使用 alpha 混合来使绘制的纹理的一部分透明例如我将屏幕清除为某种颜色比如说蓝色然后我画一个红色的纹理最后我绘制一个纹理该纹理只是从中心完全透明到边缘完全黑色的径向渐变我想要的是之前绘制的红色纹理
如何在 iOS 上使用 Google Drive API 处理电子表格

我正在尝试编写一个 iPhone 应用程序将其数据库存储在 Google 电子表格中我按照 DrEdit 的例子here它使用 Drive API 将纯文本文件读取写入 Google Drive 我正在尝试修改示例应用程序以使用电子表
编程理论：解决迷宫

解决迷宫问题有哪些可能的方法我有两个想法但我认为它们不是很优雅基地情况我们有一个矩阵这个矩阵中的元素以一种代表迷宫的方式排序有一个入口一个出口我的第一个想法是派一个机器人穿过迷宫跟随一侧直到走出迷宫我认为这是一个非常缓
除非授予权限后重新启动应用程序，否则无法写入外部存储

即使在运行时授予 WRITE EXTERNAL STORAGE 之后应用程序也无法在 Android 6 0 上写入外部存储我正在模拟器上进行测试除非应用程序被终止并重新启动 AndroidManifest xml 中的片段
在 Kotlin 中，当枚举类实现接口时，如何解决继承声明冲突？

我定义了一个实现 Neo4j 的枚举类RelationshipType enum class MyRelationshipType RelationshipType 我收到以下错误 Inherited platform declaratio
Jenkins Pipeline emailext $class 参数用于recipientProviders

我一直在尝试理解下面的管道常规代码 emailext subject STARTED Job env JOB NAME env BUILD NUMBER body p STARTED Job env JOB NAME env BUILD N
POST 多个参数到 WCF 服务

我想了解 WCF 所以我的问题可能很愚蠢我相信我对 GET 操作已经有了深入的了解我现在正在从事一些 POST 操作我的问题是我可以使用 WebInvoke 编写接受多个参数的 WCF 服务操作吗或者当我发布数据时它只会接受单
获取 Collection 对象上项目的键

环境是我推入 Collection 的成员是无名的无法识别的为了避免糟糕的抽象请不要惊慌成员实际上是其他 Collection 实例为了能够进行快速搜索我为每个新成员创建一个有意义的哈希名称并将其作为最顶层集合的 Add
PHP函数生成v4 UUID

因此我一直在进行一些挖掘并尝试拼凑出一个在 PHP 中生成有效 v4 UUID 的函数这是我能到达的最接近的一次我对十六进制十进制二进制 PHP 位运算符等方面的知识几乎不存在此函数生成一个有效的 v4 UUID 直到一个区域
如何高效地将三角矩阵存储在内存中？

我想存储一个下三角矩阵在内存中而不存储所有的零我实现它的方法是分配空间i 1上的元素i扔然而我对 C 中的动态内存分配很陌生我的第一次分配似乎出了问题 int main int i j int mat1 int dim scanf
PhpMyAdmin 无法在本地主机上运行

Xampp版本 1 7 7 安装在外部硬盘上操作系统 Windows 8 安装了 4 1 7 版本的 phpMyAdmin 并将 config inc php 从我的旧版本 phpmyadmin 复制到新版本 phpmyadmin 4 1
NVD3.js multiChart x 轴标签与多条线对齐，但不是与多个条形对齐

这个问题涉及到NVD3 js multiChart x 轴标签与线对齐但不与条形对齐我正在使用 NVD3 jsmultiChart以显示多行 and 多个酒吧在图表中一切工作正常但 x 轴标签仅与线点对齐而不与条形对齐我想正确对
Spring 测试与安全：如何模拟身份验证？

我试图弄清楚如何对我的控制器的 URL 是否得到正确保护进行单元测试以防万一有人更改内容并意外删除安全设置我的控制器方法如下所示 RequestMapping api v1 resource test Secured ROLE USER
SwiftUI 中 Stepper 的奇怪行为

我想使用 onIncrement 和 onDecrement 在手动非绑定模式下使用步进视图当我尝试实现下限和上限时会出现奇怪的行为例如年龄值不低于 1 或高于 10 如果您尝试以下代码则可以在其值已为 1 后按两次它并没有
AWS ECS 私有和公共服务

我有一个场景我必须在AWS ECS上部署多个微服务我想让服务能够通过每个微服务中开发的 API 相互通信我想在 AWS ECS 上部署前端该前端可以公开访问并且还可以与部署在 AWS ECS 上的其他微服务进行通信我怎样才能实现
Eclipse+FindBugs - 排除过滤器文件不起作用

我使用 Windows 和 Eclipse 3 7 Classic 以及 ADT 插件进行 Android 开发我刚刚安装了 FindBugs 它在自动生成的 R java 类中发现了一个错误我想从 FindBugs 检查中排除此类我
预加载器不会忽略 websocket -pace js

我在我的网站上添加了预加载器该网站在 Rails 上使用 ruby 运行看起来它工作得很好但是由于 Pusher Websockets 预加载器不会结束它一直在等待我在页脚尝试了这个但它不起作用我怎么解决这个问题我尝试了这个
未解决的参考：库 - buildSrc

我正在尝试切换到使用 Kotlin DSL 从对象 Kotlin 文件而不是 gradle 文件获取依赖项版本当我进行 gradle 同步时它无法解析引用但我可以从 build gradle kts 单击文件库我没有对 build
Pandas 时间序列重采样和插值一起

我有带时间戳的传感器数据由于技术细节的原因我从传感器获取数据大约间隔一分钟数据可能如下所示 tstamp val 0 2016 09 01 00 00 00 57 1 2016 09 01 00 01 00 57 2 2016 09

Pandas 时间序列重采样和插值一起

Pandas 时间序列重采样和插值一起 的相关文章

随机推荐

热门标签

Pandas 时间序列重采样和插值一起的相关文章