按给定的时间增量查找数据帧列中的时间戳

2024-04-26

我有一个包含时间戳列的数据框。我的目标是找到每行的第一个时间戳，该时间戳大于该行的时间戳给定的偏移量（例如 0.01 秒）。我尝试使用这里给出的答案 https://stackoverflow.com/questions/32237862/find-the-closest-date-to-a-given-date，以修改后的方式，例如：

def getTime(col, base, offset=0.01):
    later = filter(lambda d: d > base+dt.timedelta(seconds=offset), col)
    return min(later)

testTbt['testTime']=testTbt['exchTstamp'].apply(lambda time: getTime(testTbt[testTbt['exchTstamp']>time]['exchTstamp'].iloc[0:100].tolist(), time, 0.01))

但得到了错误：ValueError: min() arg is an empty sequence.

时间戳为微秒级别，包含重复值并且按递增顺序排列。

这是数据框的初始行：

    exchTstamp                  seqNum prev10mSecAvg prev1SecAvg    imbRegime
0   2019-08-14  09:15:00.022991 199    0.000000      0.000000       0
1   2019-08-14  09:15:00.022995 200   -0.166667     -0.166667       3
2   2019-08-14  09:15:00.022999 201   -0.277778     -0.277778       2
3   2019-08-14  09:15:00.023003 202   -0.333333     -0.333333       2
4   2019-08-14  09:15:00.023007 203   -0.386667     -0.386667       2

可以下载 csv 数据here https://drive.google.com/file/d/104ngrhwXqgQa1fjMWYMiH5g2Vt8SzO9G/view?usp=sharing.

预期输出是数据帧中添加的列，其中包含后续时间戳中的第一个时间戳，该时间戳比当前行的时间戳至少大 0.01 秒。例如：- 对于给定的数据集，第一行的新列（有时间09:15:00.022995）应该有价值09:15:00.033136。对于后续的每一行都相同。

一点指导会有很大帮助。

我认为最快和最简单的方法是使用searchsorted https://docs.scipy.org/doc/numpy/reference/generated/numpy.searchsorted.html。如果没有元素大于df.exchTstamp+delta, then searchsorted将返回数组的长度，即超出数据帧索引范围的索引。因此我们首先需要插入一个nan / NaT这种情况下的哨兵行，我们随后将其删除：

import numpy as np, pandas as pd, datetime as dt

df = pd.read_csv('stack.csv', index_col=0, parse_dates=[1])
delta = dt.timedelta(seconds=0.01)

res = np.searchsorted(df.exchTstamp, df.exchTstamp+delta)

# add sentinel
df.append(pd.Series(), ignore_index=True)

df["testTime"] = df.loc[res,'exchTstamp'].values

# remove sentinel
df = df.drop(df.index[-1])

df.to_csv('stack-out.csv')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

按给定的时间增量查找数据帧列中的时间戳的相关文章

在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
属性错误：未找到下层；在 scikit-learn 中使用带有 CountVectorizer 的 Pipeline

我有一个这样的语料库 X train this is an dummy example in reality this line is very long here is a last text in the training set 和一
将这个使用 lambda 解包的元组从 Python 2 移植到 Python 3 的最 Pythonic 方法

我有以下 Python 2 代码它在 lambda 中解压元组该 lambda 包含在 for 循环内 for lab lab pred length in zip labels labels pred sequence lengths
Python ttk.combobox 强制发布/打开

我正在尝试扩展 ttk 组合框类以允许自动建议我到目前为止的代码运行良好但我想让它在输入一些文本后显示下拉列表而不从小部件的输入部分移除焦点我正在努力解决的部分是找到一种强制下拉的方法在 python 文档中我找不到任何提及这一点
使用 gin 索引和 sqlalchemy 返回排名搜索结果

我为全文搜索设置了 GIN 索引我想获取与搜索查询匹配的记录列表按排名排序记录与搜索查询的匹配程度对于结果我只需要记录及其列不需要用于排序的实际排名值我有以下查询它运行良好并从我的 postgresql 数据库返回预期结果
在 Qt Creator 中相互公开 QML 组件

我正在使用 Qt Quick 和 PySide2 开发仪表板应用程序但在 Qt Creator 的设计模式中公开我的 QML 组件时遇到问题我的文件夹结构如下所示 myapp mycomponents component1 qml co
为 pandas 数据框中的两列创建邻接矩阵

我有一个以下形式的数据框 index Name A Name B 0 Adam Ben 1 Chris David 2 Adam Chris 3 Ben Chris 我想获得邻接矩阵Name A and Name B ie Adam Ben
如何判断Python对象是否是字符串？

如何检查 Python 对象是否是字符串常规字符串或 Unicode Python 2 Use isinstance obj basestring 对于要测试的对象obj Docs https docs python org 2 7 li
UTF-8 在 Python 日志记录中，如何？

我正在尝试使用 Python 的日志记录包将 UTF 8 编码的字符串记录到文件中作为一个玩具示例 import logging def logging test handler logging FileHandler home ted
Django：通过外键将两个表连接到第三个表？

我有三个型号 class A Model class B Model id IntegerField a ForeignKey A class C Model id IntegerField a ForeignKey A 我想要得到 B i
如何检查两个数据集的匹配列之间的相关性？

如果我们有数据集 import pandas as pd a pd DataFrame A 34 12 78 84 26 B 54 87 35 25 82 C 56 78 0 14 13 D 0 23 72 56 14 E 78 12 31
Python docker 容器在完成运行应用程序后立即关闭，即使指定保留在 -d -t 中

我有一个 dockerfile FROM python 3 WORKDIR app ADD venv venv ADD data file1 csv gz data file1 csv gz ADD data file2 csv gz da
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
在 Mac OS x 10.7.5 中运行 Scrapy 所需的文件，使用 Python 2.7.3 IEPD_free（32 位）

我是第一次测试 scrapy 使用命令安装后 sudo easy install U scrapy 一切似乎都运行正常但是当我运行时 scrapy startproject tutorial 我得到以下信息 luismacbookpro
有没有办法只从 python 列表中输出数字？

简单的问题 list 1 asdada 1 123131 131 blaa adaraerada 0 000001 34 12451235265 stackoverflow is awesome 我想创建一个list 2这样它只包含数字 l
如何在 Windows 上为“flask run”设置环境变量？

我刚刚开始学习 Flask 我一直停留在设置 Flask 环境变量上我不知道如何设置环境变量每当我使用flask run命令我遇到以下错误错误消息无法找到 Flask 应用程序您没有提供 FLASK APP 环境变量并且在当前
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
如何从 Python 脚本捕获 Curl 的输出

我想使用curl查找有关网页的信息但在Python中到目前为止我有这个 os system curl head www google com 如果我运行它它会打印出 HTTP 1 1 200 OK Date Sun 15 Apr 20
多行 x 刻度标签

我正在尝试制作类似于此 Excel 示例的图我想知道 x 刻度标签上是否有第二层例如 5 年统计摘要我知道我可以使用制作多行刻度标签 n但我希望能够独立地转换这两个级别这很接近 fig plt figure figsize 8 4
如何在Python中从stdin中逐行读取

每个人都知道如何在 C 中计算 STDIN 中的字符但是当我尝试在 python3 中执行此操作时我发现这是一个难题计数器 py import sys chrCounter 0 for line in sys stdin readl

随机推荐

颤动导航到新屏幕不起作用

我正在构建一个登录屏幕将数据传递到主屏幕当我单击登录按钮时什么也没有发生没有错误但也没有发送到新屏幕这是按钮代码 Widget submitButton return Container margin EdgeInsets al
如何在 Dockerfile 中添加除隐藏目录（如 .git）之外的所有文件/目录

我们经常做的一件事就是将所有源代码打包在Dockerfile当我们构建 Docker 镜像时 ADD app 我们怎样才能避免包括 git目录以简单的方式我尝试使用 Unix 方式来处理这个问题ADD app 完整样本 docker bo
Java中引用传递的疑惑

所以我在读这个帖子 https stackoverflow com questions 40480 is java pass by reference和回复编号 2 在该示例中调用该方法后地址 42 name 处的 Dog 值是否更改为
Spring Hibernate：重新加载实体映射

在 Web 应用程序中我们使用 Spring 3 2 和 Hibernate 4 1 1 并实现类似插件的架构可以在运行时添加和删除插件对于每个模块我们定义了一个单独的类加载器并在 spring 上创建单独的子应用程序上下文完整
如何使用python中的turtle模块绘制颜色环

我有下面的代码它应该在一个圆圈周围绘制一圈颜色但如果在移动到下一个之前打印和更改 8 次则只有一种颜色 import turtle def drawCircle colorList radius for color in colorL
Win32 DrawText 行高

我正在调用 Win32DrawText函数将一些文本输出到设备上下文中文本很长可以很好地换行到第二行问题是我需要稍微减少行之间的间距我想减少行高关于如何做到这一点有什么想法吗我只想打电话DrawText两次每行一次但随后我必
检查 enum 是否已过时

我如何检查是否enum如果标记为过时 public enum MyEnums MyEnum1 Obsolete How can you know that I m obsolete MyEnum2 MyEnum3 现在在运行时我需要知道哪
递归相对于 git rm -r [文件名] 意味着什么

我正在学习一些 git 教程但不明白运行之间的区别 git rm path to file and git rm r path to file 递归到底是什么意思提前致谢从 git rm 手册页主目录名称例如dir去除dir fi
对“lzma_code”的未定义引用

我尝试打包我的应用程序并静态链接所有库但我收到此错误 Makefile 如下所示 CC gcc INCPATH I home johnny Application FileBasedReG include RealityGrid LIBS
可以在 UUID 列上创建索引吗？

是否可以在 Cassandra 中的 UUID TIMEUUID 列上创建索引我正在测试一个模型设计该设计在 UUID 列上有一个索引但对该列的查询始终返回找到的 0 行我有一个这样的表 create table some data
在VS2008中使用wpf透明png

我想在 WPF VS2008 中制作一个半透明的 UI 因此我将表单设为透明并想在其顶部显示一个半透明 png 其中包括孔如何显示半透明png 半透明意味着它有可以看到的孔另外我如何在 C 中完成此操作而不使用 WPF Tha
未找到“GuzzleHttp\Client”类

我同时使用Guzzle http guzzle readthedocs org en latest 并首次推出 Codeigniter 3 0 我也承认我是第一次使用 php 命名空间我正在尝试根据文档中提供的示例使用 Guzzle 发出
GenJar 更换或更新？

GenJar 是一个专门的 Ant 任务它基于类依赖关系而不是简单地基于目录的内容构建 jar 文件 http genjar sourceforge net http genjar sourceforge net 确实有用但是项目好像不
Django 无法导入设置

我正在尝试在我的项目中使用 django admin dbshel l 任何其他 cmd 都会给出相同的结果我得到了 You must either define the environment variable DJANGO SETTI
Powershell脚本运行缓慢

我正在编写一个脚本来检查大约 15 个远程服务器上的版本但该脚本的执行时间比我预期的要长得多 listServers compName1 compName2 compName3 compName15 Out File C temp jav
如何轻松区分/比较 TFS 中的 2 个搁置集？

有没有一种方法可以比较 TFS 中的 2 个搁置而不必在单独的工作区中取消搁置并比较文件我一直在寻找相同的东西即比较两个书架的内容而不需要取消其中之一的书架最终为该功能编写一个 Visual Studio 扩展该扩展适用于 Vi
使用 WinForms 绘制宽线时出现 OutOfMemoryException

这个太疯狂了我只画了几千条线OnPaint处理程序没有问题当pen Width lt 1 或者当屏幕上没有很多行时好的我画了一张比例尺地图线宽随地图缩放当我缩放一些地图时我得到OutOfMemoryException WHY
在第三方网站的 iframe 中访问时，未为子域设置 Django csrf cookie

到目前为止我的应用程序运行良好所有操作都是通过访问其公共 IP 来完成的现在它被添加到主站点名称为 app mainsite com 这样就可以访问了我可以登录等等一切但我的应用程序有点特别它的某个功能允许用户在任何第三方网
Android中如何获取经度和纬度

我想找到我当前位置的经度和纬度但我一直得不到NULL double lat loc getLatitude Cause the result is null so can t know longitude and latitude dou
按给定的时间增量查找数据帧列中的时间戳

我有一个包含时间戳列的数据框我的目标是找到每行的第一个时间戳该时间戳大于该行的时间戳给定的偏移量例如 0 01 秒我尝试使用这里给出的答案 https stackoverflow com questions 32237862 fin

按给定的时间增量查找数据帧列中的时间戳

按给定的时间增量查找数据帧列中的时间戳 的相关文章

随机推荐

热门标签

按给定的时间增量查找数据帧列中的时间戳的相关文章