使用最新值进行采样

2024-05-30

考虑以下系列：

created_at
2014-01-27 21:50:05.040961    80000.00
2014-03-12 18:46:45.517968    79900.00
2014-09-05 20:54:17.991260    63605.31
2014-11-04 01:16:08.286631    64405.31
2014-11-04 01:17:26.398272    63605.31
2014-11-04 01:24:38.225306    64405.31
2014-11-13 19:32:14.273478    65205.31
Name: my_series, dtype: float64

我需要在一组特定的预定义日期（例如，从2014-12-01 to 2014-12-07）。对于每个这样的样本，我想得到most原始系列中可用的最新值。

我一直在看resample http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.resample.html（也可以看看this https://stackoverflow.com/questions/17001389/pandas-resample-documentation?lq=1 and this https://stackoverflow.com/questions/26247301/causal-resampling-sum-over-the-last-x-time-unit?lq=1线程），因为它看起来是适合这项工作的工具。但是，我还没有很好地掌握该功能。能resample用于此？如果是这样，怎么办？

如果您首先定义一组预定义日期（days在我下面的例子中），你可以reindex http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.reindex.html并指定填充方法（“ffill”将向前传播最后一个有效观察，因此这意味着采用时间序列的最新观察值）：

In [19]: s
Out[19]: 
time
2014-01-27 21:50:05.040961    80000.00
2014-03-12 18:46:45.517968    79900.00
2014-09-05 20:54:17.991260    63605.31
2014-11-04 01:16:08.286631    64405.31
2014-11-04 01:17:26.398272    63605.31
2014-11-04 01:24:38.225306    64405.31
2014-11-13 19:32:14.273478    65205.31
Name: my_series, dtype: float64

In [20]: days = pd.date_range('2014-12-01', '2014-12-07')

In [21]: s.reindex(days, method='ffill')
Out[21]: 
2014-12-01    65205.31
2014-12-02    65205.31
2014-12-03    65205.31
2014-12-04    65205.31
2014-12-05    65205.31
2014-12-06    65205.31
2014-12-07    65205.31
Freq: D, Name: my_series, dtype: float64

在这种情况下（您给出的示例日期），这给出了所有相同的值，因为对于所有日期，原始系列中的最新观察结果是相同的。

如果您不想给出特定的集合，而只想给出原始系列从开始到结束的所有日期，您可以使用resample达到同样的效果：

In [23]: s.resample('D', how='last', fill_method='ffill')
Out[23]: 
time
2014-01-27    80000
2014-01-28    80000
2014-01-29    80000
2014-01-30    80000
...
2014-11-10    64405.31
2014-11-11    64405.31
2014-11-12    64405.31
2014-11-13    65205.31
Freq: D, Name: my_series, Length: 291

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用最新值进行采样的相关文章

如何在redis中使用python删除排序集中的项目

如何使用 python 删除排序集中大于某个值的项目 key foo pipe redis master conn pipeline pipe zadd key 1 a pipe zadd key 2 b pipe zadd key 3 c
我如何知道Python的unicode函数识别的所有支持的编码

Python 有一个unicode将字节流转换为 unicode 字符串的内置函数我只是希望我能查询所有可用的encoding在我的系统上但如何这个问题的原因是有人使用 MAC OS X 向我发送了一封内容编码为 iso 2022
为什么Flask后台线程获取错误的数据库信息？

为了将实时数据库信息推送到客户端我在服务器端使用flask socketio 通过使用websocket将所有实时数据库信息推送到客户端我的视图文件有一个片段 from models import Host from flask soc
如果每个元组中的第二项重复，如何从元组列表中删除元素？

如果每个元组中的第二项重复如何从元组列表中删除元素例如我有一个按第一个元素排序的列表如下所示 alist 0 7897897 this is a foo bar sentence 0 653234 this is a foo bar
映射 2 个数据帧并替换目标数据帧中匹配值的标头

我有一个数据框 df1 SAP Name SAP Class SAP Sec Avi 5 C Rison 6 A Slesh 7 B San 8 C Sud 7 B df2 Name Fi Class Avi 5 Rison 6 Slesh
如何在 dash/plotly 中使用 iframe？（Python/HTML）

我正在创建一个仪表板我想使用这个交互式地图网站链接 https www ons gov uk peoplepopulationandcommunity healthandsocialcare causesofdeath articles
为什么我的字符串中出现不需要的换行符？

这应该很简单这很愚蠢但我无法让它发挥作用我有一个在读取文件时定义的标头 if gene env in line or gene HIV2gp7 in line header line 现在这个标题看起来像 gt lcl NC 0018
将 postgres 连接到 django 时遇到问题

以下文档来自Django Postgres 文档 https docs djangoproject com en 4 1 ref databases postgresql notes我添加到我的settings py 在我设置的设置中 DA
将列表列表替换为“压缩”列表列表，同时保持顺序

我有一个列表列表如我所附的代码所示如果有任何共同值我想链接每个子列表然后我想用列表的精简列表替换列表的列表例子如果我有一个清单 1 2 3 3 4 I want 1 2 3 4 如果我有 4 3 1 2 3 I want 4 3
如何在Python中将N毫秒添加到日期时间

我正在设置一个日期时间变量 fulldate datetime datetime strptime date time Y m d H M S f 其中日期和时间是适合日期时间性质的字符串如何将此日期时间增加 N 毫秒 Use timed
过滤给定范围内的坐标

我有数百个带有地理位置的 out 文件我将把它们批量导入到 SQLite 数据库中但是为了节省时间我只会导入地理坐标在某些间隔内的线文件是这样的 value value longitude latitude value value
numpy.polyval() 的反函数

我想知道 np polyval 是否有一个方便的反函数我在其中给出 y 值并求解 x 我知道我可以做到这一点的一种方法是 import numpy as np Set up the question p np array 1 1 10 y
pip 升级到 pip 10.x.x 后解析需求文件的正确方法？

所以今天我确实发现随着发布pip 10 x x the req软件包更改了其目录现在可以在下面找到pip internal req 由于通常的做法是使用parse requirements功能在你的setup py从需求文件中安装所有依赖
如何循环遍历列表中除最后一项之外的所有项？ [复制]

这个问题在这里已经有答案了 Using a for循环如何循环遍历列表中除最后一项之外的所有项我想遍历一个列表检查每个项目与后面的项目我可以在不使用索引的情况下做到这一点吗 for x in y 1 If y是一个生成器那么上面的
matplotlib 后端 - 我关心吗？

gt gt gt import matplotlib gt gt gt print matplotlib rcsetup all backends u GTK u GTKAgg u GTKCairo u MacOSX u Qt4Agg u
如何让 Python 生成器返回 None 而不是 StopIteration？

我使用生成器在列表中执行搜索如下简单示例 gt gt gt a 1 2 3 4 gt gt gt i for i v in enumerate a if v 4 next 3 只是为了稍微说明一下示例与上面的列表相比我使用的列表要长得
为什么变量 1 += 变量 2 比变量 1 = 变量 1 + 变量 2 快得多？

我继承了一些 Python 代码用于创建巨大的表最多 19 列宽 5000 行花了九秒用于在屏幕上绘制表格我注意到每一行都是使用以下代码添加的 sTable sTable n GetRow where sTable是一个字符串我将
导入错误：无法导入名称

我有一个名为 google translate python 的库 https github com terryyin google translate python https github com terryyin google tra
VSCode IntelliSense 认为 Python 'function()' 类存在

VSCode IntelliSense 正在完成一个名为的 Python 类function 这似乎不存在例如这似乎是有效的代码 def foo value return function value foo 0 But functio
Mac 无法安装 Tensorflow

我检查了我的 pip3 和 python3 版本 tensorflow MacBook Pro de Hector 2 tensorflow hectoresteban pip3 V pip 10 0 1 from Users hector

随机推荐

可以转换为 Swift 5

我在 Xcode 10 2 中收到此警告可以转换为 Swift 5 当我单击此错误时它会打开此窗口当我们点击Next会发生什么 swift 的当前版本是 swift5 仅在 Xcode 10 2 中受支持而您在 Xcode 10 2
如何实现可变虚拟成员函数

所以我有这个功能 virtual void CallRemoteFunction const char pServerGameObjectId const char pFunctionName OVariant arg1 OVariant
PySpark - RDD 到 JSON

我有一个 Hive 查询返回以下格式的数据 ip category score 1 2 3 4 X 5 10 10 10 10 A 2 1 2 3 4 Y 2 12 12 12 12 G 10 1 2 3 4 Z 9 10 10 10 10
如何发现另一个应用程序的意图

我正在尝试构建一个应用程序来接收来自 StumbleUpon 应用程序的共享此时我可以接收浏览器的共享网址但是当从 StumbleUpon 共享时我的应用程序不会显示在列表中我想我可能没有在清单中注册正确的意图有什么方法可以找
python os.fork 使用相同的 python 解释器吗？

据我所知 Python 中的线程使用相同的 Python 解释器实例我的问题是与创建的流程相同os fork 或者每个进程创建的os fork有自己的翻译吗每当你 fork 时整个 Python 进程都会在内存中复制包括Python
Visual Studio 2008 类图设计器

我正在使用 VS 类图设计器如何得到下图中的蓝线谢谢 source microsoft com https msdn microsoft com en us library Aa288743 clssdsgnr fig01big 28e
如何在 prestashop 模块中添加 javascript

是否可以将 javascript 集成到模块中而不直接注入 smarty 模板中 Solved 我在模块目录中添加了一个 Js 文件例如 mymodule views js abo front js 在我的模块类中我创建了一个指向标头的
输入字段名称以数字开头

我有一个输入字段其名称是 MD5 字符串例如
WPF 缩放变换和 ScrollViewer - 缩放时无法滚动超出原始大小

我在 ScrollViewer 中有一个 StackPanel 我有一个滑块可以在堆栈面板上进行缩放变换以允许放大和缩小功能问题是当我放大时滚动查看器不会将内容视为更大因此如果我滚动一点并尽可能向右滚动它会在我到达内容末尾
为什么 cuCtxCreate 返回旧上下文？

我已经安装了 CUDA SDK 4 2 64 CUDA工具包4 2 64 CUDA 驱动程序 4 2 64 我检查了 windows 中的每个 nvcuda dll 所有这些都是 4 2 版本但是当我使用驱动程序 api 创建上下文并使用
如何使用特定选项卡启动活动？

我已经浏览了许多示例问题和教程但我从未见过使用特定选项卡启动活动启动新意图我知道可以使用 setCurrentTab切换到选项卡但这只能从父活动选项卡内部完成从另一个活动启动一个活动中包含的特定选项卡怎么样是否可以如果是这样
在 Windows 上静默安装 Qt55 Enterprise

编辑在 Qt 支持的帮助下我已经解决了如何自动化 Qt 企业安装程序的这两个部分下面是脚本调用我正在尝试在 Windows 8 1 和 Windows 10 上静默安装 Qt 5 5 1 Enterprise 使用 script 开
如何更改标签栏图标颜色从默认蓝色？

我有四个标签我能够将选项卡图标颜色从默认的蓝色更改为红色或可能任何颜色并且效果非常好问题是它仅适用于三个选项卡项目最后一个选项卡默认为蓝色下面是代码我正在编码这个rootviewcontrollerAppDelegate m您
Math.Sin、Math.Cos 和 Math.Tan 精度以及正确显示它们的方法

我正在用 C 编写一个计算器 textBoxResult是一个文本框我在其中显示数字 recount是以度为单位获取角度并以弧度为单位返回的函数我的角度是从texBoxInput public double recount int nu
为什么Windsor只能拦截虚方法或接口方法？

我正在阅读文档发现如果不使用接口那么 Windsor 只能拦截虚拟方法这是 Windsor 的限制还是 C 语言的限制我正在寻找深入的答案 C 语言在这里完全无关问题是拦截在运行时级别如何工作一种技术是从类继承实现接口并将其用
Firefox 上的 jquery 焦点未设置

我想将焦点设置到我的文本区域以下是我的代码 this textInput val show focus 但它不起作用实际上当我按下鼠标按钮时它会出现但是当我松开鼠标时它会从文本区域中删除因此经过大量搜索后我发现 setTi
如何更改AWS ECS集群中的实例类型？

我在 AWS EC2 容器服务中有一个集群设置完毕后我使用了 t2 micro 实例因为这些实例足以进行开发现在我想使用更强大的实例例如 m4 large 我想知道是否可以仅更改实例类型这样我就不需要重新创建整个集群我找不到如
Java 空值检查

我有一个thread1 if object null object play 和另一个thread2可以写null into object随时参考我将同时运行这些线程我知道thread2可以重写object后参考null检查并会抛出Nu
Plone 内网工作流程和组权限

现在当然这可能是由于对 Plone 中的角色权限模型的误解因为它与我过去使用过的许多系统略有不同但这就是情况和我陷入困境的地方客户需要一个仅对登录用户开放的 Plone 站点 4 3 3 并且可以选择使所选内容对未登录用户可见
使用最新值进行采样

考虑以下系列 created at 2014 01 27 21 50 05 040961 80000 00 2014 03 12 18 46 45 517968 79900 00 2014 09 05 20 54 17 991260 636

使用最新值进行采样

使用最新值进行采样 的相关文章

随机推荐

热门标签

使用最新值进行采样的相关文章