pandas 使用 fill_method 重新采样:需要知道从哪一行复制数据?

2024-01-05

我正在尝试使用重新采样方法来填补时间序列数据中的空白。但我也想知道哪一行被用来填充丢失的数据。

这是我的输入系列。

In [28]: data
Out[28]: 
Date
2002-09-09    233.25
2002-09-11    233.05
2002-09-16    230.25
2002-09-18    230.10
2002-09-19    230.05
Name: Price

通过重新采样,我会得到这个

In [29]: data.resample("D", fill_method='bfill')
Out[29]: 
Date
2002-09-09    233.25
2002-09-10    233.05
2002-09-11    233.05
2002-09-12    230.25
2002-09-13    230.25
2002-09-14    230.25
2002-09-15    230.25
2002-09-16    230.25
2002-09-17    230.10
2002-09-18    230.10
2002-09-19    230.05
Freq: D

我在寻找

Out[29]: 
Date
2002-09-09    233.25  2002-09-09
2002-09-10    233.05  2012-09-11
2002-09-11    233.05  2012-09-11
2002-09-12    230.25  2012-09-16
2002-09-13    230.25  2012-09-16
2002-09-14    230.25  2012-09-16
2002-09-15    230.25  2012-09-16
2002-09-16    230.25  2012-09-16
2002-09-17    230.10  2012-09-18  
2002-09-18    230.10  2012-09-18
2002-09-19    230.05  2012-09-19

有什么帮助吗?


转换后Series to a DataFrame,将索引复制到它自己的列中。 (DatetimeIndex.format()在这里很有用,因为它返回索引的字符串表示形式,而不是时间戳/日期时间对象。)

In [510]: df = pd.DataFrame(data)

In [511]: df['OrigDate'] = df.index.format()

In [513]: df
Out[513]: 
             Price    OrigDate
Date                          
2002-09-09  233.25  2002-09-09
2002-09-11  233.05  2002-09-11
2002-09-16  230.25  2002-09-16
2002-09-18  230.10  2002-09-18
2002-09-19  230.05  2002-09-19

对于不聚合的重采样,有一个辅助方法asfreq().

In [528]: df.asfreq("D", method='bfill')
Out[528]: 
             Price    OrigDate
2002-09-09  233.25  2002-09-09
2002-09-10  233.05  2002-09-11
2002-09-11  233.05  2002-09-11
2002-09-12  230.25  2002-09-16
2002-09-13  230.25  2002-09-16
2002-09-14  230.25  2002-09-16
2002-09-15  230.25  2002-09-16
2002-09-16  230.25  2002-09-16
2002-09-17  230.10  2002-09-18
2002-09-18  230.10  2002-09-18
2002-09-19  230.05  2002-09-19

这是以下内容的有效简写,其中last()在中间调用DataFrameGroupBy对象。

In [529]: df.resample("D", how='last', fill_method='bfill')
Out[529]: 
             Price    OrigDate
Date                          
2002-09-09  233.25  2002-09-09
2002-09-10  233.05  2002-09-11
2002-09-11  233.05  2002-09-11
2002-09-12  230.25  2002-09-16
2002-09-13  230.25  2002-09-16
2002-09-14  230.25  2002-09-16
2002-09-15  230.25  2002-09-16
2002-09-16  230.25  2002-09-16
2002-09-17  230.10  2002-09-18
2002-09-18  230.10  2002-09-18
2002-09-19  230.05  2002-09-19
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas 使用 fill_method 重新采样:需要知道从哪一行复制数据? 的相关文章

  • 如何将条目中的部分文本加粗并更改其背景颜色?

    我正在创建一个基于 Tkinter 的 GUI 它有一个 Entry 小部件 我想将其文本的一部分加粗并更改其背景颜色 但我不知道我该怎么做 如果我使用文本小部件 我可以只使用标签 但看起来它们不能与条目小部件一起使用 此代码使用文本小部件
  • 在 Python 中使用 sec 函数的反函数

    我正在创建一个程序 用于计算从一定高度范围和设定初始速度发射射弹的最佳角度 在我需要使用的最终方程中 存在一个反 sec 函数 它导致了一些麻烦 我已经导入了数学并尝试使用 asec 无论如何 但是数学似乎无法计算反秒函数 我也明白 sec
  • Python3 查找 2 个列表中有多少个差异才能相等

    假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到 其中有多少项list2应该改变 以便它等于lis
  • 将 subprocess.Popen 的输出通过管道传输到文件

    我需要启动一些长时间运行的进程subprocess Popen 并希望拥有stdout and stderr从每个自动管道到单独的日志文件 每个进程将同时运行几分钟 我想要两个日志文件 stdout and stderr 每个进程当进程运行
  • Python:随时接受用户输入

    我正在创建一个可以做很多事情的单元 其中之一是计算机器的周期 虽然我将把它转移到梯形逻辑 CoDeSys 但我首先将我的想法放入 Python 中 我将进行计数 只需一个简单的操作 counter 1 print counter 跟踪我处于
  • 反加入熊猫

    我有两个表 我想附加它们 以便仅保留表 A 中的所有数据 并且仅在其键唯一时添加表 B 中的数据 键值在表 A 和 B 中是唯一的 但在某些情况下键将出现在表 A 和 B 中 我认为执行此操作的方法将涉及某种过滤联接 反联接 以获取表 B
  • 如何为多组精灵创建随机位置?

    我尝试使用 blit 和 draw 方法进行 for 循环 并为 PlayerSprite 和 Treegroup 使用不同的变量 for PlayerSprite in Treegroup surface blit PlayerSprit
  • 使用 genfromtxt 导入 numpy 中缺失值的 csv 数据

    我有一个 csv 文件 看起来像这样 实际文件有更多的列和行 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 假设文件的名称是info csv如果我尝试使用导入它 data numpy genfromtxt i
  • 使用Python将图像转换为十六进制格式

    我的下面有一个jpg文件tmp folder upload path tmp resized test jpg 我一直在使用下面的代码 Method 1 with open upload path rb as image file enco
  • Python While 循环,and (&) 运算符不起作用

    我正在努力寻找最大公因数 我写了一个糟糕的 运算密集型 算法 它将较低的值减一 使用 检查它是否均匀地划分了分子和分母 如果是 则退出程序 但是 我的 while 循环没有使用 and 运算符 因此一旦分子可整除 它就会停止 即使它不是正确
  • 在 Mac 上安装 Pygame 到 Enthought 构建中

    关于在 Mac 上安装 Pygame 有许多未解答的问题 但我将在这里提出我的具体问题并希望得到答案 我在 Mac 上安装 Pygame 时遇到了难以置信的困难 我使用 Enthought 版本 EPD 7 3 2 32 位 它是我的默认框
  • ValueError:无法插入 ID,已存在

    我有这个数据 ID TIME 1 2 1 4 1 2 2 3 我想按以下方式对数据进行分组ID并计算每组的平均时间和规模 ID MEAN TIME COUNT 1 2 67 3 2 3 00 1 如果我运行此代码 则会收到错误 ValueE
  • python中的sys.stdin.fileno()是什么

    如果这是非常基本的或之前已经问过的 我很抱歉 我用谷歌搜索但找不到简单且令人满意的解释 我想知道什么sys stdin fileno is 我在代码中看到了它 但不明白它的作用 这是实际的代码块 fileno sys stdin filen
  • WindowsError:[错误 5] 访问被拒绝

    我一直在尝试终止一个进程 但我的所有选项都给出了 Windows 访问被拒绝错误 我通过以下方式打开进程 一个python脚本 test subprocess Popen sys executable testsc py 我想杀死那个进程
  • 使用 lambda 函数更改属性值

    我可以使用 lambda 函数循环遍历类对象列表并更改属性值 对于所有对象或满足特定条件的对象 吗 class Student object def init self name age self name name self age ag
  • 使用 Doc2vec 后如何解释 Clusters 结果?

    我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式 例如 v1 v100 之后 我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo
  • Scrapy 蜘蛛无法工作

    由于到目前为止没有任何效果 我开始了一个新项目 python scrapy ctl py startproject Nu 我完全按照教程操作 创建了文件夹和一个新的蜘蛛 from scrapy contrib spiders import
  • 如何对字符串列表进行排序?

    在 Python 中创建按字母顺序排序的列表的最佳方法是什么 基本回答 mylist b C A mylist sort 这会修改您的原始列表 即就地排序 要获取列表的排序副本而不更改原始列表 请使用sorted http docs pyt
  • 使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

    我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布 有
  • 从时间序列生成日期特征

    我有一个数据框 其中包含如下列 Date temp data holiday day 01 01 2000 10000 0 1 02 01 2000 0 1 2 03 01 2000 2000 0 3 30 01 2000 200 0 30

随机推荐

  • 在 HTML 中隐藏输入有什么意义?这有哪些常见用途?

    我没有看到隐藏输入的好处 如果您设置隐藏输入的值 为什么不在引用该隐藏输入的位置使用该值呢 这是有原因的 但我只是不知道 它们用于传递提交表单时所需的数据 更常见的情况之一是允许用户编辑某些现有条目的表单 您需要知道他们正在编辑哪个条目 以
  • 使用 HttpURLConnection 发送 UTF-8 字符串

    到目前为止 我已经使用以下代码片段来发送和接收 JSON 字符串 static private String sendJson String json String url HttpClient httpClient new Default
  • 未捕获错误:ReCAPTCHA 占位符元素必须是元素或 id

    我正在将 ReCAPTCHA 添加到具有多个联系表单的 Bootstrap Jekyll 网站 页脚中有一个弹出模式 偶尔有一个 立即联系我们 部分 还有几个页面上有一个 请求有关 的更多信息 由于我在一个页面上有多个联系表单 因此我需要显
  • 将 Python 最小化到系统托盘并生成通知? [复制]

    这个问题在这里已经有答案了 我环顾四周 但找不到任何可以接近做我想做的事的东西 我想让我的 Python 脚本作为最小化的系统托盘应用程序启动 或者能够最小化到系统托盘 并且能够发出系统托盘通知 有人有任何想法 库或示例吗 谢谢 海福莱克斯
  • 从 Swift 中的 Eureka Forms 获取值

    我是 Swift 编程新手 我正在尝试使用 Eureka 库创建一个表单 该表格已经可以使用 但我无法从表格中获取数据 我试图将数据一一存储到全局变量中 以便在按下按钮时打印 问题是代码总是被破坏 我不知道如何纠正它 这是我的代码 impo
  • 如何在没有支持表的情况下在 Rails 中创建只读模型

    我想创建只读模型 这可能是一些复杂的结果 与任何直接表模型类关系不大的联接或聚合查询 我已经定义了 例如想象中的 ActiveRecord View 类 class B lt ActiveRecord View default scope
  • 用Java编写一个mode方法来查找数组中出现次数最多的元素

    问题是 编写一个名为 mode 的方法 该方法返回整数数组中最常出现的元素 假设数组至少有一个元素 并且数组中的每个元素的值都在 0 到 100 之间 含 0 和 100 通过选择较低的值来打破平局 例如 如果传递的数组包含值 27 15
  • 使用mysql递归调用存储过程

    enter image description here https i stack imgur com h5aNM pngget legside from binary https i stack imgur com sJvWh png
  • TextAreaFor 无法设置宽度

    我无法设置文本区域中的列宽度 行 高度效果很好 有人可以帮忙吗谢谢 using Html BeginForm Html AntiForgeryToken Html ValidationSummary true Html TextAreaFo
  • 如何在Powershell中输出多个哈希表

    我有一个键 值对哈希表的哈希表 来自 ini 文件 它看起来像这样 Name Value global Variables
  • TableModel 火灾方法如果不可见则昂贵

    在java swing表模型中 我们能够触发表更改 添加 删除等 我想知道如果组件不可见 这些方法调用是否会很昂贵 例如 另一扇窗户覆盖着它 或者它位于非活动选项卡中 为了最大限度地减少触发大量更新事件的影响 JTable 渲染 http
  • 如何在 ContainerRequestFilter 中检索请求的匹配资源

    我正在使用 JAX RS Jersey 开发 Web 服务 我已经设置了一个容器请求过滤器其目的是验证用户身份 我只需要通过身份验证保护某些路径 其余的路径可供所有人使用 我想通过 ContainerRequestFilter 中的 Ext
  • Dancer 与 Catalyst [Perl Web 框架] [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 在 C++ 中声明可变长度二维数组的正确方法

    我想要一个二维 int 数组arr我可以通过 arr i j 访问 据我了解我可以声明int arr 10 15 得到这样一个数组 然而 就我而言 大小是可变的 据我了解 如果数组的大小没有硬编码 则此语法不起作用 但我使用像这样的变量in
  • Lua加载文件找不到文件

    我有一些带有以下行的 lua 代码 JSON loadfile JSON lua 文件 JSON lua 与该行来自的 lua 代码位于同一目录中 这段代码对我有用了一段时间 然后 在我不更改 lua 源 JSON lua 任何文件的权限或
  • WPF 单击 ListBoxItem 内的控件不会选择 ListBoxItem

    您好 我找不到任何类似的问题 所以我发布了新问题 在下面的代码中 我使用 ListBoxItems 创建 ListBox 控件 每个 ListBoxItems 内部都包含单选按钮 当我单击单选按钮时 它会进行选择 但父 ListBoxIte
  • 访问本地隐藏的全局变量[重复]

    这个问题在这里已经有答案了 可能的重复 如何在 C 中访问隐藏的全局变量 https stackoverflow com questions 618769 how can i access a shadowed global variabl
  • git fork repo 到同一组织

    如何将我的组织中的存储库分叉到same组织 以便我可以定期将前叉与upstream存储库 在这个 StackOverflow 问题中将 github 上的 git 存储库复制 分叉到同一组织中 https stackoverflow com
  • 在Python中从二进制文件中读取整数

    我正在尝试阅读BMP http en wikipedia org wiki BMP file formatPython 中的文件 我知道前两个字节 表示 BMP 公司 接下来的 4 个字节是文件大小 当我执行时 fin open hi bm
  • pandas 使用 fill_method 重新采样:需要知道从哪一行复制数据?

    我正在尝试使用重新采样方法来填补时间序列数据中的空白 但我也想知道哪一行被用来填充丢失的数据 这是我的输入系列 In 28 data Out 28 Date 2002 09 09 233 25 2002 09 11 233 05 2002