在 Python 中插入缺失值

2024-04-21

所有 - 我希望你能够提供帮助，因为这是我知道我几乎从这里和网上的各种帖子中破解的任务之一，但还没有完全发挥作用。

本质上，我在数据库中有以下数据，通过 psql.read_sql(sql, cnxn) 返回到 Pandas 对象

+------------------------------------+
|              StartTime  StartLevel |
+------------------------------------+
| 0  2015-02-16 00:00:00     480.000 |
| 1  2015-02-16 00:30:00     480.000 |
| 2  2015-02-16 00:34:00     390.000 |
| 3  2015-02-16 01:00:00     390.000 |
| 4  2015-02-16 01:30:00     390.000 |
| 5  2015-02-16 02:00:00     480.000 |
| 6  2015-02-16 02:17:00     420.000 |
+------------------------------------+

StartTime     datetime64[ns]
StartLevel           float64
dtype: object

我只是想对上述数据进行逐分钟的插值。

我还以分钟频率创建了一个日期时间系列，但在我的一生中，我无法将我的表“映射”到此上，然后进行插值，或者如何将 StartTime 重新采样到分钟粒度，然后插值丢失的数据。

任何帮助将不胜感激（我确信当我找到解决方案时我会踢自己！） - 非常感谢

UPDATE

根据下面的建议，代码如下：

import datetime
import numpy as np
import pandas as pd
import pyodbc
import pandas.io.sql as psql


cnxn = pyodbc.connect('DSN=MySQL;DATABASE=db;UID=uid;PWD=pwd')
cursor = cnxn.cursor()
sql = """
    SELECT
    StartTime,StartLevel
FROM
    aa.bb
    where cc = 'dd'
    and StartTime < '2015-02-16 02:30:00'
    order by StartTime asc"""

old_df = psql.read_sql(sql, cnxn)


num_minutes = 120
base = datetime.datetime(2015, 02, 16, 00, 00, 00)
date_list = [base + datetime.timedelta(minutes=x) for x in range(0, num_minutes)]
# set num_minutes for whatever is the correct number of minutes you require
new_data = [dict(StartTime=d, fake_val=np.NaN) for d in date_list]
new_df = pd.DataFrame(new_data)
new_df['StartLevel'] = old_df['StartLevel']
new_df.interpolate(inplace=True)

new_df 在提示符下的输出是：

+-----------------------------------------------+
|              StartTime  fake_val  StartLevel  |
+-----------------------------------------------+
| 0   2015-02-16 00:00:00       NaN         480 |
| 1   2015-02-16 00:01:00       NaN         480 |
| 2   2015-02-16 00:02:00       NaN         390 |
| 3   2015-02-16 00:03:00       NaN         390 |
| 4   2015-02-16 00:04:00       NaN         390 |
| 5   2015-02-16 00:05:00       NaN         480 |
| 6   2015-02-16 00:06:00       NaN         480 |
+-----------------------------------------------+

我很确定这不是最Pythonic的答案，所以我欢迎评论来改进它，但我相信你可以做这样的事情

首先创建您想要值的所有日期时间对象

num_minutes = 120
base = datetime.datetime(2015, 02, 16, 00, 00, 00)
date_list = [base + datetime.timedelta(minutes=x) for x in range(0, num_minutes)]
# set num_minutes for whatever is the correct number of minutes you require

然后使用这些索引值创建一个“假”数据框

new_data = [dict(StartTime=d, fake_val=np.NaN) for d in date_list]
new_df = pd.DataFrame(new_data)

EDIT:更正的反应

现在我们想要将两个数据帧合并为一个（并按日期排序）：

final_df = new_df.merge(df, how='outer', on='date').sort(columns='date')

final_df现在将按日期排序并包含正确的值StartLevel当你有数据并且NaN当你没有数据时。然后你可以打电话interpolate

EDIT:未调用插值inplace默认情况下，因此您需要设置该标志或保存结果

final_df = final_df.interpolate()

final_df.interpolate(inplace=True)

显然fake_val一旦合并了好的数据，就可以丢弃该列。创建该数据帧的目的是让一个数据帧包含您想要的所有值（这是我确信有一个更Pythonic的答案的地方）

完整文档interpolate可以被找寻到here http://pandas.pydata.org/pandas-docs/dev/generated/pandas.DataFrame.interpolate.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scipy

linearinterpolation

pandasql

在 Python 中插入缺失值的相关文章

如何计算总和的平方和？

我有一笔款项需要加快处理速度在一种情况下是 S x y k l Fu ku Fv lv Fx kx Fy ly 另一种情况是 S x y S k l Fu ku Fv lv Fx kx Fy ly 2 注意 S indices 是这些索引
用于在 Windows 中自动执行桌面活动的 Python 代码

我想使用 Python 在 Windows 环境中自动化桌面活动怎样才能做到呢一些例子也会有帮助我所说的桌面活动是指控制鼠标和键盘访问活动窗口属性双击桌面上的图标最小化和最大化窗口通过键盘向输入弹出窗口输入数据等操作看一下S
无法在 python 中导入名称 GoogleMaps

我使用下面的代码来获取地址的纬度和经度 from googlemaps import GoogleMaps gmaps GoogleMaps api key address Constitution Ave NW 10th St NW Wa
如何阻止 Django 中发生级联删除？

我的 Django 应用程序中有三个模型类 class Folder models Model folder models ForeignKey Folder null True blank True related name folder
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
当图例位于轴之外时选择 matplotlib 图例

当我修改 legend picking py 示例时我遇到了一个有趣的怪癖其中图例位于轴之外如下所示 leg ax legend loc upper left fancybox True shadow True leg ax lege
动态添加jinja模板

我有一个 jinja 模板它是一组 div 标签内的唯一内容 div include temppage html div 当我按下按钮时我想用其他内容替换标签之间的所有内容我希望用另一个 jinja 模板 include realpa
在 pandas 数据框中按列应用 Seaborn 热图

我试图在枢轴熊猫数据帧上使用seaborn的热图就像在超链接中一样有效 df pd DataFrame np random randint 1 100 size 3 2 df columns A B df sns heatmap df a
具有相同内容的拆分列表

例如我有以下列表 contents i have two pens prices 5 made in and 我想将它们分开使其具有与以下内容相同的内容 array 0 i have two pens array 1 prices 5 a
AES 会话密钥的 RSA 解密失败，并显示“AttributeError：‘bytes’对象没有属性‘n’”

我正在努力在 Python 3 6 上从 PyCryptodome 实现公钥加密当我尝试创建对称加密密钥并加密解密变量时一切正常但是当我引入 RSA 和 PKCS1 OAEP 的那一刻一切就都顺理成章了 session key加密
根据Python中两行之间的匹配创建一个带有[0,1]的新列

我正在尝试将多个列表或数据帧与一个大型基础数据帧进行比较然后对于任何匹配我想附加一个存储 1 匹配或 0 不匹配的列 df pd DataFrame Name A B C D ID 5 6 6 7 8 9 7 list1 5 6 8 9
使用 scikit 包在 Python 中绘制集群区域的边界

这是我处理 3 个属性 x y 值中的数据聚类的简单示例每个样本代表其位置 x y 及其所属变量我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
使用 RGB 数据将输入数据剪切到 imshow 的有效范围（对于浮点数为 [0..1]，对于整数为 [0..255]）

我尝试将 MRI 切片转换为 PNG 格式后运行图形切割算法我不断遇到以下问题 Clipping input data to the valid range for imshow with RGB data 0 1 for floats
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
Python range() 和 zip() 对象类型

我了解功能如何range and zip 可以在 for 循环中使用然而我期望range 输出一个列表很像seq在 Unix shell 中如果我运行以下代码 a range 10 print a 输出是range 10 表明它不是一
Unpivot Pandas 数据

我目前有一个DataFrame布置为 Jan Feb Mar Apr 2001 1 12 12 19 2002 9 2003 我想将数据逆透视使其看起来像 Date Value Jan 2001 1 Feb 2001 1 Mar 200
获取 pandas 中最后一次出现特定值之后的所有行

我的数据框看起来像 ID colA 1 B 1 D 2 B 2 D 2 C 我已返回每组中事件 B 最后一次出现后的所有行输出将是 ID colA 1 D 2 D 2 C 我试过 a df colA str contains B grou
如何检索 SQLAlchemy 结果集的 python 列表？ [复制]

这个问题在这里已经有答案了我有以下查询来检索单列数据 routes query select schema stop times c route number schema stop times c stop id stop id dis
在 python 中使用 ftplib 时

这是导致错误的相关代码 ftp ftplib FTP server ftp login r user r pass change directories to the incoming folder ftp cwd incoming fil
重定向到破折号中的 url

我正在使用 dash 构建一个仪表板每当单击特定数据点时我都会创建一个唯一的 url 如何将用户重定向到此创建的 url 我正在使用下面给出的代码每当有人单击任何数据点时单击事件就会触发并执行回调函数 app layout html

随机推荐

IE 未在 TLS 相互身份验证中发送客户端证书

我正在尝试与第三方 API 建立 TLS 相互身份验证客户端证书配置良好当我尝试通过 Chrome 访问端点 url 时它工作正常 Chrome 要求在消息框中确认证书当我这样做时页面会显示其内容当我尝试使用 IE 执行同样的操
Routes.rb vsrack-rewrite vs nginx/apache 重写规则

我的应用程序的前一个版本中的遗留 URL 有数十条重写规则我看到三个选择只需在路由文件 config routes rb 中添加匹配行 Use 机架重写 https github com jtrupiano rack rewrite
用于展平嵌套列表的递归生成器

我是一名编程新手在理解我的 Python 教科书 Magnus Lie Hetland 的 Beginning Python 中的示例时遇到了一些困难该示例是一个递归生成器旨在展平嵌套列表的元素具有任意深度 def flatten
Apple 听写 - 在应用程序中使用

有什么方法可以在本机 Apple 应用程序中利用 Apple 的听写语音转文本功能吗你的问题有点模糊最好先知道你尝试使用或做什么或者你想要实现什么目标更常见的是关键字识别 API 但可以用于此目的的语音识别 API 是张开耳朵 ht
iOS Storyboard：ViewController 外部和场景顶部的视图（第一响应者和退出框之间）

我很难理解为什么你可以把UIViews之外的UIViewController在故事板上以及它的用例可能是什么例如在故事板上我可以添加UIToolbar UIAcitivtyIndicator and UIProgressView那是在
如何在类模板中使用文件范围的命名空间声明？

C 10 介绍文件范围的命名空间 https learn microsoft com en us dotnet csharp language reference proposals csharp 10 0 file scoped name
安卓蓝牙无法连接

我遇到这个问题已经有一段时间了但一直无法解决我有一个 Android 应用程序它将所有配对的设备放在列表视图中当您单击列表项之一时它将发起连接到该蓝牙设备的请求我可以毫无问题地获取设备列表及其地址问题是一旦我尝试连接我就会
如何在 AWS 上设置无密码 ssh

如何在 AWS 集群上的节点之间设置无密码 ssh 以下设置无密码身份验证的步骤已针对 Centos 和 Ubuntu 进行了彻底测试假设您已经可以访问您的 EC2 机器可能正在使用 pem 密钥或者您拥有具有 root 权限的 u
Windows 7 为软件开发人员带来哪些好处？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在尝试将我的开发计算机升级到 W
如何重置 JSESSIONID

当用户进行身份验证时重置会话 cookie 被认为是一种良好的安全实践如何用 Java 做到这一点到目前为止我的尝试是成功的但我想知道是否有更好的方法 public static HttpSession resetSessionId
车把模板的文件扩展名

我更改了车把模板的扩展名并在调用 handlebarjs 编译函数的函数中引用了相同的扩展名它工作得很好没有任何问题但我很好奇是否还有其他人尝试过如果您认为这可能会因任何原因导致问题请告诉我出于某种原因我觉得扩展名 hand
Java 中搜索和排序算法的高效实现

有没有人有关于常见搜索和排序算法的一组 Java 代码实现的良好参考剥猫皮的方法有很多种很容易在网上找到各种算法的 Java 代码但是 Java 中是否有实现这些不同算法的最有效方法的列表例如有http www algorithmi
将 float 和 double 值与 delta 进行比较？

据我了解必须仔细比较浮点类型的值以避免固有浮点错误的问题这可以通过将值与错误阈值进行比较来改进例如以下解决方案比简单的解决方案更有用x y test static float CompareRelativeError float
如何通过 jQuery Ajax 发布数据在 PHP 中编码 JSON？

我有一个 HTML 表单并在点击提交按钮时将数据发送到 php 文件 ajax url text php type POST data amount amount firstName firstName lastName lastName
单击添加类和删除时切换类

如果我单击项目我需要添加类名如果单击同一项目则需要删除 ngFor 循环的类
Angular Material：如何在注销时关闭所有垫对话框和甜蜜警报

我想在 Angular 注销时关闭所有对话框 mat dialog 引导模式和甜蜜警报这是 AngularJS 版本 1 5 中的实现方式 function logout hide mdDialog modal angular eleme
如何将客户端证书与 ftp_ssl_connect 一起使用

我正在寻找通过 SSL 连接使用 FTP 服务器的最佳方法通常推送文件以及获取服务器上的文件列表该项目的一项要求是我必须使用客户端 X 509 证书作为身份验证过程的一部分我可以使用 php 函数 ftp ssl connect 来
将我的 apk 推送到 /system/app

如何推送我的应用程序包到Android模拟器 system app 文件夹我已经尝试过使用 adb 推送 myApk apk system app 它给了我这个 failed to copy No space left on devic
如何使用 JSF/MyFaces 创建基于用户角色的条件？

我必须使用哪些选项才能从 JSP 页面读取当前用户的角色我知道visibleOnUserRole myRole Tomahawk 组件上的属性但我需要角色来处理比简单可见性更复杂的事情 The 外部上下文 http docs oracl
在 Python 中插入缺失值

所有我希望你能够提供帮助因为这是我知道我几乎从这里和网上的各种帖子中破解的任务之一但还没有完全发挥作用本质上我在数据库中有以下数据通过 psql read sql sql cnxn 返回到 Pandas 对象 StartTime

在 Python 中插入缺失值

在 Python 中插入缺失值 的相关文章

随机推荐

热门标签

在 Python 中插入缺失值的相关文章