如何编写返回插值的函数（pandas 数据帧）？

2023-12-26

我有一个作为 pandas 数据框导入的 xls 文件。它具有 NaN 值；如何设置一个函数，用相邻值之间的插值替换 NaN？我不能使用 pd.DataFrame.interpolate 或任何现有的插值函数，因为我应该创建自己的函数。

这是我所拥有的，但我认为这是非常错误的。抱歉，对 Python 还很陌生:(

import pandas as pd
file = pd.read_excel("xls file")

def interpolate(x):
  for i in range(len(x)):
    if x.iloc[i, -1].isnull():
      x.iloc[i,-1] = (((x.iloc[i-1, -1]) + (x.iloc[i+1, -1]))/2)
    else:
      x.iloc[i,-1] = x.iloc[i, -1]

interpolate(file)

例如，数据框最初看起来像这样：

我希望它返回：

为此，假设没有连续的 NaN 条目

该解决方案重现了以下行为pd.Series.interpolate https://pandas.pydata.org/docs/reference/api/pandas.Series.interpolate.html使用默认参数。这不是一个适合初学者的解决方案，如果您的问题是家庭作业，我很想知道您的教授的期望是什么。

我正在使用具有前导、尾随和连续的数据框nan价值观。我添加了一列带有插值的列来与我的解决方案进行比较。 ASeries需要使用默认排序范围索引。

import pandas as pd
import numpy as np

np.random.seed(11)
a = np.where(np.random.rand(20) > .5, np.random.uniform(0,10, 20), np.nan)
df = pd.DataFrame({
    'x': a
})
df['x_interp'] = df.x.interpolate()
df

Output

           x  x_interp
0        NaN       NaN
1        NaN       NaN
2        NaN       NaN
3   3.187988  3.187988
4        NaN  2.661738
5        NaN  2.135487
6        NaN  1.609237
7        NaN  1.082987
8   0.556737  0.556737
9   4.797973  4.797973
10  4.016765  4.016765
11       NaN  5.597628
12  7.178492  7.178492
13  6.020641  6.020641
14       NaN  7.755832
15  9.491024  9.491024
16       NaN  9.491024
17       NaN  9.491024
18       NaN  9.491024
19       NaN  9.491024

该方法是找到具有nan以及周围的价值观。然后用周围值之间的线性步长填充这些切片。这ffill参数控制是否尾随nan将用最后一个可用值填充。

def interp(ser, ffill=True):
    ser = ser[df.x.notna().idxmax():].copy()
    start = ser.notna() & ser.shift(-1, fill_value=0).isna()
    end = ser.notna() & ser.shift(1, fill_value=0).isna()
    
    for x,y in zip(ser.index[start],ser.index[end]):
        step = (ser.loc[y] - ser.loc[x])/(y - x)
        ser.loc[x:y] = [ser.loc[x] + i * step for i in range(y-x)] + [ser.loc[y]]

    if ffill:
        ser = ser.ffill()
        
    return ser

df['x_new_interp'] = interp(df.x, False)
df['x_new_interp_ffill'] = interp(df.x)
df

Output

           x  x_interp  x_new_interp  x_new_interp_ffill
0        NaN       NaN           NaN                 NaN
1        NaN       NaN           NaN                 NaN
2        NaN       NaN           NaN                 NaN
3   3.187988  3.187988      3.187988            3.187988
4        NaN  2.661738      2.661738            2.661738
5        NaN  2.135487      2.135487            2.135487
6        NaN  1.609237      1.609237            1.609237
7        NaN  1.082987      1.082987            1.082987
8   0.556737  0.556737      0.556737            0.556737
9   4.797973  4.797973      4.797973            4.797973
10  4.016765  4.016765      4.016765            4.016765
11       NaN  5.597628      5.597628            5.597628
12  7.178492  7.178492      7.178492            7.178492
13  6.020641  6.020641      6.020641            6.020641
14       NaN  7.755832      7.755832            7.755832
15  9.491024  9.491024      9.491024            9.491024
16       NaN  9.491024           NaN            9.491024
17       NaN  9.491024           NaN            9.491024
18       NaN  9.491024           NaN            9.491024
19       NaN  9.491024           NaN            9.491024

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何编写返回插值的函数（pandas 数据帧）？的相关文章

Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
使用 Django Rest 保存 Base64ImageField 类型会将其保存为原始图像。如何将其转换为普通图像

我的模型中有 5 个图像字段 imageS imageS imageS imageS 和 imageE 我正在尝试按以下方式保存图像图像的类型Base64ImageField images imageA imageB imageC ima
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
Python 类型安全吗？

根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换计算机科学家就认为该语言是类型安全的
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
处理大文件的最快方法？

我有多个 3 GB 制表符分隔文件每个文件中有 2000 万行所有行都必须独立处理任何两行之间没有关系我的问题是什么会更快逐行阅读 with open as infile for line in infile 将文件分块读入内存
长/宽数据到宽/长

我有一个数据框如下所示 import pandas as pd d decil 1 decil 1 decil 2 decil 2 decil 3 decil 3 decil kommune AA BB AA BB AA BB 2010

随机推荐

在python中添加atom中的模块

我的计算机上安装了 pygame 和 tkinter 模块但我无法找到如何在文本编辑器 Atom 中访问它们我可以在 IDLE 中使用它们 import pygame 但是当我尝试将其导入atom 时它无法识别该模块有人知道为什么吗
Firefox 是否支持表格元素上的position:relative？

当我尝试使用时position relative position absolute on a th or td 在 Firefox 中它似乎不起作用简单且最正确的方法是将单元格的内容包装在 div 中并添加相对于该 div 的位置 ex
.net core razor 页面中的多个视图组件未正确绑定

我正在使用 razor 页面创建一个 net core 5 Web 应用程序并且正在努力将我创建的视图组件绑定到我的页面如果我在页面上有多个相同的视图组件以下完美运行我的页面 cshtml page model MyPageMode
多个邮件附件 - PhoneGap

您好我正在phonegap中做一个应用程序它需要有多个附件但我无法有多个附件任何解决方案我的代码如下
使用单个函数调用写入多个文件描述符

我有一个群聊服务器的用例其中服务器必须向所有客户端的套接字写入一个公共字符串然后我通过循环遍历文件描述符列表并将字符串写入每个文件描述符来解决这个问题现在我正在考虑寻找更好的解决方案是否可以通过使用 Linux 中的 tee 系统
在 Swift 3.0 中转换 base64String 中的音频文件

我正在使用以下代码录制音频文件 let audioFilename getDocumentsDirectory appendingPathComponent tt mp4 let settings AVFormatIDKey Int kAu
修改多维 numpy 数组中的对角线

我有一个形状为 7 3 7 3 的多维 numpy 数组我想修改轴 0 和轴 2 重合的广义对角线这个广义对角线将被定义为数组中第 0 个和第 2 个索引重合的元素并且形状为 3 3 7 Doing arr diagonal axis
在 Vbscript 中终止进程

我试图终止名为 AetherBS exe 的进程的所有实例但以下 VBscript 不起作用我不太确定在哪里为什么会失败那么我怎样才能杀死 AetherBS exe 的所有进程呢 CloseAPP AetherBS exe Func
Boost.Spirit 将表达式转换为 AST

使用 Boost Spirit 将某些表达式转换为 AST 的正确方法是什么我尝试构建它但我认为它很混乱可以简化很多 https godbolt org z VXHXLY https godbolt org z VXHXLY incl
调试非托管 Neo4j 扩展

我刚刚开始使用 Graphaware 框架为 Neo4j 服务器开发一个非托管扩展到目前为止一切都很好甚至单元测试也有效但我想实际调试从 Intellij 内部运行 Neo4j 服务器的扩展有人能给我一个关于如何做到这一点的提示吗
Spring Batch 多数据源和 ChainedTransactionManager 风险

我正在研究由两个数据源组成的 Spring Batch 的可行性用于 Spring Batch 元数据的 SQL 数据源和用于业务数据的 MongoDB 数据源具有事务性用途交易方面在这里提出了几个问题以下主题使用 MongoDB
让 Django 走向绿色

我有一个 Django 管理命令可以发出数千个 TCP UDP 请求我使用 Gevent 来加快速度因为我重组了代码以作为协程工作套接字连接不再阻塞但从我读到的内容来看 Django 的某些部分仍然不是绿色的我所说的绿色是指使
如何使用 JSTL 在 JSF 1.2 页面中强制构建阶段？

我在 JSF 应用程序中使用 JSTL 标签通过某些操作我需要重建组件树就像它是初始构建一样我当前的症状是对象与组件关联不正确重复的 ID 以及陈旧组件的其他问题这是使用在构建阶段使用的 c foreach 不能使用重复标记请
我们如何确定我们使用的是 Web API 1 还是 Web API 2？

介绍一下问题我想知道我们使用的是Web API 1还是2 我自己的packages config指示版本5 0 0 这是 Web API 1 还是 2 搜索和研究我尝试过谷歌搜索以下内容网络 API 1 网络 API 2 and AS
Rhino 中没有 Array.filter() 吗？

为什么我不能使用Array filter 在犀牛代码是这样的 var simple reason a b c print typeof simple reason filter var not so simple reason new A
WinForms：无需使用 FormWindowState.Normal 即可查找最小化表单的大小

有没有一种简单的方法可以确定 WindowState Normal 中窗体的大小而无需实际更改窗体状态这是我现在所做的 C 代码 public class MyForm Form public void MyMethod FormWin
VB.NET 将 Tab 键发送到另一个应用程序窗口

我想将 TAB 键发送到另一个应用程序window 将密钥发送到窗口而不是文本框 I tried SendMessage hWnd WM SETHOTKEY VK TAB 0 什么都没发生我的目标是将 Tab 键发送到我的应用程序Or当
使用带有 CommaDelimitedList 参数的 Cloudformation Join 函数来构建 IAM ARN

我一直在尝试构建一个存储桶策略以允许对 CloudFormation 中的集中帐户执行操作到共享相同模式的一系列其他帐户中的 IAM 角色即 arn aws iam 111111111111 role my role arn aws i
Golang：如何将字符串转换为二进制表示形式

在golang中如何将字符串转换为二进制字符串示例 CC 变为 10000111000011 这是一个简单的方法 func stringToBin s string binString string for c range s binS
如何编写返回插值的函数（pandas 数据帧）？

我有一个作为 pandas 数据框导入的 xls 文件它具有 NaN 值如何设置一个函数用相邻值之间的插值替换 NaN 我不能使用 pd DataFrame interpolate 或任何现有的插值函数因为我应该创建自己的函数这是

如何编写返回插值的函数（pandas 数据帧）？

如何编写返回插值的函数（pandas 数据帧）？ 的相关文章

随机推荐

热门标签

如何编写返回插值的函数（pandas 数据帧）？的相关文章