时间序列--残差分析

2023-11-06

残差=y-yhat

一般我们就停止在这里了

但是如果残差表现的有某种形式,代表我们的模型需要进一步改进,如果残差表现的杂乱无章,代表确实没什么别的信息好提取了

现在用最naive的model--上一个时间的值=yhat看看残差表现吧

关于残差,可以看我的另一篇文章https://mp.csdn.net/postedit/82989567

from pandas import Series
from pandas import DataFrame
from pandas import concat
series = Series.from_csv('daily-total-female-births.csv', header=0)
# create lagged dataset
values = DataFrame(series.values)
dataframe = concat([values.shift(1), values], axis=1)
dataframe.columns = ['t-1', 't+1']
# split into train and test sets
X = dataframe.values
train_size = int(len(X) * 0.66)
train, test = X[1:train_size], X[train_size:]
train_X, train_y = train[:,0], train[:,1]
test_X, test_y = test[:,0], test[:,1]
# persistence model
predictions = [x for x in test_X]
# calculate residuals
residuals = [test_y[i]-predictions[i] for i in range(len(predictions))]
residuals = DataFrame(residuals)
print(residuals.head())
residuals.plot()
pyplot.show()

残差表现如下:

Line Plot of Residual Errors for the Daily Female Births Dataset 

现在看看基本信息

1.均值--越接近0越好

A value close to zero suggests no bias in the forecasts, whereas positive and negative values suggest a positive or negative bias in the forecasts made.

print(residuals.describe())

结果如下

count  125.000000
mean     0.064000
std      9.187776
min    -28.000000
25%     -6.000000
50%     -1.000000
75%      5.000000
max     30.000000

mean和0还是有点差距

2.直方图密度图about残差

我们希望残差分布越接近正太越好

If the plot showed a distribution that was distinctly non-Gaussian, it would suggest that assumptions made by the modeling process were perhaps incorrect and that a different modeling method may be required.

A large skew may suggest the opportunity for performing a transform to the data prior to modeling, such as taking the log or square root.

# histogram plot

residuals.hist()

pyplot.show()

# density plot

residuals.plot(kind='kde')

pyplot.show()

Histogram Plot of Residual Errors for the Daily Female Births Dataset

Density Plot of Residual Errors for the Daily Female Births Dataset

3.QQ图检验正太更快速的方式

from pandas import Series
from pandas import DataFrame
from pandas import concat
from matplotlib import pyplot
import numpy
from statsmodels.graphics.gofplots import qqplot
series = Series.from_csv('daily-total-female-births.csv', header=0)
# create lagged dataset
values = DataFrame(series.values)
dataframe = concat([values.shift(1), values], axis=1)
dataframe.columns = ['t-1', 't+1']
# split into train and test sets
X = dataframe.values
train_size = int(len(X) * 0.66)
train, test = X[1:train_size], X[train_size:]
train_X, train_y = train[:,0], train[:,1]
test_X, test_y = test[:,0], test[:,1]
# persistence model
predictions = [(x-0.064000) for x in test_X]
# calculate residuals
residuals = [test_y[i]-predictions[i] for i in range(len(predictions))]
residuals = numpy.array(residuals)
qqplot(residuals)
pyplot.show()

 Q-Q Plot of Residual Errors for the Daily Female Births Dataset越接近对角线越好

4.自回归图

残差的自回归越小越好!

Autocorrelation Plot of Residual Errors for the Daily Female Births Dataset

We do not see an obvious autocorrelation trend across the plot. There may be some positive autocorrelation worthy of further investigation at lag 7 that seems significant.

https://machinelearningmastery.com/visualize-time-series-residual-forecast-errors-with-python/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

时间序列--残差分析 的相关文章

  • 区间预测

    区间预测 MATLAB实现QRDNN深度神经网络分位数回归时间序列区间预测 目录 区间预测 MATLAB实现QRDNN深度神经网络分位数回归时间序列区间预测 效果一览 基本介绍 模型描述 程序设计 参考资料 效果一览 基本介绍 MATLAB
  • 多维时序

    多维时序 MATLAB实现RBF径向基神经网络多变量时间序列未来多步预测 目录 多维时序 MATLAB实现RBF径向基神经网络多变量时间序列未来多步预测 预测效果 基本介绍 模型描述 程序设计 参考资料 预测效果 基本介绍 MATLAB实现
  • 时序预测

    时序预测 MATLAB实现PSO BiLSTM 粒子群优化双向长短期记忆神经网络 时间序列预测 目录 时序预测 MATLAB实现PSO BiLSTM 粒子群优化双向长短期记忆神经网络 时间序列预测 预测效果 基本介绍 模型介绍 PSO模型
  • Time Series Data Augmentation for Deep Learning: A Survey

    本文属于数据增强系列综述的文章 针对 Time Series Data Augmentation for Deep Learning A Survey 的翻译 Time Series Data Augmentation for Deep L
  • 时间序列--残差分析

    残差 y yhat 一般我们就停止在这里了 但是如果残差表现的有某种形式 代表我们的模型需要进一步改进 如果残差表现的杂乱无章 代表确实没什么别的信息好提取了 现在用最naive的model 上一个时间的值 yhat看看残差表现吧 关于残差
  • 时序预测

    时序预测 MATLAB实现时间序列回归之交叉验证及损失函数 目录 时序预测 MATLAB实现时间序列回归之交叉验证及损失函数 基本介绍 程序设计 环境准备 交叉验证 损失函数 模型比较 参考资料 致谢 基本介绍 本文介绍MATLAB实现时间
  • R语言 时间序列ARIMA模型方法

    原理什么的百度一搜一堆 看不明白 先学会用这个工具吧 ARIMA 全称为自回归积分滑动平均模型 Autoregressive Integrated Moving Average Model 简记ARIMA 是由博克思 Box 和詹金斯 Je
  • 时序预测

    时序预测 MATLAB实现MLP多层感知机时间序列预测 目录 时序预测 MATLAB实现MLP多层感知机时间序列预测 预测效果 基本介绍 模型特性 程序设计 学习总结 预测效果 基本介绍
  • 时间序列完全教程(R)

    简介 在商业应用中 时间是最重要的因素 能够提升成功率 然而绝大多数公司很难跟上时间的脚步 但是随着技术的发展 出现了很多有效的方法 能够让我们预测未来 不要担心 本文并不会讨论时间机器 讨论的都是很实用的东西 本文将要讨论关于预测的方法
  • 多维时序

    多维时序 Matlab实现LSTM Adaboost和LSTM多变量时间序列预测对比 目录 多维时序 Matlab实现LSTM Adaboost和LSTM多变量时间序列预测对比 预测效果 基本介绍 模型描述 程序设计 参考资料 预测效果 基
  • 时间序列预测方法总结

    时间序列预测方法总结 数据准备 方法1 朴素法 方法2 简单平均法 方法3 移动平均法 方法4 简单指数平滑法 平面预测 优化 方法5 霍尔特 Holt 线性趋势法 方法6 Holt Winters季节性预测模型 加法分量形式 方法7 自回
  • 时序预测

    时序预测 MATLAB实现时间序列回归之Bootstrapped测试 目录 时序预测 MATLAB实现时间序列回归之Bootstrapped测试 基本介绍 程序设计 学习小结 参考资料 基本介绍 对传统规格测试中尺寸失真的另一种反应是自举
  • 多维时序

    多维时序 MATLAB实现GTO CNN LSTM人工大猩猩部队优化卷积长短期记忆神经网络多变量多步时间序列预测 目录 多维时序 MATLAB实现GTO CNN LSTM人工大猩猩部队优化卷积长短期记忆神经网络多变量多步时间序列预测 预测效
  • 【预测 - 00】概述:时间序列、特征设计+回归模型(持续更新...)

    前言 预测 一个很神秘的词语 根据历史信息并按照一定的方法对未来进行测算 时间序列 特征设计 回归 等是预测领域的常用方法 我是预测领域的一名新手 6月份因实习需求 刚接触领域领域 以 边学边实践 的方式推动着进度 8月底实习期结束 返校后
  • 时序预测

    时序预测 MATLAB实现GM 1 1 灰色时间序列预测 目录 时序预测 MATLAB实现GM 1 1 灰色时间序列预测 预测效果 基本介绍 建模步骤 程序设计 学习总结 参考资料 预测效果 基本介绍 GM 1 1 模型的预测原理是 对某一
  • 基于数据驱动的电动车电池数据分析(一)

    基于数据驱动的电动车电池数据分析 一 欢迎关注笔者的微信公众号 笔者过去一年多的时间都在国内一家头部新能源企业实习 主要参与一些数据分析和平台研发的工作 在工作中积累了一些数据分析的经验 其中新能源领域比较多的是一些化工生产 智能制造方面的
  • 时序预测

    时序预测 MATLAB实现DNN深度神经网络时间序列预测未来 多指标 多图输出 目录 时序预测 MATLAB实现DNN深度神经网络时间序列预测未来 多指标 多图输出 预测效果 基本介绍 模型结构 程序设计 学习总结 预测效果 lt
  • 时序预测

    时序预测 Matlab实现SO CNN BiGRU蛇群算法优化卷积双向门控循环单元时间序列预测 目录 时序预测 Matlab实现SO CNN BiGRU蛇群算法优化卷积双向门控循环单元时间序列预测 预测效果 基本介绍 程序设计 参考资料 预
  • 时序预测

    时序预测 MATLAB实现趋势外推时间序列预测 含移动平均 指数平滑对比 目录 时序预测 MATLAB实现趋势外推时间序列预测 含移动平均 指数平滑对比 基本介绍 程序设计 学习总结 参考资料 基本介绍 MATLAB实现趋势外推时间序列预测
  • 时序预测

    时序预测 MATLAB实现DBN深度置信网络时间序列预测 目录 时序预测 MATLAB实现DBN深度置信网络时间序列预测 预测效果 基本介绍 模型描述 程序设计 参考资料 预测效果 基本介绍 BP神经网络是1968年由Rumelhart和M

随机推荐

  • 如何使用pandas进行excel文件读取(二)

    如何使用pandas进行excel指定行列读取 文章目录 前言 一 pandas是什么 二 loc和iloc方法 1 引入库 2 读入数据 3 读取指定数据 总结 前言 前面说到了如何用pandas对excel文件进行读取 但是那种读取只适
  • 根据计算两点之间的距离

    function getDistance lat1 lng1 lat2 lng2 earthRadius 6367000 lat1 lat1 pi 180 lng1 lng1 pi 180 lat2 lat2 pi 180 lng2 lng
  • 函数重写&运算符重载&类方法和静态方法&对象其他概念

    重要思想 python中万物皆对象 1 函数重写 有了的前提下改写 重写 override v 以权力 否决 推翻 在继承的前提下 如果在子类中重新实现了父类中的函数 才能进行函数重写 自定义函数的重写 1 什么时候需要重写函数 如果一个类
  • 静态Web服务器-返回指定页面数据

    学习目标 能够写出组装指定页面数据的响应报文 1 静态Web服务器的问题 目前的Web服务器 不管用户访问什么页面 返回的都是固定页面的数据 接下来需要根据用户的请求返回指定页面的数据 返回指定页面数据的实现步骤 获取用户请求资源的路径 根
  • Nginx 使用 proxy_cookie_path 解决反向代理 cookie 丢失导致无法登录等问题

    语法 参考nginx官方文档 语法 proxy cookie path off proxy cookie path path replacement 默认 proxy cookie path off 位置 http server locat
  • 学习前端必要的PS基础

    学习前端必要的PS基础 为什么我们要学习PS 学习PS需要知道的基本操作 为什么我们要学习PS 因为我们需要知道设计稿里面的颜色 字体大小 背景颜色 一些元素的宽高距离等等信息 学习PS需要知道的基本操作 点击菜单栏 窗口 信息 字符 图层
  • 新书上市

    本书从各种角度来思考同一个数学问题 一共 16 个问题 并给出不同的解答 这 16 个问题包括 三等分蛋糕 设计时钟的表盘 求出地球的直径 列举违背规律的东西 画出心形图像 列举答案为 1 的问题 三等分角 用大定理证明一些无聊的问题 求出
  • html标签类前端笔记

    HTML5 布局类标签 HTML是具有语义化的语言 针对网页的布局 有一类标签代表各种意义的 布局盒子 所有的布局类标签都主要用来构建页面的内容区域 是双标签类型 是双标签类型 默认显示为块状元素 通用的布局标签 div 语义 无明确的含义
  • ElasticSearch-基本操作

    目录 索引操作 创建索引 查看索引 删除索引 文档操作 创建文档 查看文档 修改文档 修改字段 删除文档 条件删除文档 映射操作 映射数据说明 创建映射 查看映射 索引映射关联 索引操作 对比关系型数据库 创建索引就等同于创建数据库 创建索
  • 在线音乐播放器测试用例

    登录功能测试用例 当用户输入正确的用户名和密码时 方可登录成功 否则 会给出相应得提示 上传音乐测试用例 用户选择上传的音乐后缀是 mp3时 才能上传成功 查询音乐测试用例 查询音乐支持指定名称查询和模糊匹配查询 安全测试 安全测试作为系统
  • Servlet+JSP实现web应用程序

    上一篇博客介绍了Servlet的基础知识 此篇博客通过实际例子来演示如果搭配Servlet和JSP编写web应用程序 如果对Servlet和JSP基础知识不清楚 可查看这里了解基础知识 另外 web Demo应用中还使用了Bootstrap
  • 【RocksDB】Ubuntu18.04下编译rocksdb

    最近的新项目是NewSQL 底层存储引擎是rocksdb 于是在Ubuntu下编译了一下 下面是编译过程 首先安装依赖的包以及组件 安装gcc g 及make sudo apt get install build essential 安装g
  • hive中分组取前N个值的实现

    背景 假设有一个学生各门课的成绩的表单 应用hive取出每科成绩前100名的学生成绩 这个就是典型在分组取Top N的需求 解决思路 对于取出每科成绩前100名的学生成绩 针对学生成绩表 根据学科 成绩做order by排序 然后对排序后的
  • 使用IDEA完成项目的一键部署运行(远程服务器(linux或者windows))

    使用阿里云的Cloud Toolkit工具 Cloud Toolkit配置 1 安装Cloud Toolkit插件 第 1 步 打开 Intellij 的 Settings Windows下 或 Preferences Mac下 窗口 第
  • windows2003服务器复制文件弹出正在复制的进度条,PowerShell拷贝文件并显示进度

    Function 从拷贝文件 并显示进度 Author wangccsy 126 com Date 2013 02 21 yestoday Get Date Get Date AddDays 1 Format yyyy MM dd remo
  • 期货开户交易保持独立客观

    一旦相信了交易就是概率游戏 那么对错 赢亏等概念就不再重要 有了合适的期望 就不会把市场定义解读为痛苦的或威胁的 也会有效地中和交易的情绪风险 保持策略的持续一致性客观地确认优势 这是长期经验总结的结果 但优势不是完全正确 仅仅代表概率较高
  • 鸿蒙笔记2

    常用基础组件 1 组件介绍 组件 Component 是界面搭建与显示的最小单位 HarmonyOS ArkUI声明式开发范式为开发者提供了丰富多样的UI组件 我们可以使用这些组件轻松的编写出更加丰富 漂亮的界面 组件根据功能可以分为以下五
  • MongoDB数据库常用SQL命令

    1 db collection updateMany 修改集合中的多个文档 db getCollection user find pId 3332a512df604a74a72f267cf246 updateMany pId c8018dd
  • ES6 数组的扩展方法

    1 数组的方法 from of from 将伪数组转换成真正的数组 function add console log arguments es5中 将参数转换成数组 let arr slice call arguments console
  • 时间序列--残差分析

    残差 y yhat 一般我们就停止在这里了 但是如果残差表现的有某种形式 代表我们的模型需要进一步改进 如果残差表现的杂乱无章 代表确实没什么别的信息好提取了 现在用最naive的model 上一个时间的值 yhat看看残差表现吧 关于残差