绘制 pandas 时间序列数据框线性回归线的置信区间

2024-01-03

我有一个示例时间序列数据框：

df = pd.DataFrame({'year':'1990','1991','1992','1993','1994','1995','1996',
                          '1997','1998','1999','2000'],
                   'count':[96,184,148,154,160,149,124,274,322,301,300]})

我想要一个linear regression与confidence interval乐队在regression line。尽管我设法绘制了一条线性回归线。我发现很难在图中绘制置信区间带。这是我的线性回归图代码片段：

from matplotlib import ticker
from sklearn.linear_model import LinearRegression



X = df.date_ordinal.values.reshape(-1,1)
y = df['count'].values.reshape(-1, 1)

reg = LinearRegression()

reg.fit(X, y)

predictions = reg.predict(X.reshape(-1, 1))

fig, ax = plt.subplots()

plt.scatter(X, y, color ='blue',alpha=0.5)

plt.plot(X, predictions,alpha=0.5, color = 'black',label = r'$N$'+ '= {:.2f}t + {:.2e}\n'.format(reg.coef_[0][0],reg.intercept_[0]))


plt.ylabel('count($N$)');
plt.xlabel(r'Year(t)');
plt.legend()


formatter = ticker.ScalarFormatter(useMathText=True)
formatter.set_scientific(True) 
formatter.set_powerlimits((-1,1)) 
ax.yaxis.set_major_formatter(formatter)


plt.xticks(ticks = df.date_ordinal[::5], labels = df.index.year[::5])

           


plt.grid()  

plt.show()
plt.clf()

这给了我一个很好的时间序列线性回归图。

Problem & Desired output However, I need confidence interval for the regression line too as in:.

对此问题的帮助将不胜感激。

您遇到的问题是您使用的包和函数from sklearn.linear_model import LinearRegression没有提供简单获得置信区间的方法。

如果你想绝对使用sklearn.linear_model.LinearRegression，您将必须深入研究计算置信区间的方法。一种流行的方法是使用引导，就像使用之前的这个答案 https://stackoverflow.com/questions/27164114/show-confidence-limits-and-prediction-limits-in-scatter-plot.

然而，我解释你的问题的方式是，你正在寻找一种在绘图命令内快速执行此操作的方法，类似于你所附的屏幕截图。如果您的目标纯粹是可视化，那么您可以简单地使用seaborn包，这也是您的示例图像的来源。

import seaborn as sns

sns.lmplot(x='year', y='count', data=df, fit_reg=True, ci=95, n_boot=1000)

我突出显示了三个不言自明的感兴趣参数及其默认值fit_reg, ci, and n_boot。参考文档 https://seaborn.pydata.org/generated/seaborn.lmplot.html以获得完整的描述。

在引擎盖下，seaborn使用statsmodels包裹。因此，如果您想要介于纯粹可视化和自己从头开始编写置信区间函数之间的东西，我建议您使用statsmodels。具体看用于计算普通最小二乘 (OLS) 线性回归的置信区间的文档 https://www.statsmodels.org/stable/generated/statsmodels.regression.linear_model.OLSResults.conf_int.html.

以下代码应该为您提供在示例中使用 statsmodels 的起点：

import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt

df = pd.DataFrame({'year':['1990','1991','1992','1993','1994','1995','1996','1997','1998','1999','2000'],
                   'count':[96,184,148,154,160,149,124,274,322,301,300]})
df['year'] = df['year'].astype(float)
X = sm.add_constant(df['year'].values)
ols_model = sm.OLS(df['count'].values, X)
est = ols_model.fit()
out = est.conf_int(alpha=0.05, cols=None)

fig, ax = plt.subplots()
df.plot(x='year',y='count',linestyle='None',marker='s', ax=ax)
y_pred = est.predict(X)
x_pred = df.year.values
ax.plot(x_pred,y_pred)

pred = est.get_prediction(X).summary_frame()
ax.plot(x_pred,pred['mean_ci_lower'],linestyle='--',color='blue')
ax.plot(x_pred,pred['mean_ci_upper'],linestyle='--',color='blue')

# Alternative way to plot
def line(x,b=0,m=1):
    return m*x+b

ax.plot(x_pred,line(x_pred,est.params[0],est.params[1]),color='blue')

这会产生您想要的输出 https://i.stack.imgur.com/sdY3A.png

虽然所有内容的值都可以通过标准 statsmodels 函数访问。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

绘制 pandas 时间序列数据框线性回归线的置信区间的相关文章

如何避免使用 python 处理空的标准输入？

The sys stdin readline 返回之前等待 EOF 或新行所以如果我有控制台输入 readline 等待用户输入相反我想打印帮助并在没有需要处理的情况下退出并显示错误而不是等待用户输入原因我正在寻找一个Pytho
如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
使用 Django 将文件异步上传到 Amazon S3

我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
如何过滤 Pandas GroupBy 对象并获取 GroupBy 对象？

当对 Pandas groupby 操作的结果执行过滤时它返回一个数据帧但假设我想执行进一步的分组计算我必须再次调用 groupby 这似乎有点绕有更惯用的方法吗 EDIT 为了说明我在说什么我们无耻地从 Pandas 文档中窃取
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
如何给URL添加变量？

我正在尝试从网站收集数据我有一个 Excel 文件其中包含该网站的所有不同扩展名 F i www example com example2 我有一个脚本可以成功从网站中提取 HTML 但现在我想为所有扩展自动执行此操作然而当我说 s
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发

随机推荐

HTML2PDF 页面大小

我正在使用 PHP 和 HTML2PDF 库生成 pdf 文件但我想做的是生成一个 pdf 文件其中 pageSize 宽度高度作为 html 内容大小我怎样才能实现这个目标我的html内容是
当启用本机加密 (ASO) 时，为什么 Oracle 中的每个错误 SQL 请求都会出现“校验和失败”？

我们最近将 Oracle 数据库配置为所谓的native encryption Oracle 高级安全选项随着发展的不断进行一些SQL查询有时写得很糟糕因此应该返回一个错误JDBC司机 ojdbc7 v12 1 0 2 相反一个Ch
将锚标记包裹在 li 元素周围

我正在创建导航菜单我想使用 css 以便锚标记包裹在 li 元素周围但锚标记位于 li 元素内部这是html ul li a href Uutiset a li li a href Foorumi a li li a href Kau
在 Swashbuckle 中将字符串字段转换为枚举字段

我们正在使用 Swashbuckle 来记录我们的 WebAPI 项目使用 Owin 并尝试修改 Swashbuckle 生成的 Swagger 文件随着DescribeAllEnumsAsStrings 和如下所示的枚举属性我们得到
当注册 UITableViewCell 以供重用时，该单元格上的哪个 init 方法会被调用？ [复制]

这个问题在这里已经有答案了我正在尝试使用的自定义子类UITableViewCell样式设置为UITableViewCellStyleSubtitle并与它一起使用registerClass forCellReuseIdentifier 但
当我尝试启动我的应用程序时，flutter 守护进程终止

刚升级到 flutter v1 1 8 重新启动Android工作室使用模拟器设备的下拉菜单已消失 AVD 管理器已变灰由于某种原因 Intellij IDEA 今天为我做了同样的事情它建议重新启动IDE 但没有用尽管如此重新启
哪个 ActiveX 控件（*.ocx 文件）处理 WMI？

昨天我问了关于在 OpenEdge Progress 4GL 中启动命令行并捕获结果的问题 https stackoverflow com questions 65504126 how to catch os command results
Xamarin.mac单元测试项目

我正在尝试为 Xamarin Mac 类库项目创建一个单元测试项目 NET NUnit 库项目它不起作用因为我无法添加对我的 Xamarin Mac 类库的引用因此我尝试创建一个新的 Xamarin Mac 类库项目并向其中添加 NUn
我们应该对接口中的默认方法（Java 8）进行单元测试吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我对 Java 8 中引入的接口中的默认方法实现感到有点困惑我想知道我们是否应该专门为接口及其实现的方法编写 JUnit 测试我尝试用谷歌搜
制作多层程序[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在完成一项任务需要将我创建的两个程序合并为一个功能程序我希望的最终结果是一个程序一旦启动就会打开一个登录窗口然后一旦登录用户
asp.net mvc 数据表

如何将数据表传递到 mvc 视图我将如何在视图中迭代它在你的控制器中 public ActionResult Index DataTable dt new DataTable return View dt 在您看来只需将您的模型设为
WPF 单独的错误和警告样式

我们如何以与错误类似的方式向用户显示警告唯一的区别是控制例如TextBox 需要有一个不同的错误模板并且与 Validation HasError 类似需要有一个 Validation HasWarning 换句话说并非所有验证问题
当 Visual Studio 2013 打开 Web 项目时，IISExpress 提供空页面

只要我在 Visual Studio 2013 Ultimate 中打开我的 Asp net MVC 3 项目 IISExpress 就开始提供零字节页面即content length为0 请求体为空关闭VS 页面就可以正确显示了我通
ASP.NET MVC 计算运输总量

如何计算 razor html 中的运费总额第一件商品的运费为 3 99 美元每件附加商品的运费为 0 99 美元 double itemTotal 0 double subTotal 0 int totalQty 0 double d
如何在一个应用程序中同时使用 jQuery Mobile 和 Backbone JS？

我一直很喜欢在 iPad HTML5 项目中使用 Backbone JS 但我很快就遇到了需要 iPad 风格的转换表单元素等的问题环顾四周后似乎 jQuery Mobile 是最成熟的无论如何我们都使用 jQuery 但我很快遇到
如何从 Linux 内核空间向用户空间发送信号以通知输入硬件事件

我的内核模块代码需要向用户态程序发送信号以将其执行转移到注册的信号处理程序事实上我为我的嵌入式板开发了一个 C 程序当我按下按钮输入事件时它可以使 LED 打开和关闭另一方面我刚刚开发了一个简单的 Linux 模块及其基本
在 bash 中 fork 和 exec

如何在 bash 中实现 fork 和 exec 让我们假设脚本为 echo Script starts function to fork sleep 5 echo Hello echo Script ends 基本上我希望该函数被称为新进
我的 Youtube API 配额不会在太平洋标准时间 00:00 后重置

昨天当我收到包含以下消息的 403 响应时我正在编写一个脚本来在我的频道上创建和填充播放列表使用 playlist insert 和 playlistItems insert 该请求无法完成因为您已经超出了您的权限 href you
ASP.NET MVC DropDownListFor 不支持 SelectListItem.Selected

我在用DropDownListFor在视图中呈现下拉列表不知怎的渲染的列表没有选择SelectListItem with Selected set to true 在控制器动作中 var selectList sortedEntries
绘制 pandas 时间序列数据框线性回归线的置信区间

我有一个示例时间序列数据框 df pd DataFrame year 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 count 96 184 148 154 160 149 1

绘制 pandas 时间序列数据框线性回归线的置信区间

绘制 pandas 时间序列数据框线性回归线的置信区间 的相关文章

随机推荐

热门标签

绘制 pandas 时间序列数据框线性回归线的置信区间的相关文章