使用 Pandas OLS 进行预测

2023-12-20

我一直在使用scikits.statsmodels OLS 预测 http://statsmodels.sourceforge.net/generated/scikits.statsmodels.regression.linear_model.OLS.predict.html#scikits.statsmodels.regression.linear_model.OLS.predict函数来预测拟合数据,但现在想转向使用 Pandas。

文档指 OLS http://pandas.pydata.org/pandas-docs/stable/computation.html#standard-ols-regression以及一个名为的函数y_预测 http://pandas.sourceforge.net/stats.plm.html#pandas.stats.plm.MovingPanelOLS.y_predict但我找不到任何有关如何正确使用它的文档。

举例来说:

exogenous = {
    "1998": "4760","1999": "5904","2000": "4504","2001": "9808","2002": "4241","2003": "4086","2004": "4687","2005": "7686","2006": "3740","2007": "3075","2008": "3753","2009": "4679","2010": "5468","2011": "7154","2012": "4292","2013": "4283","2014": "4595","2015": "9194","2016": "4221","2017": "4520"}
endogenous = {
    "1998": "691", "1999": "1580", "2000": "80", "2001": "1450", "2002": "555", "2003": "956", "2004": "877", "2005": "614", "2006": "468", "2007": "191"}

import numpy as np
from pandas import *

ols_test = ols(y=Series(endogenous), x=Series(exogenous))

然而,虽然我可以制作一个合适的:

>>> ols_test.y_fitted
1998     675.268299
1999     841.176837
2000     638.141913
2001    1407.354228
2002     600.000352
2003     577.521485
2004     664.681478
2005    1099.611292
2006     527.342854
2007     430.901264

预测没有产生任何不同:

>>> ols_test.y_predict
1998     675.268299
1999     841.176837
2000     638.141913
2001    1407.354228
2002     600.000352
2003     577.521485
2004     664.681478
2005    1099.611292
2006     527.342854
2007     430.901264

在 scikits.statsmodels 中,我们将执行以下操作:

import scikits.statsmodels.api as sm
...
ols_model = sm.OLS(endogenous, np.column_stack(exogenous))
ols_results = ols_mod.fit()
ols_pred = ols_mod.predict(np.column_stack(exog_prediction_values))

我如何在 Pandas 中执行此操作以将内生数据预测到外生数据的极限?

更新:感谢 Chang,新版本的 Pandas (0.7.3) 现在已将此功能作为标准功能。


您的问题是如何获得回归的预测 y 值?或者是如何使用回归系数来获得外生变量的不同样本集的预测 y 值? pandas y_predict 和 y_fitted 应该为您提供相同的值,并且两者都应该为您提供与 scikits.statsmodels 中的预测方法相同的值。

如果您正在寻找回归系数,请执行 ols_test.beta

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Pandas OLS 进行预测 的相关文章

  • 如何在 Ubuntu 上安装 Python 模块

    我刚刚用Python写了一个函数 然后 我想将其做成模块并安装在我的 Ubuntu 11 04 上 这就是我所做的 创建 setup py 和 function py 文件 使用 Python2 7 setup py sdist 构建分发文
  • 获取单个方程的脚本

    在文本文件中输入 a 2 8 b 3 9 c 4 8 d 5 9 e a b f c d g 0 6 h 1 7 i e g j f h output i j 期望的输出 输出 2 8 3 9 0 6 4 8 5 9 1 7 如果输入文件名
  • NLTK、搭配问题:需要解包的值太多(预期为 2)

    我尝试使用 NLTK 检索搭配 但出现错误 我使用内置的古腾堡语料库 I wrote alice nltk corpus gutenberg fileids 7 al nltk corpus gutenberg words alice al
  • Python 中 genfromtxt() 的可变列数?

    我有一个 txt具有不同长度的行的文件 每一行都是代表一条轨迹的一系列点 由于每条轨迹都有自己的长度 因此各行的长度都不同 也就是说 列数从一行到另一行不同 据我所知 genfromtxt Python 中的模块要求列数相同 gt gt g
  • Python3 查找 2 个列表中有多少个差异才能相等

    假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到 其中有多少项list2应该改变 以便它等于lis
  • 如何使用 openpyxl 对工作簿中的 Excel 工作表/选项卡进行排序

    我需要按字母数字对工作簿中的选项卡 工作表进行排序 我在用openpyxl https openpyxl readthedocs io en default 操作工作表 您可以尝试排序workbook sheets list workboo
  • VSCode pytest 测试发现失败

    Pytest 测试发现失败 用户界面指出 Test discovery error please check the configuration settings for the tests 输出窗口显示 Test Discovery fa
  • 如何为多组精灵创建随机位置?

    我尝试使用 blit 和 draw 方法进行 for 循环 并为 PlayerSprite 和 Treegroup 使用不同的变量 for PlayerSprite in Treegroup surface blit PlayerSprit
  • Python While 循环,and (&) 运算符不起作用

    我正在努力寻找最大公因数 我写了一个糟糕的 运算密集型 算法 它将较低的值减一 使用 检查它是否均匀地划分了分子和分母 如果是 则退出程序 但是 我的 while 循环没有使用 and 运算符 因此一旦分子可整除 它就会停止 即使它不是正确
  • 在 Mac 上安装 Pygame 到 Enthought 构建中

    关于在 Mac 上安装 Pygame 有许多未解答的问题 但我将在这里提出我的具体问题并希望得到答案 我在 Mac 上安装 Pygame 时遇到了难以置信的困难 我使用 Enthought 版本 EPD 7 3 2 32 位 它是我的默认框
  • 使用循环将对象添加到列表(python)

    我正在尝试使用 while 循环将对象添加到列表中 基本上这就是我想做的 class x pass choice raw input pick what you want to do while choice 0 if choice 1 E
  • 使用 python 将文本发送到带有逗号分隔符的列

    如何使用分隔符 在 Excel 中将一列分成两列 并使用 python 命名标题 这是我的代码 import openpyxl w openpyxl load workbook DDdata xlsx active w active a a
  • 在 Windows 上使用 IPython 笔记本时出现 500 服务器错误

    我刚刚在 Windows 7 Professional 64 位上全新安装了 IPython 笔记本 我采取的步骤是 从以下位置安装 Python 3 4 1http python org http python org gt pip in
  • WindowsError:[错误 5] 访问被拒绝

    我一直在尝试终止一个进程 但我的所有选项都给出了 Windows 访问被拒绝错误 我通过以下方式打开进程 一个python脚本 test subprocess Popen sys executable testsc py 我想杀死那个进程
  • 是否可以写一个负的python类型注释

    这可能听起来不合理 但现在我需要否定类型注释 我的意思是这样的 an int Not Iterable a string Iterable 这是因为我为一个函数编写了一个重载 而 mypy 不理解我 我的功能看起来像这样 overload
  • Scrapy 蜘蛛无法工作

    由于到目前为止没有任何效果 我开始了一个新项目 python scrapy ctl py startproject Nu 我完全按照教程操作 创建了文件夹和一个新的蜘蛛 from scrapy contrib spiders import
  • 如何对字符串列表进行排序?

    在 Python 中创建按字母顺序排序的列表的最佳方法是什么 基本回答 mylist b C A mylist sort 这会修改您的原始列表 即就地排序 要获取列表的排序副本而不更改原始列表 请使用sorted http docs pyt
  • 使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

    我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布 有
  • 如何使用 Django (Python) 登录表单?

    我在 Django 中构建了一个登录表单 现在我遇到了路由问题 当我选择登录按钮时 表单不会发送正确的遮阳篷 我认为前端的表单无法从 查看 py 文件 所以它不会发送任何 awnser 并且登录过程无法工作 该表单是一个简单的静态 html
  • 如何识别图形线条

    我有以下格式的路径的 x y 数据 示例仅用于说明 seq p1 p2 0 20 2 3 1 20 2 4 2 20 4 4 3 22 5 5 4 22 5 6 5 23 6 2 6 23 6 3 7 23 6 4 每条路径都有多个点 它们

随机推荐

  • CSS 字体未在 IE9 中加载

    我遇到了 font face 字体无法在 IE9 中加载的问题 IE8 及更低版本运行完美 就像我尝试过的所有其他浏览器一样 这是我的 CSS 字体松鼠语法 font face font family ssmicon src url ssm
  • Log4Net - 我可以在 Config 中拥有自定义部分名称吗

    我需要在配置部分使用除 log4net 之外的部分名称 我知道这是我们通常使用的 section type section 但我需要有一个这样的部分 section type section 我正在开发一个 sitecore 网站 它有自己
  • 使用便携式打印机通过蓝牙与 Delphi XE7 连接

    我正在尝试与世宇LK P32通过蓝牙打印机 为此 我正在使用德尔福XE7 我用 Delphi 做了一些例子 但没有成功 我将配对的打印机放在平板电脑上 即使这样我也无法连续打印 当我打印某些内容时 必须重新启动应用程序 以便我可以再次打印某
  • 父目录中的 htaccess 导致“RewriteEngine not allowed here”

    目前 我正在使用 OSX Server Yosemite 托管一堆 PHP 应用程序 其中一些应用程序在网站文档根目录下有一个用于子域的子目录 自从更新到 OSX Server 的 Yosemite 版本以来 这些子域一直抛出 500 错误
  • Python 中的时间戳服务器 rfc3161 响应令牌生成

    我正在尝试使用twisted在python上实现tsa服务器 目前我正在使用 openssl 二进制文件来生成响应 但这对我来说似乎很难看 这就是为什么我试图弄清楚如何使用 m2crypto 制作响应令牌 预先感谢您的帮助 Maris ED
  • Kotlin 中“external”关键字的用途是什么?

    其目的到底是什么externalKotlin 中的关键字 我猜这是 JNI 之类的native在Java中 但我似乎找不到任何关于此的实际参考或文档 事实上 它相当于Java的native 目前文档中缺少它 但有一个issue https
  • 群体内正常化

    假设我们有以下数据集 import pandas as pd data apple red 155 apple green 102 apple iphone 48 tomato red 175 tomato ketchup 96 tomat
  • Ajax 无法与 jquery 一起使用 Flip!插入

    我正在尝试使用 FLIP 插件并通过 ajax 加载其内容 不过我遇到了问题 它只是不起作用 我可以看到 firebug 中发生的 post 事件 但当我在 FLIP 中填充 content 参数时 似乎没有任何变化 插入 下面是我的代码
  • ffmpeg 和 DVB 字幕缩放

    我尝试对视频中的 DVB 字幕进行硬编码 我设法对其进行硬编码 但它仍然错位 原因是字幕的分辨率为标清 720x576 而视频的分辨率为 1920x1080 因此 当我使用叠加时 字幕错位并位于左角 这是我的命令 ffmpeg canvas
  • Chrome 中的边框半径错误?

    我对 chrome 中的边框半径有疑问 这是我的代码 img border radius 24px border 2px solid c7c7c7 moz border radius 24px webkit border radius 24
  • 在Wpf应用程序中实现快捷键

    我是 wpf 应用程序的新手 我正在开发应用程序 我已经创建了一个菜单现在我想在快捷键 ctrl o ctrl n 等上功能菜单项事件 我该怎么做 请详细说明 你可以通过以下方式做到这一点 在 Xaml 文件中
  • 自定义损失问题:急切执行函数的输入不能是 keras 符号张量,但发现

    我使用tensorflow keras自定义损失 使用额外的输入数据来计算损失 的代码如下 inp Input shape inp seq len feature size w Input shape 1 code ommitted def
  • 使用 PHP Gettext 无需安装语言环境

    我一直在寻找国际化开源项目的选项 Gettext 似乎每个人都推荐 显然需要 安装在您的系统上 才能使用语言环境 看到这个note http www php net manual en book gettext php 91187PHP手册
  • 如何使用 IN 运算符整理 SQL_Latin1_General_CP1_CI_AS

    我想过滤 电子邮件 上的记录 我的查询是这样的 SELECT FROM temp WHERE email NOT IN SELECT email FROM Customer 它给了我以下错误 无法解决排序规则冲突 在 SQL Latin1
  • 如何通过 OLEDB 或 SSIS 中的任何其他源连接 Excel 源?

    除了 Excel 连接管理器 之外 还有其他方法可以将 Excel 连接为 SSIS 中的源吗 我问这个问题是因为我在使用 Excel 连接管理器 连接 Excel 时遇到问题 因为在我的系统中安装了 32 位 Excel 而 Visual
  • 使用 jest customFormat 和默认 printf 测试记录器

    我已经使用winston morgan 和winston daily rotate file express http context 实现了node js 的记录器 因此 每天当任何 http 请求 摩根 或开发人员定义的记录器消息写入文
  • 如何通过您的应用程序运行traceroute命令?

    我想通过我的应用程序运行traceroute 命令 我该怎么做呢 Runtime getRuntime exec traceroute google com 不工作 java io IOException 运行 exec 时出错 命令 tr
  • 在 MATLAB 的搜索路径上找不到 MATLAB 超类

    我有两条路 C controller functions verifyModel m C OGVD prod KMLP controller controllerStatus m 验证模型 m classdef verifyModel me
  • 添加一个类似于本机应用程序的设置页面

    我想创建设置页面 它看起来像本机平台上的设置 例如 Android 上带有 xml 的 PreferenceActivity Fragment 我习惯于通过在 Android 上创建简单的首选项 xml 来设计设置页面 它可以完美地处理基本
  • 使用 Pandas OLS 进行预测

    我一直在使用scikits statsmodels OLS 预测 http statsmodels sourceforge net generated scikits statsmodels regression linear model