pymc3中的多元线性回归

2024-01-24

我最近开始学习pymc3专门使用后emcee多年来，我遇到了一些概念问题。

我正在练习第七章霍格的数据拟合模型 https://arxiv.org/abs/1008.4686。这涉及到具有任意二维不确定性的直线的 mcmc 拟合。我很容易地完成了这个emcee, but pymc给我带来了一些问题。

它本质上归结为使用多元高斯似然。

这是我到目前为止所拥有的。

from pymc3 import  *

import numpy as np
import matplotlib.pyplot as plt

size = 200
true_intercept = 1
true_slope = 2

true_x = np.linspace(0, 1, size)
# y = a + b*x
true_regression_line = true_intercept + true_slope * true_x
# add noise

# here the errors are all the same but the real world they are usually not!
std_y, std_x = 0.1, 0.1 
y = true_regression_line + np.random.normal(scale=std_y, size=size)
x = true_x + np.random.normal(scale=std_x, size=size)

y_err = np.ones_like(y) * std_y
x_err = np.ones_like(x) * std_x

data = dict(x=x, y=y)

with Model() as model: # model specifications in PyMC3 are wrapped in a with-statement
    # Define priors
    intercept = Normal('Intercept', 0, sd=20)
    gradient = Normal('gradient', 0, sd=20)


    # Define likelihood
    likelihood = MvNormal('y', mu=intercept + gradient * x,
                        tau=1./(np.stack((y_err, x_err))**2.), observed=y)

    # start the mcmc!
    start = find_MAP() # Find starting value by optimization
    step = NUTS(scaling=start) # Instantiate MCMC sampling algorithm
    trace = sample(2000, step, start=start, progressbar=False) # draw 2000 posterior samples using NUTS sampling

这会引发错误：LinAlgError: Last 2 dimensions of the array must be square

所以我试图通过MvNormalx 和 y 的测量值 (mus) 及其相关的测量不确定度 (y_err and x_err）。但似乎不喜欢2dtau争论。

有任何想法吗？这一定是可能的

Thanks

您可以尝试调整以下模型。是一个“常规”线性回归。但x and y已被高斯分布取代。在这里，我不仅假设输入和输出变量的测量值，而且还假设其误差的可靠估计（例如由测量设备提供）。如果您不相信这些错误值，您可以尝试从数据中估计它们。

with pm.Model() as model:
    intercept = pm.Normal('intercept', 0, sd=20)
    gradient = pm.Normal('gradient', 0, sd=20)
    epsilon = pm.HalfCauchy('epsilon', 5)
    obs_x = pm.Normal('obs_x', mu=x, sd=x_err, shape=len(x))
    obs_y = pm.Normal('obs_y', mu=y, sd=y_err, shape=len(y))

    likelihood = pm.Normal('y', mu=intercept + gradient * obs_x,
                    sd=epsilon, observed=obs_y)

    trace = pm.sample(2000)

如果您根据数据估计误差，则可以合理地假设它们可能是相关的，因此，您可以使用多元高斯，而不是使用两个单独的高斯。在这种情况下，您最终将得到如下所示的模型：

df_data = pd.DataFrame(data)
cov = df_data.cov()

with pm.Model() as model:
    intercept = pm.Normal('intercept', 0, sd=20)
    gradient = pm.Normal('gradient', 0, sd=20)
    epsilon = pm.HalfCauchy('epsilon', 5)

    obs_xy = pm.MvNormal('obs_xy', mu=df_data, tau=pm.matrix_inverse(cov), shape=df_data.shape)

    yl = pm.Normal('yl', mu=intercept + gradient * obs_xy[:,0],
                    sd=epsilon, observed=obs_xy[:,1])

mu, sds, elbo = pm.variational.advi(n=20000)
step =  pm.NUTS(scaling=model.dict_to_array(sds), is_cov=True)
trace = pm.sample(1000, step=step, start=mu)

请注意，在之前的模型中，协方差矩阵是根据数据计算的。如果你打算这样做，那么我认为最好使用第一个模型，但如果你要估计协方差矩阵，那么第二个模型可能是一个明智的方法。

对于第二个模型，我使用 ADVI 来初始化它。 ADVI 是初始化模型的好方法，通常它比 find_MAP() 效果好得多。

您可能还想检查一下存储库 https://github.com/davidwhogg/DataAnalysisRecipes作者：大卫·霍格。还有书统计反思 http://xcelab.net/rm/statistical-rethinking/其中 McElreath 讨论了线性回归的问题，包括输入和输出变量的误差。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pymc3中的多元线性回归的相关文章

在 Django 中定义视图和 url。为什么调用函数时不使用括号？

我已经在经历 Python速成课程目前正在进行 Django Web应用程序项目学习日志阶段有些东西与我已经学到的相矛盾 views py file from django shortcuts import render def i
如何屏蔽 PyTorch 权重参数中的权重？

我正在尝试在 PyTorch 中屏蔽强制为零特定权重值我试图掩盖的权重是这样定义的def init class LSTM MASK nn Module def init self options inp dim super LSTM
如何在 Ubuntu 上安装 Python 模块

我刚刚用Python写了一个函数然后我想将其做成模块并安装在我的 Ubuntu 11 04 上这就是我所做的创建 setup py 和 function py 文件使用 Python2 7 setup py sdist 构建分发文
如何用 python 和 sympy 解决多元不等式？

我对使用 python 和 Sympy 还很陌生并且遇到了使用 sympy 解决多元不等式的问题假设我的文件中有很多函数如下所示 cst sqrt x 2 cst exp sqrt cst x 1 4 log log sqrt cst
Dask DataFrame 的逐行处理

我需要处理一个大文件并更改一些值我想做这样的事情 for index row in dataFrame iterrows foo doSomeStuffWith row lol doOtherStuffWith row dataFrame
获取单个方程的脚本

在文本文件中输入 a 2 8 b 3 9 c 4 8 d 5 9 e a b f c d g 0 6 h 1 7 i e g j f h output i j 期望的输出输出 2 8 3 9 0 6 4 8 5 9 1 7 如果输入文件名
使用 BigQuery 结合 WHERE 子句查找标准差结果的异常值

标准差分析是查找异常值的有效方法有没有办法合并此查询的结果找到远离平均值的第四个标准差的值 SELECT AVG weight pounds STDDEV weight pounds 4 as high FROM publicdata
Python3 查找 2 个列表中有多少个差异才能相等

假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到其中有多少项list2应该改变以便它等于lis
python中函数变量的作用域

假设我们有两个函数 def ftpConnect ftp FTP server ftp login ftp cwd path def getFileList ftpConnect files ftp nlst print files 如果我
反加入熊猫

我有两个表我想附加它们以便仅保留表 A 中的所有数据并且仅在其键唯一时添加表 B 中的数据键值在表 A 和 B 中是唯一的但在某些情况下键将出现在表 A 和 B 中我认为执行此操作的方法将涉及某种过滤联接反联接以获取表 B
在 Mac 上安装 Pygame 到 Enthought 构建中

关于在 Mac 上安装 Pygame 有许多未解答的问题但我将在这里提出我的具体问题并希望得到答案我在 Mac 上安装 Pygame 时遇到了难以置信的困难我使用 Enthought 版本 EPD 7 3 2 32 位它是我的默认框
使用 python 将文本发送到带有逗号分隔符的列

如何使用分隔符在 Excel 中将一列分成两列并使用 python 命名标题这是我的代码 import openpyxl w openpyxl load workbook DDdata xlsx active w active a a
Python int 太大，无法放入 SQLite

我收到错误 OverflowError Python int 太大无法转换为 SQLite INTEGER 来自以下代码块该文件约25GB 因此必须分部分读取 length 6128765 Works on partitions of
urllib2.urlopen() 是否实际获取页面？

当我使用 urllib2 urlopen 时我在考虑它只是为了读取标题还是实际上带回整个网页 IE 是否真的通过 urlopen 调用或 read 调用获取 HTML 页面 handle urllib2 urlopen url html
在 pip.conf 中指定多个可信主机

这是我尝试在我的中设置的 etc pip conf global trusted host pypi org files pythonhosted org 但是它无法正常工作参考 https pip pypa io en stable
在谷歌Colab中使用cv2.imshow()

我正在尝试通过输入视频来对视频进行对象检测 cap cv2 VideoCapture video3 mp4 在处理部分之后我想使用实时对象检测来显示视频 while True ret image np cap read Expand di
Scrapy 蜘蛛无法工作

由于到目前为止没有任何效果我开始了一个新项目 python scrapy ctl py startproject Nu 我完全按照教程操作创建了文件夹和一个新的蜘蛛 from scrapy contrib spiders import
如何对字符串列表进行排序？

在 Python 中创建按字母顺序排序的列表的最佳方法是什么基本回答 mylist b C A mylist sort 这会修改您的原始列表即就地排序要获取列表的排序副本而不更改原始列表请使用sorted http docs pyt
如何使用 Django (Python) 登录表单？

我在 Django 中构建了一个登录表单现在我遇到了路由问题当我选择登录按钮时表单不会发送正确的遮阳篷我认为前端的表单无法从查看 py 文件所以它不会发送任何 awnser 并且登录过程无法工作该表单是一个简单的静态 html
使用 numpy 加速 for 循环

下一个 for 循环如何使用 numpy 获得加速我想这里可以使用一些奇特的索引技巧但我不知道是哪一个这里可以使用 einsum 吗 a 0 for i in range len b a numpy mean C d e f b i

随机推荐

Safari 中的音频标签

我有以下 html
混合 TypeScript 和 Meteor - 跨多个文件的类

对任何不正确的术语表示歉意对于那些不熟悉 Meteor 的人来说它有明确定义的脚本加载顺序 https stackoverflow com questions 10693113 how do i change the order in
仅当使用 data.table's := 连接两个表时才需要第一个实例

我有一个policyData 它是我非常大的数据集数百万行我希望通过映射表数万行向其中添加一些信息 Sample policyData lt data table plan c c b b d v c 8 7 5 6 foo c 4
从数组中删除元素的 JSON Patch 格式是什么？

我有以下 JSON 文档我想从中删除 roles 字段的数组值中的 roleId2 元素 id 12345 firstName SomeFirstName lastName SomeLastName roles roleId1 roleI
材料表类型错误：无法添加属性 tableData，对象不可扩展

我在用着meterial table with React 我正在尝试从来自这样的 api 的数组中分配数据
删除 AVAssetWriter 第一个黑色/空白帧

我有一个avassetwriter使用应用的过滤器录制视频然后通过avqueueplayer 我的问题是在播放时录制的视频在第一帧显示黑屏空白屏幕据我了解这是由于作者在捕获第一个实际视频帧之前捕获了音频为了尝试解决这个问题我
Vue/Vite 原生设置中出现“TypeError：无法获取动态导入的模块”

我们有一个普通的 Vue Vite 设置我正在接收TypeError Failed to fetch dynamically imported module在哨兵日志上尽管我没有足够的数据来确认但这些错误似乎与新的产品部署及时相关它
设计authenticate_user！进行远程操作时中断：对非设备控制器操作的真实请求

我对 Devise 有疑问before action authenticate user 过滤remote true选项我有一个链接标签它发出正常的 PUT 请求messages read of my MessagesControlle
scala 线程安全 HashSet

使 HashSet 线程安全的可能方法是什么看到了一些样本如下所示 var test new mutable HashSet Long with mutable SynchronizedSet Long SynchronizedSet
如何在 UILabel 中使字符等宽

我使用时遇到问题UILabel 我这里有两个标签上图它们具有相同的字体和相同的宽度 textAlignment都是左边的它们都有10个字符但是每个字符都有不同的宽度所以它不能一一对齐我正在尝试动态添加间距但我未能做到这一点那么
无法从 git.gnome.org 克隆

我正在使用 Ubuntu 操作系统我尝试从 git gnome org 克隆几个存储库例如 git clone git git gnome org newcomers tutorial Cloning into newcomers tu
如何检查用户是否属于AD组？

起初我认为下面的代码有效因为如果我将组设置为 IT 它就会正常工作因为我的用户名位于活动目录中的 IT 组中我了解到的是无论我的用户名是否在 IT 组中它总是返回 true 如果我将其更改为我所在的任何其他组它总是返回 fals
是否可以将块定义为类的成员？

我正在尝试在 Objective C 中实现一个非常简单的策略类它允许内联定义策略而不是通过继承定义策略目前我的代码如下所示 interface SSTaskStrategy NSObject NSArray strategy void
如何使用 ggplot2 堆积条上的误差线

I m struggling to put error bars into the correct place on a stacked bar As I read on an earlier post I used ddply in or
如何使用 Node.js 提供图像

我有一个徽标位于public images logo gif 这是我的nodejs代码 http createServer function req res res writeHead 200 Content Type text plain
如何用 Amazon S3 替换 PHP imagecopyresampled？

我正在使用jquery文件上传 http blueimp github io jQuery File Upload 脚本并已成功将主图像上传到 Amazon S3 我现在尝试更换多个图像尺寸以上传到 S3 中的子文件夹或对象在的里面创建
Spring boot - 登录后返回用户对象

我有一个 Spring Boot 应用程序其 WebSecurityConfigurerAdapter 配置如下 http csrf disable exceptionHandling authenticationEntryPoint r
当同时有多个请求时，Redis 不会更新

我有一个 Node js 应用程序我正在尝试使用 Redis 缓存来记录发出的请求量这只是一个概念证明旨在了解 Redis 是否是适合我的工具但我对结果有点失望我想知道 Redis 是否只是性能非常糟糕或者我的代码是否存在缺陷
在 Laravel 之外使用 Laravel Facade

我有一个 Laravel 应用程序我将其用作 Joomla 中构建的更大应用程序的 API 我真的很喜欢使用 Laravel 并决定在 Joomla 应用程序中使用 Eloquent 我通过导入来实现这个工作bootstrap autol
pymc3中的多元线性回归

我最近开始学习pymc3专门使用后emcee多年来我遇到了一些概念问题我正在练习第七章霍格的数据拟合模型 https arxiv org abs 1008 4686 这涉及到具有任意二维不确定性的直线的 mcmc 拟合我很容易地完成了

pymc3中的多元线性回归

pymc3中的多元线性回归 的相关文章

随机推荐

热门标签

pymc3中的多元线性回归的相关文章