使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

2024-02-12

我已经实施了贝叶斯概率矩阵分解 https://www.cs.toronto.edu/~amnih/papers/bpmf.pdf算法使用pymc3在Python中。我还实现了它的前身，概率矩阵分解（PMF）。看我之前的问题 https://stats.stackexchange.com/questions/146547/pymc3-implementation-of-probabilistic-matrix-factorization-pmf-map-produces-a以供参考此处使用的数据。

我在使用 NUTS 采样器绘制 MCMC 样本时遇到问题。我使用 PMF 中的 MAP 初始化模型参数，并使用高斯随机绘制的超参数在 0 附近进行初始化。但是，我得到了PositiveDefiniteError为采样器设置步骤对象时。我已经验证 PMF 的 MAP 估计是合理的，因此我预计它与超参数的初始化方式有关。 PMF 模型如下：

import pymc3 as pm
import numpy as np
import pandas as pd
import theano
import scipy as sp

data = pd.read_csv('jester-dense-subset-100x20.csv')    
n, m = data.shape
test_size = m / 10
train_size = m - test_size

train = data.copy()
train.ix[:,train_size:] = np.nan  # remove test set data
train[train.isnull()] = train.mean().mean()  # mean value imputation
train = train.values

test = data.copy()
test.ix[:,:train_size] = np.nan  # remove train set data
test = test.values    

# Low precision reflects uncertainty; prevents overfitting
alpha_u = alpha_v = 1/np.var(train)
alpha = np.ones((n,m)) * 2  # fixed precision for likelihood function
dim = 10  # dimensionality

# Specify the model.
with pm.Model() as pmf:
    pmf_U = pm.MvNormal('U', mu=0, tau=alpha_u * np.eye(dim),
                        shape=(n, dim), testval=np.random.randn(n, dim)*.01)
    pmf_V = pm.MvNormal('V', mu=0, tau=alpha_v * np.eye(dim),
                        shape=(m, dim), testval=np.random.randn(m, dim)*.01)
    pmf_R = pm.Normal('R', mu=theano.tensor.dot(pmf_U, pmf_V.T),
                      tau=alpha, observed=train)

    # Find mode of posterior using optimization
    start = pm.find_MAP(fmin=sp.optimize.fmin_powell)

这是 BPMF：

n, m = data.shape
dim = 10  # dimensionality
beta_0 = 1  # scaling factor for lambdas; unclear on its use
alpha = np.ones((n,m)) * 2  # fixed precision for likelihood function

logging.info('building the BPMF model')
std = .05  # how much noise to use for model initialization
with pm.Model() as bpmf:
    # Specify user feature matrix
    lambda_u = pm.Wishart(
        'lambda_u', n=dim, V=np.eye(dim), shape=(dim, dim),
        testval=np.random.randn(dim, dim) * std)
    mu_u = pm.Normal(
        'mu_u', mu=0, tau=beta_0 * lambda_u, shape=dim,
        testval=np.random.randn(dim) * std)
    U = pm.MvNormal(
        'U', mu=mu_u, tau=lambda_u, shape=(n, dim),
        testval=np.random.randn(n, dim) * std)

    # Specify item feature matrix
    lambda_v = pm.Wishart(
        'lambda_v', n=dim, V=np.eye(dim), shape=(dim, dim),
        testval=np.random.randn(dim, dim) * std)
    mu_v = pm.Normal(
        'mu_v', mu=0, tau=beta_0 * lambda_v, shape=dim,
         testval=np.random.randn(dim) * std)
    V = pm.MvNormal(
        'V', mu=mu_v, tau=lambda_v, shape=(m, dim),
        testval=np.random.randn(m, dim) * std)

    # Specify rating likelihood function
    R = pm.Normal(
        'R', mu=theano.tensor.dot(U, V.T), tau=alpha,
        observed=train)

# `start` is the start dictionary obtained from running find_MAP for PMF.
for key in bpmf.test_point:
    if key not in start:
        start[key] = bpmf.test_point[key]

with bpmf:
    step = pm.NUTS(scaling=start)

在最后一行，我收到以下错误：

PositiveDefiniteError: Scaling is not positive definite. Simple check failed. Diagonal contains negatives. Check indexes [   0    2   ...  2206  2207  ]

据我了解，我不能使用find_MAP使用具有超先验（如 BPMF）的模型。这就是为什么我尝试使用 PMF 中的 MAP 值进行初始化，PMF 使用 U 和 V 上参数的点估计，而不是参数化的超先验。

不幸的是，Wishart 发行版无法正常运行。我最近在这里添加了一个警告：https://github.com/pymc-devs/pymc3/commit/642f63973ec9f807fb6e55a0fc4b31bdfa1f261e https://github.com/pymc-devs/pymc3/commit/642f63973ec9f807fb6e55a0fc4b31bdfa1f261e

有关此棘手发行版的更多讨论，请参见此处：https://github.com/pymc-devs/pymc3/issues/538 https://github.com/pymc-devs/pymc3/issues/538

您可以通过修复协方差矩阵来确认这就是源。如果是这样的话，我会尝试使用 JKL 先验分布：https://github.com/pymc-devs/pymc3/blob/master/pymc3/examples/LKJ_correlation.py https://github.com/pymc-devs/pymc3/blob/master/pymc3/examples/LKJ_correlation.py

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError 的相关文章

Bayesian Neural Network Recent Papers-贝叶斯神经网络相关研究文章

Bayesian Neural Network Recent Papers 贝叶斯神经网络相关研究文章 MethodsVariational Inference VI Markov Chain Monte CarloMCMC 43 VIEn
多维时序

多维时序 MATLAB实现基于贝叶斯线性回归 Bayesian Regression 的多变量输入回归预测目录多维时序 MATLAB实现基于贝叶斯线性回归 Bayesian Regression 的多变量输入回归预测预测效果基本介绍
MCMC抽样算法要点总结

MCMC抽样算法目的给定一个已知的概率分布函数 p x 对随机变量 x 进行采样使其满足 p x 概率分布原理一个马尔科夫链对应的概率转移矩阵为 P 如果其具有非周期性且任意两个状态之间都是连通的则不论初始的状态概率分
pymc3：具有多个观察变量的分层模型

我有一个简单的分层模型其中有很多个体我有来自正态分布的小样本这些分布的均值也遵循正态分布 import numpy as np n individuals 200 points per individual 10 means np r
在 pytorch 上使用 MC Dropout 测量不确定性

我正在尝试在 Pytorch 上使用 Mc Dropout 实现贝叶斯 CNN 主要思想是通过在测试时应用 dropout 并运行多次前向传递您可以从各种不同的模型中获得预测我发现了 Mc Dropout 的应用但我真的不明白他们是
PyMC3 Dirichlet 过程多元高斯混合模型

我无法让我的形状适用于狄利克雷过程高斯混合模型我的数据observations有形状 number of samples number of dimensions 每个高斯均值应从各向同性先验中得出每个高斯协方差应为单位矩阵我以为我设
PyMC 错误：hasattr()：属性名称必须是字符串

我在 PyMC 中的模型上运行推理时遇到问题我正在尝试在相当复杂的模型上运行 MCMC 并且收到以下错误 hasattr attribute name must be string 我在这段代码的最后一行得到了这个抱歉这很复杂但我真
MCMCglmm 中 “trait” 的意思

Like in 这个帖子 https stats stackexchange com questions 156683 when and why do i have to use trait for multinomial multilev
如何使用 pymc 制作离散状态马尔可夫模型？

我试图找出如何正确制作离散状态马尔可夫链模型pymc http pymc devs github io pymc index html 举个例子查看nbviewer http nbviewer ipython org github shp
PyStan API 中的变分推理？

我在其中找不到任何提及变分推理的内容PyStan 文档 https pystan readthedocs org en latest api html 尽管它已添加 http arxiv org abs 1506 03431在斯坦本身我是
如何使用pymc参数化概率图模型？

如何使用 pymc 参数化概率图形模型假设我有一个带有两个节点的 PGMX and Y 可以说X gt Y是图表 And X有两个值 0 1 and Y也有两个值 0 1 我想使用 pymc 来学习分布的参数并填充用于运行推理的图形模型
使用朴素贝叶斯分类器对推文进行分类：一些问题

除了其他来源之外我还使用 Stackoverflow 上的各种帖子尝试实现自己的 PHP 分类器将推文分为正面中性和负面类别在编码之前我需要理清流程我的思路和例子如下 p class p words class Bayes t
pymc3中的多元线性回归

我最近开始学习pymc3专门使用后emcee多年来我遇到了一些概念问题我正在练习第七章霍格的数据拟合模型 https arxiv org abs 1008 4686 这涉及到具有任意二维不确定性的直线的 mcmc 拟合我很容易地完成了
PyMC - 方差-协方差矩阵估计

我读了下面的论文 http www3 stat sinica edu tw statistica oldpdf A10n416 pdf http www3 stat sinica edu tw statistica oldpdf A10n4
使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

我已经实施了贝叶斯概率矩阵分解 https www cs toronto edu amnih papers bpmf pdf算法使用pymc3在Python中我还实现了它的前身概率矩阵分解 PMF 看我之前的问题 https stats
朴素贝叶斯：训练的每个特征的类内方差必须为正

当尝试拟合朴素贝叶斯时 training data sample target class K8 train model nb NaiveBayes fit training data target class prediction y n
JAGS 中缺少预测数据模型

我正在尝试在 JAGS 中编写最简单的缺失数据模型一个预测变量有一些缺失的数据点和一个结果变量我知道这个例子不是最有用或最现实的但它可以帮助我在继续处理更复杂的缺失预测数据场景之前解决模型问题模型和数据如下但这是编译错误 Er
使用贝叶斯优化的深度学习结构的超参数优化

我为原始信号分类任务构建了 CLDNN 卷积 LSTM 深度神经网络结构每个训练周期运行约 90 秒超参数似乎很难优化我一直在研究优化超参数的各种方法例如随机或网格搜索并发现了贝叶斯优化虽然我还没有完全理解优化算法但我认为它
如何使用 logit 函数编写 JAGS 二项式模型文件

我正在做一项作业使用 JAGS 对二项式分布进行建模p参数是另一个变量的函数d 这就是我正在尝试做的为两个参数 alpha beta 从后验生成 10000 个样本当 dist 25 进行 100 次尝试时根据后验预测成功次数生成样
choicemodelr：Ops.data.frame 中的错误：“==”仅针对同等大小的数据帧定义

我正在分析联合数据测试数据的数据为真实数据做好准备数据文件具有所需的形式 UnitID Set Alt X 1 X natts y 其中 y 是离散的在每个选择集中我有 3 个选项 alt 1 3 以及一个无选择选项 alt 4

随机推荐

有没有办法使用http将打印任务发送到支持IPP的网络打印机？

我正在开发一个 Android 打印服务应用程序该应用程序应该允许用户执行以下操作浏览手机的内部存储并将所选文件发送到支持 IPP 的打印机进行打印这几天上网查了一下只找到一个解决办法如何在android中使用ipp 互联网打印协
Firefox 网络面板中的彩色条代表什么？

在 Firefox 开发者工具中在 Net 面板下加载的资源的加载时间分为不同的颜色类别这些都是 DNS查询连接中 Blocking Sending Waiting 接收其中每一个代表什么更具体地说它们中的任何一个是否准确地
通过 cython 将 python 字符串传递给 C

我正在尝试编写一个包含一些 c 和一些 python 部分的模块我正在使用 cython 来弥补差距我想在 python 中存储我的很长的字符串常量因为它有更好的语法 const char long string npart of
识别常见的周期波形（方波、正弦波、锯齿波……）

如果没有任何用户交互程序如何识别 ADC 记录中存在什么类型的波形对于这个问题恒定频率的三角波方波正弦波半正弦波或锯齿波电平和频率是任意的并且它们会有噪声少量失真和其他缺陷我也会提出一些天真的想法你可以投票赞成或反
使用 IIFE 时使用 CommonController 实例化其他 AngularJS 控制器

我有一个项目其中许多模型将由几乎相同的控制器代码管理唯一的例外是它们调用不同的服务我现在处理这个问题的方法是使用通用代码实例化一个 Crud Controller 到每个自定义控制器中然后通过更改自定义控制器内的变量来重定向服务调用
使用S3 for Rails“公共/图像”是否很好，并且有一种简单的方法可以做到这一点？

我对 S3 有点陌生我想知道将公共图像放入 S3 存储桶中是否是一个好主意如果是是否有一种简单的方法可以进行移动如果您查看 config environments production rb 您将看到以下代码行已注释掉 conf
如何在 iPhone 的“文件”应用程序中显示我的应用程序文档

我正在尝试在 iPhone 上的文件应用中显示我的应用中的数据查了很多资料都对就是不知道错在哪里 func fileManger nameFolder String let manager FileManager default
为什么 Python 的 `re.split()` 不在零长度匹配上进行分割？

一个特别的怪癖否则相当强大 rePython中的模块是re split 永远不会在零长度匹配上分割字符串 http docs python org library re html re split 例如如果我想沿单词边界分割字符串 gt
导入时出现玩笑错误：意外的令牌导入

我见过类似的问题但仍然找不到可行的解决方案我正在尝试将 Jest 集成到一个工作项目中该项目在数百个地方使用导入导出默认值以下测试确实适用于使用 require 的 Jest const bar require flows foo
谷歌地图覆盖层

我试图在我的谷歌地图上放一个图层来覆盖它不必与谷歌地图进行任何交互它只是一层在另一层之上我现在有什么 div div div div 在地图 div 中我放置了谷歌地图覆盖层的背景与地图 div 一样大但谷歌地图始终将自己放在顶
在 Emacs Lisp 中插入整月的日期

我正在 Emacs Lisp 中进行一些编程但我不完全确定如何处理某些事情我正在尝试插入一整月的日期每个日期都在一个新行上如下列表所示 January 2009 年 1 月 1 日星期一 02 01 09 星期二 03 01 09
如何在 Android Studio 3.0.0 中使用数据绑定和 Kotlin

我刚刚开始使用 Android Studio 3 0 0 但每次尝试构建项目时都会收到此错误 Error Circular dependency between the following tasks app compileDebugKot
Eclipse - 可执行 jar 文件错误

当我使用 eclipse 功能导出可执行 jar 等时当它制作罐子时我收到一条消息 JAR 导出已完成但有警告查看具体信息详细信息无法读取 JAR 文件 classpath 原因打开 zip 文件时出错我不知道这意味着什么以
无法在 pandas 数据框中按时间戳建立索引

我拿了一张 Excel 工作表其中包含日期和一些值并希望将它们转换为 pandas 数据框并仅选择特定日期之间的行由于某种原因我无法按日期索引选择行 Excel 文件中的原始数据 MCU Timestamp 50D 10P1 10
是否可以在 Android 中以编程方式卸载软件包

软件包可以自行卸载吗如果一个包共享相同的 userId 和签名可以卸载另一个包吗 Uri packageURI Uri parse package your packagename here Intent uninstallIntent
在 C/C++ 中， char* arrayName[][] 是指向指针的指针还是指向指针的指针？

我将多维数组理解为指向指针的指针但也许我错了例如我认为 char var char var char var char var or char var char var char var or char var or char var
如何使动态数量的 div 均匀地占据其容器中的所有空间？

我有一个容器其中有动态数量的 div 我希望所有的 div 都适合在一行上而不换行以便每个 div 具有相同的宽度 div 的数量和屏幕的大小都可以改变我希望有一个CSS解决方案 In 这把小提琴 http jsfiddle net
Workflow Foundation 4.5“表达式活动类型‘CSharpValue`1’需要编译才能运行。”

我正在通过入门教程 http msdn microsoft com en us library dd489454 aspx对于 WF45 我遇到了一个看起来其他人也遇到过的问题但与我遇到的方式不同我希望其他人能为我找到解决方案当我完成
如何在 F# 中实现异步而不是并行

坚持使用异步获取许多网页的常见示例我如何异步分拆多个数百个网页请求然后等待所有请求完成然后再进行下一步 Async AsParallel 一次处理几个请求由 CPU 上的核心数量控制抓取网页不是 CPU 密集型操作我对 As
使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

我已经实施了贝叶斯概率矩阵分解 https www cs toronto edu amnih papers bpmf pdf算法使用pymc3在Python中我还实现了它的前身概率矩阵分解 PMF 看我之前的问题 https stats

使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError

使用 PyMC3 进行贝叶斯概率矩阵分解 (BPMF)：使用“NUTS”的 PositiveDefiniteError 的相关文章

随机推荐

热门标签