pymc3：多个观察值

2023-11-26

我有一些观测数据想要估计参数，我认为这将是尝试 PYMC3 的好机会。

我的数据由一系列记录构成。每条记录包含一对与固定的一小时时间段相关的观察结果。一项观察是给定一小时内发生的事件总数。另一个观察结果是该时间段内的成功数量。例如，一个数据点可能指定在给定的 1 小时内，总共有 1000 个事件，而这 1000 个事件中，有 100 个是成功的。在另一个时间段内，总共可能有1000000个事件，其中120000个是成功的。观察结果的方差不是恒定的，取决于事件的总数，我想控制和建模的部分原因是这种效应。

我这样做的第一步是估计潜在的成功率。我准备了下面的代码，旨在通过使用 scipy 生成两组“观察到的”数据来模拟这种情况。但是，它无法正常工作。
我期望它找到的是：

loss_lambda_factor 大约为 0.1
Total_lambda（和total_lambda_mu）大约为120。

相反，模型收敛得非常快，但却得出了意想不到的答案。

Total_lambda 和total_lambda_mu 分别是5e5 附近的尖峰。
loss_lambda_factor 大约为 0。

跟踪图（由于声誉低于 10，我无法发布）相当无趣 - 快速收敛，并且在与输入数据不对应的数字处出现尖锐的峰值。我很好奇我所采取的方法是否存在根本性错误。应如何修改以下代码才能给出正确/预期的结果？

from pymc import Model, Uniform, Normal, Poisson, Metropolis, traceplot 
from pymc import sample 
import scipy.stats

totalRates = scipy.stats.norm(loc=120, scale=20).rvs(size=10000)
totalCounts = scipy.stats.poisson.rvs(mu=totalRates) 
successRate = 0.1*totalRates 
successCounts = scipy.stats.poisson.rvs(mu=successRate) 

with Model() as success_model: 
    total_lambda_tau= Uniform('total_lambda_tau', lower=0, upper=100000)
    total_lambda_mu = Uniform('total_lambda_mu', lower=0, upper=1000000)
    total_lambda = Normal('total_lambda', mu=total_lambda_mu, tau=total_lambda_tau)
    total = Poisson('total', mu=total_lambda, observed=totalCounts) 

    loss_lambda_factor = Uniform('loss_lambda_factor', lower=0, upper=1)
    success_rate = Poisson('success_rate', mu=total_lambda*loss_lambda_factor, observed=successCounts) 

with success_model: 
    step =  Metropolis() 
    success_samples = sample(20000, step) #, start)


plt.figure(figsize=(10, 10)) 
_ = traceplot(success_samples)

除了任何贝叶斯 MCMC 分析的陷阱之外，您的方法没有任何根本性的错误：(1) 不收敛，(2) 先验，(3) 模型。

不收敛：我找到了一个如下所示的跟踪图：

traceplot with burnin included

这不是一件好事，为了更清楚地了解原因，我将更改 Traceplot 代码以仅显示跟踪的后半部分，traceplot(success_samples[10000:]):

traceplot with burnin removed

院长：融合的一个主要挑战是您的先决条件total_lambda_tau，这是贝叶斯建模中的一个典型陷阱。尽管使用先前的方法可能看起来毫无意义Uniform('total_lambda_tau', lower=0, upper=100000)，这样做的效果是说你非常确定total_lambda_tau很大。例如，小于 10 的概率为 0.0001。更改之前的

total_lambda_tau= Uniform('total_lambda_tau', lower=0, upper=100)
total_lambda_mu = Uniform('total_lambda_mu', lower=0, upper=1000)

结果是更有希望的跟踪图：

traceplot with different priors

然而，这仍然不是我在跟踪图中寻找的内容，为了获得更令人满意的结果，我建议使用“顺序扫描 Metropolis”步骤（这是 PyMC2 对于类似模型的默认设置）。您可以按如下方式指定：

step =  pm.CompoundStep([pm.Metropolis([total_lambda_mu]),
                         pm.Metropolis([total_lambda_tau]),
                         pm.Metropolis([total_lambda]),
                         pm.Metropolis([loss_lambda_factor]),
                         ])

这会产生一个似乎可以接受的跟踪图：

traceplot with sequential scan metropolis

该模型：正如 @KaiLondenberg 回应的那样，您对先验采取的方法total_lambda_tau and total_lambda_mu不是标准方法。您描述了差异很大的事件总数（一小时 1,000 个，下一小时 1,000,000 个），但您的模型假定它呈正态分布。在空间流行病学中，我看到的类似数据的方法更像是这样的模型：

import pymc as pm, theano.tensor as T
with Model() as success_model: 
    loss_lambda_rate = pm.Flat('loss_lambda_rate')
    error = Poisson('error', mu=totalCounts*T.exp(loss_lambda_rate), 
            observed=successCounts)

我确信还有其他方法在其他研究社区中也会显得更熟悉。

Here is 收集这些评论的笔记本.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pymc3：多个观察值的相关文章

类属性在功能上依赖于其他类属性

我正在尝试使用静态类属性来定义另一个静态类属性我认为可以通过以下代码来实现 f lambda s s 1 class A foo foo bar f A foo 然而这导致NameError name A is not defined
如何自动替换多个文件的文本内容中的字符？

我有一个文件夹 myfolder包含许多乳胶表我需要替换其中每个字符即替换任何minus sign by an en dash 只是为了确定我们正在替换连字符INSIDE该文件夹中的所有 tex 文件我不关心 tex 文件名手动执
在 Python 中使用 sec 函数的反函数

我正在创建一个程序用于计算从一定高度范围和设定初始速度发射射弹的最佳角度在我需要使用的最终方程中存在一个反 sec 函数它导致了一些麻烦我已经导入了数学并尝试使用 asec 无论如何但是数学似乎无法计算反秒函数我也明白 sec
Python：当前目录是否自动包含在路径中？

Python 3 4 通过阅读其他一些 SO 问题似乎如果moduleName py文件位于当前目录之外如果要导入它必须将其添加到路径中sys path insert 0 path to application app folder
VSCode pytest 测试发现失败

Pytest 测试发现失败用户界面指出 Test discovery error please check the configuration settings for the tests 输出窗口显示 Test Discovery fa
如何为多组精灵创建随机位置？

我尝试使用 blit 和 draw 方法进行 for 循环并为 PlayerSprite 和 Treegroup 使用不同的变量 for PlayerSprite in Treegroup surface blit PlayerSprit
Python 中的这种赋值方式叫什么？ a = b = 真

我知道关于元组拆包 http docs python org tutorial datastructures html tuples and sequences但是当一行中有多个等号时这个赋值被称为什么阿拉a b True 它总是让我有
在wxpython中使用wx.TextCtrl并在按钮单击后显示数据的简单示例 - wx新手

我正在学习 python 并尝试使用 wxpython 进行 UI 开发也没有 UI exp 我已经能够创建一个带有面板按钮和文本输入框的框架我希望能够在文本框中输入文本并让程序在单击按钮后对输入框中的文本执行操作我可以获得一些关
我可以使用 dask 创建 multivariate_normal 矩阵吗？

有点相关这个帖子 https stackoverflow com questions 52337612 random multivariate normal on a dask array 我正在尝试复制multivariate norma
在 Mac 上安装 Pygame 到 Enthought 构建中

关于在 Mac 上安装 Pygame 有许多未解答的问题但我将在这里提出我的具体问题并希望得到答案我在 Mac 上安装 Pygame 时遇到了难以置信的困难我使用 Enthought 版本 EPD 7 3 2 32 位它是我的默认框
字典中列表中仅有的几个索引的总和

如果我有这种类型的字典 a dictionary dog white 3 5 black 6 7 Brown 23 1 cat gray 5 6 brown 4 9 bird blue 3 5 green 1 2 yellow 4 9 mo
如何逐像素绘制正方形（Python，PIL）

在空白画布上我想使用 Pillow 逐像素绘制一个正方形我尝试使用 img putpixel 30 60 155 155 55 绘制一个像素但它没有执行任何操作 from PIL import Image def newImg img
Python 矩阵每一行的总和

lista 1 2 3 4 5 6 7 8 9 print lista def filas lista res for elemento in lista x sum lista elemento res append x print re
是否可以写一个负的python类型注释

这可能听起来不合理但现在我需要否定类型注释我的意思是这样的 an int Not Iterable a string Iterable 这是因为我为一个函数编写了一个重载而 mypy 不理解我我的功能看起来像这样 overload
使用 Doc2vec 后如何解释 Clusters 结果？

我正在使用 doc2vec 将关注者的前 100 条推文转换为矢量表示形式例如 v1 v100 之后我使用向量表示来进行 K 均值聚类 model Doc2Vec documents t size 100 alpha 035 windo
是否可以强制浮点数的指数或有效数匹配另一个浮点数（Python）？

这是我前几天试图解决的一个有趣的问题是否可以强制一个的有效数或指数float与另一个人一样float在Python中出现这个问题是因为我试图重新调整一些数据以便最小值和最大值与另一个数据集匹配然而我重新调整后的数据略有偏差大约小
Pandas 在特定列将数据帧拆分为两个数据帧

I have pandas我组成的 DataFrameconcat 一行由 96 个值组成我想将 DataFrame 从值 72 中分离出来这样一行的前 72 个值存储在 Dataframe1 中接下来的 24 个值存储在 Data
使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布有
如何在SqlAlchemy中执行“左外连接”

我需要执行这个查询 select field11 field12 from Table 1 t1 left outer join Table 2 t2 ON t2 tbl1 id t1 tbl1 id where t2 tbl2 id is
使用 numpy 加速 for 循环

下一个 for 循环如何使用 numpy 获得加速我想这里可以使用一些奇特的索引技巧但我不知道是哪一个这里可以使用 einsum 吗 a 0 for i in range len b a numpy mean C d e f b i

随机推荐

C/C++ 和 Python 之间共享内存

有没有办法共享内存以在 C C 和 python 之间共享 openCV 图像 C 中的 MAT 和 python 中的 numpy 图像不需要多平台我在linux中做我认为在mmap或类似的想法之间共享我有两个正在运行的进程一个
为什么检查 isinstance(something, Mapping) 这么慢？

我最近比较了性能collections Counter to sorted用于比较检查如果某些迭代包含相同数量的相同元素而大迭代的性能Counter一般好于sorted对于短的可迭代对象来说要慢得多 Using line profile
Laravel-Core：为什么 Laravel 多次存储别名？

Laravel 在 Application php 的核心中注册了很多默认实现如下所示 url gt Illuminate Routing UrlGenerator Illuminate Contracts Routing UrlGene
查看编译器生成的默认函数？

有什么方法可以查看由 VC 2008 等编译器为未定义它们的类生成的默认函数例如默认复制构造函数默认赋值运算符吗随着clang编译器你可以通过传递来看到它们 ast dump争论 Clang 仍处于开发阶段但您已经可以将它用于以
Spring JDBC + Postgres SQL + Java 8 - 从/到 LocalDate 的转换

我使用的是 Postgres SQL 9 2 Spring JDBC 版本 4 0 5 和 Java 8 Java 8 引入了新的日期时间 API 我想使用它但遇到了一些困难我已经创建了表 TABLE A CREATE TABLE T
如何在Python中向后循环？ [复制]

这个问题在这里已经有答案了我正在谈论做类似的事情 for i n i gt 1 i do something with i 我可以想出一些方法在 python 中做到这一点创建一个列表range 1 n 1 并反转它使用while a
有没有办法阻止 Erlang 服务器自动启动 epmd？

如果 epmd Erlang 端口映射器守护进程尚未运行 Erlang 服务器将自动生成它我更愿意使用 systemd 作为单独的服务来管理 epmd 这样如果我在一台主机上运行多个 Erlang 服务器例如 RabbitMQ 和
新的 NET 标准 Microsoft.Azure.ServiceBus 中的 NamespaceManager.GetQueue.MessageCount 等效项是什么？

新的 NET 标准 Microsoft Azure ServiceBus 中的 NamespaceManager 相当于什么我使用 WindowsAzure ServiceBus 来执行诸如计算队列中的消息数之类的操作 var names
什么是 numpy.fft.rfft 和 numpy.fft.irfft 及其在 MATLAB 中的等效代码

我正在将 python 代码转换为 MATLAB 其中一个代码使用 numpy rfft 在numpy的文档中它说的是真实输入计算实际输入的一维离散傅里叶变换所以我在MATLAB中使用的是abs 但结果不同 Python代码 ffta
Pandas 数据帧到 Spark 数据帧，处理 NaN 转换为实际 null？

我想将数据帧从 pandas 转换为 Spark 我正在使用spark context createDataFrame 创建数据框的方法我还在中指定架构createDataFrame 方法我想知道的是特殊情况如何处理例如 NaN在 p
php如何将字符串转换为布尔值

我怎样才能将字符串转换为boolean string false test mode mail settype string boolean var dump test mode mail if test mode mail echo te
如何使用 SqlResultSetMapping 将 JPA NativeQuery 的结果集映射到 POJO

我正在尝试使用 SqlResultSetMapping 和 ConstructorResult 将本机查询的结果映射到 POJO 这是我的代码 SqlResultSetMapping name foo classes Constructor
C++ 中的“using”关键字

我正在学习C 我的教授使用了一些类似的代码 using filePath std string using setOfPaths std set
C++ 移动赋值可防止复制交换习惯用法

在 C 中复制交换惯用法通常是这样实现的 C operator C rhs swap this rhs return this 现在如果我想添加一个移动赋值运算符它应该如下所示 C operator C rhs swap this r
使用 AutoMapper 将 IList 映射到 (Iesi.Collections.Generic) ISet

我已经尝试解决这个问题一天了但一无所获所以我希望有人可能已经解决了这个问题我找到的最接近解决方案是如何使用 AutoMapper 简单地将 NHibernate ISet 映射到 IList and 通过 AutoMapper 将 I
jquery animate 用于元素属性而不是样式

ASAIK jquery animate 函数仅接受样式属性但我想为元素的属性设置动画考虑一个 SVG 元素矩形
Django/Python 初学者：执行 python manage.pysyncdb 时出错 - psycopg2 未找到

我使用 Macports 安装了 Pythong2 6 psycopg2 和 pgAdmin3 我的settings py是 DATABASE ENGINE postgresql psycopg2 postgresql psycopg2 p
Rust 借用了指针和生命周期

在我的代码中我有一个相互递归的树结构如下所示 enum Child lt r gt A r Node lt r gt B C struct Node lt r gt children r Child lt r gt 25 impl lt
如何从 GIF 动画中获取长度（时间）

有没有办法知道单循环 GIF 动画需要多长时间才能完成好吧具体细节取决于您使用什么接口来操作这些动画 GIF 我不知道本机 Java AWT Swing 中是否有真正流畅的方式但是基本思想是计算帧速率数量帧数如果您正在手动编写
pymc3：多个观察值

我有一些观测数据想要估计参数我认为这将是尝试 PYMC3 的好机会我的数据由一系列记录构成每条记录包含一对与固定的一小时时间段相关的观察结果一项观察是给定一小时内发生的事件总数另一个观察结果是该时间段内的成功数量例如一个数据点

pymc3：多个观察值

pymc3：多个观察值 的相关文章

随机推荐

热门标签

pymc3：多个观察值的相关文章