机器学习:LDA_数学基础_2:贝叶斯数学:先验分布的选择

2023-10-27

先验信息确定先验分布

  • 主观概率
    1. 对事件似然比
    2. 专家意见
    3. 历史资料

无信息先验分布

  • 贝叶斯假设
    1. 离散均匀分布
    2. 有限区间的均匀分布
    3. 广义分布

共轭先验分布

  • 在已知样本的情况下,为了理论的需要,常常选择参数的分布为共轭先验分布

最大熵先验分布

  • 无信息,意味着不确定性最大,故无信息先验分布应是熵最大所对应的分布

共轭先验下的后验分布

  • 二项分布后验分布式二项分布
  • 多项分布的后验是狄利克雷分布

最大似然估计,最大后验估计,贝叶斯估计

http://blog.163.com/silence_ellen/blog/static/1761042222014413112444364/

  • 贝叶斯公式

p(θ|X)=p(X|θ)p(θ)p(X)

=

最大似然MLE

  • 似然函数取到最大值时的参数值作为估计值,似然函数可以写做
    l(θ)=p(X|θ)=xXp(X=x|θ)
    最大似然估计问题可以写成
    θ^MLE=argmaxθxXlogp(x|θ)
    这是一个关于的函数,求解这个优化问题通常对求导,得到导数为0的极值点。该函数取得最大值是对应的的取值就是我们估计的模型参数。

最大后验概率(MAP)

最大后验估计与最大似然估计相似,不同点在于估计的函数中允许加入一个先验 p(θ) 也就是说此时不是要求似然函数最大,而是要求由贝叶斯公式计算出的整个后验概率最大,即
θ^MAP=argmaxθp(X|θ)p(θ)p(X)
=argmaxθp(X|θ)p(θ)
=argmaxθ{l(θ)+logp(θ)}
=argmaxθ{xXlogp(x|θ)+logp(θ)}

贝叶斯估计

http://blog.csdn.net/vividonly/article/details/50722042

贝叶斯估计和MAP挺像的,都是以最大化后验概率为目的。区别在于:

1)极大似然估计和MAP都是只返回了的预估值,就完事了

2)MAP在计算后验概率的时候,把分母p(X)给忽略了,在进行贝叶斯估计的时候则不能忽略

3)贝叶斯估计要计算整个后验概率的概率分布

p(θ|X)=p(X|θ)p(θ)p(X)
p(X)=p(X|θ)p(θ)dθ

这里有一个技巧,对于一个特定的likehood,如果我们选择了一个先验概率分布,

通过上面两个公式的计算,得出的后验概率和先验概率是同分布的,这时候我们说这个先验分布是共轭先验。

可以举几个例子:

likehood为高斯分布,prior为高斯分布,则posterior也为高斯分布

likehood为伯努利分布(二项式分布),prior为beta分布,则posterior也为beta分布

likehood为多项式分布,prior为Dirichlet分布(beta分布的一个扩展),则posterior也为Dirichlet分布
根据上面的描述,在实践中我们往往会选择共轭先验来简化。在把后验概率推导为和先验概率一样的分布形式的时候,分母p(X)其实可以看做一个常数,往往充当了一个normalize,归一化的作用。
求解的时候,既然我们根据先验分布知道了后验是什么分布,那我们求出后验分布的期望值,即是需要估计的参数的值:
p=E{θ|x}

知道了后验是什么分布,那么求这个分布的期望值应该不是什么难事。

  • 结论
    贝叶斯估计相对于最大后验估计的好处还在于,贝叶斯估计计算了整个后验概率的分布,从而也能求出其他一些比如分布的方差之类的值来供参考,比如计算出来方差太大的,我们可以认为分布不够好,从而把这个当做选择超参数的一个考虑因素。实际上,贝叶斯估计会比MAP把估计的结果往先验结果“拉”的程度还提高了一些,从而使估计结果更靠近先验结果。

beta分布和Dirichlet分布

  • 二项分布的共轭是beta分布
  • 多谢分布的共轭是Dirichlet分布
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习:LDA_数学基础_2:贝叶斯数学:先验分布的选择 的相关文章

  • python绘制折线图

    俗话说 字不如表 表不如图 图表在数据分析中的作用不言而喻 python中有pandas和matplotlib两个库供使用者来绘制图表 下面来绘制 成绩表 xlsx 的折线图 废话不多说 直接上代码 import pandas as pd
  • 入坑c计划 day3 基本框架的介绍&&输入语法

    我giao 兄弟蒙 我来更新了doge 为了弥补我托更 咱今天加班更新一下新手题型 加油 今天 我们来介绍我们上一节提到的 基本框架 首先 我们先和这个朋友再见个面 怕你们忘记他长什么样子 include

随机推荐

  • 用python制作水仙花

    注 input 输入函数的括号中不允许添加任何信息 提示信息 水仙花数 是指一个三位正整数 其各位数字立方的和等于该数本身 例如 153是一个 水仙花数 因为1 5 3等于153 编程实现 给定一个正整数N 判断100到N之间有多少个 水仙
  • Java---正则

    一 正则表达式常用语法 语法 说明 表示转义字符 匹配输入字符串的开始 匹配输入字符串的结尾 0次或多次匹配前面的字符或表达式 1次或多次匹配前面的字符或表达式 0次或1次匹配前面的字符或表达式 n n为非负整数 固定匹配n次 n n为非负
  • 刷脸支付开启巨额补贴活动扶持力度非常大

    人脸识别设备指纹识别系统需要区别带识别的指纹是来自于人的手指还是指纹手套 人脸识别系统所采集到的人脸图像 是来自于真实的人脸还是含有人脸的照片 因此实际的人脸识别系统一般需要增加活体鉴别环节 例如 要求人左右转头 眨眼睛 开开口说句话等 这
  • jenkins发版工具管理

    从零开始部署一台新的服务器 需要以下几个步骤 1 新增服务器凭据 2 新增服务器连接 3 创建item项目并配置 4 测试发版是否完成 1 新增服务器凭据配置 进入链接 http jenkins地址 credentials store sy
  • 线程的阻塞

    相信像我一样的初学者遇到线程阻塞时会感到无助 那我就把自己对于线程阻塞的理解记录下来吧 线程阻塞时的特点 该线程放弃CPU的使用权 暂停运行 只有当阻塞的原因消除后才回到就绪状态进行运行 被其他的线程中断 该线程也会推出阻塞状态 同时抛出I
  • stable diffusion实践操作-提示词插件安装与使用

    本文专门开一节写提示词相关的内容 在看之前 可以同步关注 stable diffusion实践操作 正文 1 提示词插件安装 1 1 安装 1 2 加载 应用更改并重载前端 1 3 界面展示 点击下面红框按钮 可以出现提示词列表 1 4 使
  • Latex中点乘、希腊字母、花写字体等

    Latex中点乘 希腊字母等 Latex中点乘 希腊字母等 Latex中的乘法 希腊字母表 花写字体 Latex中点乘 希腊字母等 使用Latex进行公式编辑时 由于某些符号不经常用到 老是忘记 所以谢一篇文章来总结 记录一下 Latex中
  • Go 语言性能测试 - 入门篇

    Go 语言性能测试 入门篇 Go 语言是非常高效的 在处理并发请求时的性能表现非常出色 在某些考虑性能因素的场景下 我们需要进行性能测试 Go语言提供了用于性能测试的 testing B 框架 本篇就介绍下Go语言的性能测试的基本做法 参考
  • python实现斐波那契数列

    斐波那契数列指的是这样一个数列 0 1 1 2 3 5 8 13 特别指出 第0项是0 第1项是第一个1 从第三项开始 每一项都等于前两项之和 Python 实现斐波那契数列代码如下 实现一 1 def fibonacci 2 num in
  • 服务器的架构有哪些

    服务器的架构有哪些 1 单体架构 软件设计经典的3层模型是表现层 业务逻辑层 数据访问层 典型的单体架构就是将所有的业务场景的表现层 业务逻辑层 数据访问层放在一个工程中最终经过编译 打包 部署在一台服务器上 2 垂直架构 垂直架构是将一个
  • nRF52832 — UART和指纹模块

    XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XX 作 者 文化人 XX 联系方式 XX 版权声明 原创文章 欢迎评论和转载 转载时能告诉我一声就最好了 XX 要说的
  • 基于python的在线考试系统-提供全套Python教学资源和考试系统,全力打造良心服务...

    原标题 提供全套Python教学资源和考试系统 全力打造良心服务 书名 Python程序设计基础 第2版 书号 9787302490562 出版单位 清华大学出版社 适用Python版本 Python 3 4 3 5 3 6 3 7以及更新
  • 计算机基础及ms office应用,计算机基础及MS Office应用知识

    NCRE考试实行百分制计分 但以等第通知考生成绩 等第共分优秀 及格 不及格三等 以下是关于计算机基础及MS Office应用知识 希望大家认真阅读 1 计算机网络与数据通信 人们对计算机网络提出了不同的定义 当前较为准确的定义为 以能够相
  • 空列表不等同于None

    ss if ss is not None print None1 ss None if ss is not None print None2 输出结果 None1
  • 编译libfcitxplatforminputcontextplugin.so解决Qt5在Linux上无法输入中文的问题

    环境 deepin 15 11 Qt 5 12 4 文中涉及到的Qt路径需要根据自己安装的版本自行更改 安装Git 获取fcitx qt5源码 sudo apt install git git clone http github com f
  • 卷积神经网络学习利器CNN Explainer

    CNN解说员 一个交互式可视化系统 旨在帮助非专家了解卷积神经网络 CNN 有关更多信息 请查看我们的手稿 CNN 解释器 通过交互式可视化学习卷积神经网络 Wang Zijie J Robert Turko Omar Shaikh Hae
  • 华为eNSP 三层交换机配置使用vlan及ospf通信

    实验拓扑图如下 提前配置好主机ip地址及端口ip地址 备注 接PC 路由器 服务器的接口一般用access LSW8三层交换机的配置 sysname LSW8 vlan batch 20 30 40 interface Vlanif1 in
  • 对于std::vector的等号重载操作符的理解

    1 对于case 1 赋值重载 比如当前的vector的allocator type是这样的 std allocator traits
  • VS2015+Qt5.9.1+Mysql5.7.25开发环境搭建

    VS2015 Qt5 9 1 Mysql5 7 25开发环境搭建 版本信息 版本 作者 时间 备注 v0 1 ZY 2019 3 2 初稿 目录 文章目录 VS2015 Qt5 9 1 Mysql5 7 25开发环境搭建 版本信息 目录 一
  • 机器学习:LDA_数学基础_2:贝叶斯数学:先验分布的选择

    先验信息确定先验分布 主观概率 对事件似然比 专家意见 历史资料 无信息先验分布 贝叶斯假设 离散均匀分布 有限区间的均匀分布 广义分布 共轭先验分布 在已知样本的情况下 为了理论的需要 常常选择参数的分布为共轭先验分布 最大熵先验分布 无