最大似然估计MLE与贝叶斯估计

2023-05-16

最大似然估计(Maximum Likehood Estimation MLE)

最大似然估计的核心思想是：找到参数θθ的一个估计值，使得当前样本出现的可能性最大。用当年博主老板的一句话来说就是：谁大像谁！

根据前面的描述，总结一下求最大释然估计值的步骤：
1.写似然函数
2.一般对似然函数取对数，并将对数似然函数整理
3.对数似然函数求导，令导数为0，求得似然方程
4.根据似然方程求解，得到的参数即为所求估计值

4.贝叶斯估计

统计学里有两个大的流派，一个是频率派，一个是贝叶斯派。时至今日，这两派还未就各自的观点达成统一。我们前面提到的最大似然估计就是频率派的典型思路，接下来再看看贝叶斯派的思路，到底跟频率派估计有何不同。
先来看几个相关的小公式：
两个随机变量x,yx,y的联合概率p(x,y)p(x,y)的乘法公式：
p(x,y)=p(x|y)p(y)=p(y|x)p(x)p(x,y)=p(x|y)p(y)=p(y|x)p(x)
如果x,yx,y是独立随机变量，上面的式子可以表示为:
p(x,y)=p(x)p(y)=p(y)p(x)p(x,y)=p(x)p(y)=p(y)p(x)
那么条件概率就可以表示为：
p(x|y)=p(x,y)p(y),p(y|x)=p(x,y)p(x)p(x|y)=p(x,y)p(y),p(y|x)=p(x,y)p(x)
对于一个完备事件组y1,y2,⋯,yny1,y2,⋯,yn，可以使用全概率公式：
p(x)=∑i=1np(yi)p(x|yi),其中∑i=1np(yi)=1p(x)=∑i=1np(yi)p(x|yi),其中∑i=1np(yi)=1

由以上这些，可以得出贝叶斯公式：
p(yi|x)=p(x,yi)p(x)=p(yi)p(x|yi)p(x)p(yi|x)=p(x,yi)p(x)=p(yi)p(x|yi)p(x)

其中，p(yi|x)p(yi|x)是后验概率。p(x|yi)p(x|yi)是条件概率，或者说似然概率，这个概率一般都可以通过历史数据统计得出。而p(yi)p(yi)是先验概率，一般也是根据历史数据统计得出或者认为给定的，贝叶斯里的先验概率，就是指p(yi)p(yi)。对于p(x)p(x)，我们前面提到可以用全概率公式计算得出，但是在贝叶斯公式里面我们一般不care这个概率，因为我们往往只需要求出最大后验概率而不需要求出最大后验的具体值。

5.MLE与Bayes的区别

细心的同学通过观察MLE与Bayes的公式，发现Bayes公式比MLE公式里就多了一项p(yi)p(yi)(咱们先抛开p(x)p(x)不考虑)，而条件概率或者说似然概率的表达式是一致的。从数学表达式的角度来说，两者最大的区别就在这里：贝叶斯估计引入了先验概率，通过先验概率与似然概率来求解后验概率。而最大似然估计是直接通过最大化似然概率来求解得出的。

换句话说，最大似然估计没有考虑模型本身的概率，或者说认为模型出现的概率都相等。而贝叶斯估计将模型出现的概率用先验概率的方式在计算过程中有所体现。

1、最大似然估计MLE

首先回顾一下贝叶斯公式

$p(\theta|X) = \frac{p(X|\theta) \cdot p(\theta)}{p(X)}$

这个公式也称为逆概率公式，可以将后验概率转化为基于似然函数和先验概率的计算表达式，即

$posterior = \frac{likelihood \cdot prior}{evidence}$

最大似然估计就是要用似然函数取到最大值时的参数值作为估计值，似然函数可以写做

$L(\theta | X) = p(X | \theta) = \prod_{x \in X}{p(X = x | \theta)}$

由于有连乘运算，通常对似然函数取对数计算简便，即对数似然函数。最大似然估计问题可以写成

$\hat{\theta}_{ML} = argmax_\theta L(\theta | X) = argmax_\theta \sum_{x \in X}\log p(x|\theta)$

这是一个关于 $\theta$ 的函数，求解这个优化问题通常对 $\theta$ 求导，得到导数为0的极值点。该函数取得最大值是对应的 $\theta$ 的取值就是我们估计的模型参数。

以扔硬币的伯努利实验为例子，N次实验的结果服从二项分布，参数为P，即每次实验事件发生的概率，不妨设为是得到正面的概率。为了估计P，采用最大似然估计，似然函数可以写作

$\begin{aligned} L &= \log\prod_{i=1}^Np(C=c_i|p)=\sum_{i=1}^N\log p(C=c_i|p) \\ &= n^{(1)}\log p(C = 1|p) + n^{(0)}\log p(C = 0|p)\\ &= n^{(1)}\log p + n^{(0)}\log (1-p) \end{aligned}$

其中 $n^i$ 表示实验结果为i的次数。下面求似然函数的极值点，有

$\frac{\partial{L}} {\partial{p}} = \frac{n^{(1)}}{p} - \frac{n^{(0)}}{1-p} = 0$

得到参数p的最大似然估计值为

$\hat{p}_{ML} = \frac{n^{(1)}}{n^{(1)} + n^{(0)}} = \frac{n^{(1)}}{N}$

可以看出二项分布中每次事件发的概率p就等于做N次独立重复随机试验中事件发生的概率。

如果我们做20次实验，出现正面12次，反面8次

那么根据最大似然估计得到参数值p为12/20 = 0.6。

2、最大后验估计MAP

最大后验估计与最大似然估计相似，不同点在于估计 $\theta$ 的函数中允许加入一个先验 $p(\theta)$ ，也就是说此时不是要求似然函数最大，而是要求由贝叶斯公式计算出的整个后验概率最大，即

$\begin{aligned} \hat{\theta}_{MAP} &= argmax_\theta \frac{p(X | \theta) p(\theta)}{p(X)}\\ &= argmax_\theta p(X | \theta)p(\theta) \\ &= argmax_\theta \{L(\theta|X) + \log p(\theta)\}\\ &= argmax_\theta \{\sum_{x \in X} \log p(x | \theta) + \log p(\theta)\} \end{aligned}$

注意这里P（X）与参数 $\theta$ 无关，因此等价于要使分子最大。与最大似然估计相比，现在需要多加上一个先验分布概率的对数。在实际应用中，这个先验可以用来描述人们已经知道或者接受的普遍规律。例如在扔硬币的试验中，每次抛出正面发生的概率应该服从一个概率分布，这个概率在0.5处取得最大值，这个分布就是先验分布。先验分布的参数我们称为超参数(hyperparameter)即

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

最大似然估计MLE与贝叶斯估计的相关文章

串口是怎样传输数据的

概述通过逻辑分析仪捕捉串口传输的数据来了解串口传输数据的实质串行接口简称为串口 xff0c 串行接口 xff08 Serial Interface xff09 是指数据一位一位地顺序传送实现双向通信就需要一对传输线 xff0c 即TX
精准时空：让人工智能更智能

如今科技界产业界最热门的关键词是什么 xff1f 各地方政府给出了明确的答案人工智能 8月的最后一周 xff0c 重庆上海两大直辖市 xff0c 争先恐后地举办了以智能为主题的大会精准时空能力 xff0c 作为机器智能的基础数据 x
关于FindCM厘米级定位，这6个问题的答案你需要知道

面对越来越复杂的应用场景 xff0c 单一的FindCM xff08 千寻知寸 xff09 产品 xff0c 已经无法满足不同行业客户的差异化需求近日 xff0c 千寻位置完成FindCM产品分级 xff0c 推出了面向不同行业和应用场景
千寻位置如何满足自动驾驶“刚需”

自动驾驶 xff0c 本质是汽车产业的升级自动驾驶技术在5G 人工智能和汽车行业的飞速发展下 xff0c 成为业界焦点目前 xff0c 通用一汽广汽北汽吉利长安等国内外主流车企都在进行自动驾驶技术研发 xff0c 而他们正在使
自动驾驶汽车为什么需要高精度定位？干货都在这里

2019年5月7日 xff0c 曾作为主PM驱动凯迪拉克 Jeep全系福特全系车型Sync3导航产品研发 xff0c 现任千寻位置车端高精度定位解决方案经理的宋子未 xff0c 讲授了主题为自动驾驶汽车为什么需要高精度定位 xff1f
GNSS增强定位技术发展与星地融合应用

引言 xff1a 你能想象吗 xff1f 除了手机和汽车 xff0c 现在连安全帽道路锥筒 xff0c 甚至跑鞋都需要定位随着移动物联网的快速发展 xff0c 国民经济各个领域都对更高精度的定位能力产生迫切需求同时 xff0c 市场也
基于Android系统的高精度定位SDK方案

最新数据显示 xff0c 全球平均每3人就拥有一台Android xff08 安卓 xff09 系统设备 xff0c 其总数已经超过25亿台丰富多样的Android设备在改变人们的生活同时 xff0c 也被赋予更多期望 xff0c 是否能
Ubuntu 修改 apt 源为阿里云源

文章目录软件源 Software Source使用说明图形界面 xff08 新手推荐 xff09 手动修改配置文件相关链接软件源 Software Source 软件源是指用于存储各种 Linux 应用程序的存储库 xff0c 包括自
(已解决）rplidar_ros 报错：Operation Time Out

按照wiki装rplidar ros的时候 xff1a https github com robopeak rplidar ros wiki 运行 xff1a roslaunch rplidar ros view rplidar launc
CNN学习（四）----SiameseFC代码运行Matlab2018a+vs2015+cuda9.0

由于siameseFC运行需要调用GPU xff0c 即需要安装CUDA和visual studio xff0c CUDA安装可以参考的我的上一篇博客若是要运行tensorflow版本 xff0c 可以参考这篇博客一失败经验先介绍一
目标跟踪之ECO代码运行及原理简介

论文地址 xff1a https arxiv org pdf 1611 09224 pdf 代码地址 xff1a https github com martin danelljan ECO ECO xff08 Efficient Convo
UAV123数据集下载、简介及配置

UAV123主要由91个无人机视频组成 xff0c 其中有数个视频序列较长 xff0c 拆分成三四个较短的片段 xff0c 使用多次 xff0c 所以有123个groundtruth xff0c 其中包含20个长视频即UAV20L xff0

随机推荐

UAVDT：The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking数据集下载

无人机数据集对于目标跟踪而言是一大挑战 xff0c 近年来 xff0c 正对无人机的数据集也越来越多 xff0c UAVDT是ICCV2018提出的一个数据集 xff0c 共包含80000帧图片 xff0c 不仅可以用于目标跟踪 xff0c
Linux编译opencv4.4.0报错“/usr/bin/ld: cannot find -lopencv_shape”

opencv4 4 0下载地址 xff1a https sourceforge net projects opencvlibrary files 问题描述安装完opencv4 4 0后编译C 43 43 代码显示找不到lib库文件 usr
利用红外图像数据集FLIR Thermal Starter训练yolov5目标检测算法

Yolov5代码 xff1a https github com ultralytics yolov5 数据集 xff1a https www flir com oem adas adas dataset form 运行环境 xff1a Ub
目标跟踪之ICCV2021 Learning Spatio-Temporal Transformer for Visual Tracking代码复现

代码地址 xff1a https github com researchmm Stark 论文地址 xff1a https arxiv org abs 2103 17154 一配置环境 conda create n stark span
目标跟踪之LTMU：High-Performance Long-Term Tracking with Meta-Updater环境配置及代码运行

代码地址 xff1a https github com Daikenan LTMU 论文地址 xff1a High Performance Long Term Tracking with Meta Updater LTMU是CVPR2020
英伟达NVIDIA Jetson系列产品刷机（SDK Manager）

英伟达的TX NX AGX可以说是近几年边缘计算中非常牛的产品了可Linux系统经常会出现安装某软件后系统环境崩掉的情况 xff0c 接着系统崩掉的机会 xff0c 记录一下Jetson AGX Xavier的刷机过程准备 xff1a
seL4的编译和运行(OdroidXU3)

seL4支持平台 seL4所在的git如下 xff1a https github com seL4 seL4 git 不过我们编译和运行seL4一般不只是用这个git xff0c 而是借助seL4test xff08 seL4的测试框架 x
目标跟踪之Pysot系列代码训练（SiamRPN\SiamRPN++）

代码地址 xff1a https github com STVIR pysot 环境配置参考博客 xff1a Siam系列跟踪算法工具包PySOT配置一数据集准备 Pysot系列跟踪器训练的时候 xff0c 首先将数据集进行裁剪 xff
基于Paddle实现实例分割

百度的Paddle这几年发展十分迅速 xff0c 而且文档十分齐全 xff0c 涉及到机器视觉的多个应用领域 xff0c 感觉还是非常牛的 xff0c 各种backbone xff0c 损失函数数据增强手段以及NMS等 xff0c 整体感
机器学习笔记：时间序列分解 STL

1 前言 STL Seasonal and Trend decomposition using Loess 是以LOSS 作为平滑方式的时间序列分解 LOSS可以参考机器学习笔记 xff1a 局部加权回归 LOESS UQI LIUWJ的博
C++11　auto遍历

C 43 43 11这次的更新带来了令很多C 43 43 程序员期待已久的for range循环 xff0c 每次看到javascript xff0c lua里的for range xff0c 心想要是C 43 43 能有多好 xff0c
C++　文件的读写(fin && fout)

如何让键盘输入字符保存在 txt文件中如何让我们自己在键盘上输入的字符不仅仅在屏幕上显示 xff0c 而且还能保存在特定路径的文件中 xff0c 这让简单枯燥的控制台命令程序变得略有趣首先 xff0c 先看看cin和cout对象 xff
基本矩阵、本质矩阵和单应矩阵

两幅视图存在两个关系 xff1a 第一种 xff0c 通过对极几何一幅图像上的点可以确定另外一幅图像上的一条直线 xff1b 另外一种 xff0c 通过上一种映射 xff0c 一幅图像上的点可以确定另外一幅图像上的一个点 xff0c 这个点
矩阵零空间

矩阵A的零空间就Ax 61 0的解的集合零空间的求法 xff1a 对矩阵A进行消元求得主变量和自由变量 xff1b 给自由变量赋值得到特解 xff1b 对特解进行线性组合得到零空间假设矩阵如下 xff1a 对矩阵A进行高斯消元得到上三角
VIO学习总结

VIO xff08 visual inertial odometry xff09 即视觉惯性里程计 xff0c 有时也叫视觉惯性系统 xff08 VINS xff0c visual inertial system xff09 xff0c 是
单应性（Homography）变换

我们已经得到了像素坐标系和世界坐标系下的坐标映射关系 xff1a 其中 xff0c u v表示像素坐标系中的坐标 xff0c s表示尺度因子 xff0c fx fy u0 v0 xff08 由于制造误差产生的两个坐标轴偏斜参数 xff0c
senmantic slam mapping

basicStructure hpp common h 定义一些常用的结构体以及各种可能用到的头文件 xff0c 放在一起方便include 相机内参模型增加了畸变参数 xff0c common headers h各种可能用到的头文件
Ubuntu 20.04 VNC 安装与设置

原链接 VNC是一个远程桌面协议按照本文的说明进行操作可以实现用VNC对Ubuntu 20 04进行远程控制一般的VNC安装方式在主机没有插显示器的时候是无法使用的下面的操作可以在主机有显示器和没有显示器时都能够正常工作首先安装x1
opencv中类型转换问题

记录一下最近困惑我的问题方便以后查阅在学习立体匹配算法中BM算法时 xff0c 出现在了关于类型转换的问题 xff1a disp convertTo disp8u CV 8U 255 numberOfDisparities 16 不知道
最大似然估计MLE与贝叶斯估计

最大似然估计 Maximum Likehood Estimation MLE 最大似然估计的核心思想是 xff1a 找到参数的一个估计值 xff0c 使得当前样本出现的可能性最大用当年博主老板的一句话来说就是 xff1a 谁大像谁 xf

最大似然估计MLE与贝叶斯估计

最大似然估计MLE与贝叶斯估计 的相关文章

随机推荐

热门标签

最大似然估计MLE与贝叶斯估计的相关文章