贝叶斯分类器原理——学习笔记

2023-05-16

贝叶斯分类器原理

  • 简介
    • 一、逆概率推理与贝叶斯公式
      • 1、确定性推理与概率推理
      • 2、贝叶斯公式
    • 二、贝叶斯分类的原理
    • 三、概率估计
      • 1、先验概率的估计
      • 2、类条件概率的估计
    • 四、贝叶斯分类的错误率
    • 五、常用贝叶斯分类器
      • 1、最小错误率贝叶斯分类器
      • 2、最小风险贝叶斯分类器
      • 3、朴素贝叶斯分类器
    • 结语
    • 参考

简介

贝叶斯分类器作为模式识别经典算法之一,有着极其重要的地位和用途,对贝叶斯定理进行近似求解。

一、逆概率推理与贝叶斯公式

1、确定性推理与概率推理

在这里插入图片描述

2、贝叶斯公式

贝叶斯公式就是解决逆概率推理问题。从已知结果出发,判断某类情况是导致结果发生的原因的概率。贝叶斯公式:
在这里插入图片描述
表示结果A在条件Bi下分别产生的概率之和。

二、贝叶斯分类的原理

解决不确定统计分类的问题。已知每个类别的样本取得不同特征向量的概率,实现依据某个待识别样本的特征向量计算该样本属于每一个类别的概率。此时对应关系如下:

贝叶斯分类贝叶斯公式
每类样本的整体出现概率先验概率P(wi)
每个类中样本取得某个具体特征向量的概率类条件概率P(x,wi)
要计算的样本取得某一个具体特征向量时属于每一类的概率后验概率P(wi,x)

在这里插入图片描述
分类决策规则:根据计算得到的后验概率对样本进行分类

如上所述,贝叶斯分类是从结果出发找原因,因此在训练过程中先验概率和类条件概率必须已知
当先验概率未知时,可以令其概率相等,或按某一类属性在样本集中的出现频率作为先验概率,再用新获得的信息对先验概率进行修正;
当类条件概率未知时,往往需要从数据统计中估计。
因为贝叶斯分类是概率分类,因此分类决策存在错误率

三、概率估计

1、先验概率的估计

将先验概率看作常量
(1)若样本为随机抽样的样本,可以使用某一类属性在样本集中的出现频率作为先验概率:P(wi)=ni/N
(2)将所有类别看作均匀分布:P(wi)=1/c
将先验概率看作概率分布:P(wi)=∫ P(wi|x)
任意设定先验概率初值,在已知类条件概率的情况下,计算训练集中属于某一类的所有样本的后验概率,再将其数学期望用于更新后验概率。

2、类条件概率的估计

(1)参数估计:假定具有某种特定的分布形式,如正态分布、二项分布…再用已经具有类型标签的训练集对概率分布的参数进行估计
(2)非参数估计:在不知道或布加迪分布形式的基础上,直接用样本集中的信息,估计样本的概率分布情况。这种情况下得到的概率通常是一个数值模型
在类条件概率的估计中,通常使用参数估计,概率模型的训练过程就是参数估计过程。频率主义学派认为参数虽然未知,但是客观性存在的固定值,因此可以通过最优化似然函数等来确定参数值。贝叶斯学派认为参数是未观察到的随机变量,其本身也可有分部,因此假定参数服从一个先验分布,然后基于观测到的数据来计算参数的后验分布。
最常用的方法就是频率主义学派的极大似然估计法和贝叶斯学派的贝叶斯估计
(1)极大似然估计:通常是对数似然估计。(略)
(2)贝叶斯估计:
①待估计参数是Θi的先验概率分布为P(Θi);
②该类样本集xi的联合概率密度分布P(xi|Θi)是Θi的函数;
③求取Θi的后验概率P(Θi|xi);
④Θi的估计值为后验概率下的数学期望Θi=∫ Θi P(Θi|xi)
不同的类条件概率估计方法产生不同的类条件概率,导致不同的判别函数,也就产生不同的分类决策边界。

四、贝叶斯分类的错误率

分类器的错误率:分类错误概率的数学期望
例:最小错误分类器的错误率:即将样本划分到后验概率大的那一类,但样本本身不属于那一类的概率。(最小错误贝叶斯分类器见后文,常见贝叶斯分类器)
贝叶斯分类的错误率(两类)等于属于第一类w1的样本错误分类到w2的错误率加上属于第二类w2的样本错误分类到w1的概率。
在这里插入图片描述

五、常用贝叶斯分类器

1、最小错误率贝叶斯分类器

分类决策规则:将样本划分到后验概率大的一类中去。

若P(wi|x)=maxP(wj|x),则x∈wi
有最大后验概率:P(error|x)=ΣP(wj|x)-maxP(wj|x),因此最大后验概率等价于最小错误率
=>若P(x|wi)P(wi)=max[P(x|wj)P(wj)] ,则x∈wi
分类决策边界为使错误率最小的点

注意的是,最小错误率贝叶斯分类器是线性分类器,但分类决策边界不一定是线性的,分界点为后验概率相同的点。
在这里插入图片描述

2、最小风险贝叶斯分类器

决策:将待识别的样本x归类到wi中
损失λij:把真实属于wj的样本x,错误分类到wi类的损失
条件风险R(αi|x) = E[λij] = ∑λijP(wj|x)
分类决策规则:若 R(αk|x) = min R(αi|x),则x∈wk

3、朴素贝叶斯分类器

朴素贝叶斯分类器解决的是类条件概率未知的情况。
类条件概率的估计可以根据某类样本在各个维度上的特征值来估计概率分布情况,该概率分布为各个维度上的联合概率分布
朴素贝叶斯分类器就是假设各个维度完全独立地对分类结果产生影响
此时的一维概率密度估计:P(x|wi)=∏P(xk|wi)

然而,实际工程实践中,样本特征往往无法满足独立条件,一般可以采用特征分组的方法,适当考虑一部分属性间的相互依赖信息,每组包含少量相关特征,保证各组之间相互独立,从而不需要进行完全联合概率计算,又不至于忽略掉比较强的属性依赖。基于这种思想,产生了另一种分类器,即半朴素贝叶斯分类器

结语

贝叶斯分类器在模式识别领域有着极其广泛的应用,特别是在信息检索领域。
朴素贝叶斯分类器假定所有属性之间完全独立,虽然在实际应用中,假设很难成立,但应用上,朴素贝叶斯分类器又通常具有很好的性能。

参考

学习时参考北京理工大学《人工智能之模式识别》公开课
书本参考:《机器学习》周志华

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

贝叶斯分类器原理——学习笔记 的相关文章

  • QGC地面站参数调节

    校准 xff1a 1 选择机架 xff1a 一般用DJI Flame Wheel F450机架 xff0c 选择之后点击 应用并重启 xff1b 2 传感器校准 xff1a 无人机会重新连接地面站 xff0c 依次校准 磁罗盘 陀螺仪 xf
  • PX4初级教程

    链接 xff1a https pan baidu com s 1VIQcOQt I5 evMx1jnV0ZQ 提取码 xff1a 8niq
  • Qt Creator编写无人机地面站系统

    用户登录界面 将用户注册的账户信息如实填写 xff0c 然后输入验证码 xff0c 点击 xff02 登录 xff02 即可进入无人机地面站管理系统 xff0e 地面站界面
  • Mavlink自定义协议

    参照本人博客 xff1a 博客直达 浏览密码 xff1a N414 这里不做描述 xff0c 详细过程请移步本人博客
  • 狼群算法资源总结

    狼群算法介绍 xff1a 狼群算法的优化 狼群算法三维路径规划 xff1a 狼群算法三维路径规划Matlab
  • html+css+php+mysql实现注册+登录+修改密码(附完整代码)

    注 xff1a 转载及使用源代码请注明来源 xff01 如疑问可私信 xff01 目的 xff1a 在利用QT软件进行登录软件开发时 xff0c 就想要实现点击按钮跳转到指定网页进行注册以及修改密码等操作 xff0c 就像QQ客户端那样可以
  • Qt嵌入外部EXE程序,并显示在主界面中!

    一 获取程序句柄以及类 打开Visual Studio 进行查询 二 QT调用程序 H文件 span class token macro property span class token directive keyword ifndef
  • Cmake软件编译opencv报错,CMake Warning at cmake/OpenCVDownload.cmake:193 (message): FFMPEG: Download...

    当执行如下操作时 xff1a 出现下面报错 xff0c 在链接ipaddress com查询raw githubusercontent com地址 xff0c 然后将ip添加至C Windows System32 drivers etc h
  • MOT:MOTchallenge任务评价方法

    GT介绍 span class token number 1 1 span 912 484 97 109 0 7 1 span class token number 2 1 span 912 484 97 109 0 7 1 span cl
  • /bin/sh^M: 坏的解释器: 没有那个文件或目录

    在windows上面notepad 43 43 写的shell文件 xff0c 复制带Linux上面提示错误 bin sh M 坏的解释器 没有那个文件或目录 在命令行执行下面语句 xff1a span class token commen
  • 相机内参矩阵、外参矩阵、畸变矩阵

    1 相机针孔模型 图中 xff0c X坐标系是针孔所在坐标系 xff0c Y坐标系为成像平面坐标系 xff0c P为空间一点 xff0c 小孔成像使得P点在图像平面上呈现了一个倒立的像 齐次形式 xff1a 在此 xff0c 我们先暂时舍弃
  • STM32—驱动GY85-IMU模块

    GY85是一个惯性测量模块 xff0c 内部集成了三轴加速度计 三轴陀螺仪 电子罗盘 气压传感器等芯片 xff0c 用于测量和报告设备速度 方向 重力 xff0c 模块可以将加速度计 陀螺仪 电子罗盘等传感器的数据进行综合 xff0c 在上
  • MPU6050原始数据分析——学习笔记

    MPU6050原始数据分析 学习笔记 个人学习笔记MPU6050简介 原始数据分析加速度计陀螺仪代码 个人学习笔记 用于记录自己学习的成果 xff0c 并且分享给大家一起看看 希望对看到这篇的朋友有所帮助 MPU6050简介 MPU 605
  • DAY15 异常捕获

    DAY15 异常捕获 一 文件操作细节问题 1 1 参数encoding open file mode 61 r encoding 61 None encoding 设置文本文件的编码或者解码方法 xff08 将数据写入到文件之前会自动编码
  • x86-从实模式到保护模式(总结)

    总结主要针对最后一章的内容 xff0c 最后一张的程序使用的是平坦模式 代码段和数据段都是从0x00000000到0xffffffff xff0c 能够访问4GB的地址空间 使用平坦模式的好处 xff1a 不用频繁的在段与段之间进行切换 代
  • Docker 部署 Prometheus & Grafana (监控主机进程)

    目录 1 环境介绍 xff1a 2 部署 主机进程 监控1 使用 Docker 部署 Grafana2 部署并启动 prometheus3 下载 process exporter4 创建并编辑文件 process name yaml5 在
  • 【Docker】报错:Got permission denied while trying to connect to the Docker daemon socket at unix:///var/

    报错原因 在VMWARE中安装的centos中查看容器Docker所安装的镜像命令时即执行 docker images 时虚拟机报错 xff0c 该用户没有此类权限 错误 xff1a Got permission denied while
  • linux ubuntu 彻底卸载包,清理linux软件卸载残留

    使用以下命令清理残留配置 xff0c 其实就是删除残留的 rc文件 dpkg span class token parameter variable l span span class token operator span span cl
  • list和array 访问不连续index

    python中内置数据类型list与numpy array都是常会用到的两种数据结构 二者在访问变量中不连续index时处理方式有所不同 array array访问不连续index的方式非常简单 xff0c 只需要用定义好的索引直接截取ar
  • TVM Windows conda 安装

    TVM Windows 安装 简介 本篇博客主要目的是帮助大家在windows平台上安装好tvm xff0c 并且可以顺利使用 因为有项目需要使用tvm xff0c 同时自己需要用windows做一些测试 xff0c 因此想要在window

随机推荐

  • 探讨ros下的cmakelists文件的编写

    文章目录 cmakelists文件整体架构分块讲解1 CMake版本2 软件包名称3 查找相关的CMake包4 消息 服务 动作生成器 cmakelists文件整体架构 所需CMake版本 xff08 cmake minimum requi
  • git 克隆指定分支

    git clone b 分支名 仓库地址
  • 【NVIDIA】Jetson Xavier NX镜像烧录

    设备信息 我的设备是Jetson Xavier NX xff1b 准备工作 鼠标 键盘 显示器SD卡 32GB至少 网线 xff08 也可以wifi xff09 官方教程 xff1a https developer nvidia com e
  • Android GPS学习 (二) :GPS 服务启动以及初始化流程

    扫码关注 xff0c 一起学习 1 GPS 服务启动 SystemServer java的startOtherServices方法中添加LocationManagerService方法的代码如下 frameworks base servic
  • docker运行ubuntu22.04出现异常(转载)

    原文链接 xff1a https xyz uscwifi xyz post PRTc2ZYZx 参考 xff1a docker Why I cannot run 96 apt update 96 inside a fresh ubuntu
  • 为什么执行同一个程序每次输出的变量地址是不一样的

    首先看一下下面的代码 include lt stdio h gt int main int a 61 1 printf 34 p n 34 amp a return 0 然后我就很疑惑 xff0c 为什么每次的地址都是不一样的 为什么会有这
  • 中断的基本概念

    异常和中断 概念 xff1a 程序执行过程中CPU会遇到一些特殊情况 xff0c 是正在执行的程序被 中断 xff0c cpu中止原来正在执行的程序 xff0c 转到处理异常情况或特殊事件的程序去执行 xff0c 结束后再返回到原被中止的程
  • 8086CPU结构与功能

    微处理器的外部结构 微处理器的外部结构如下图所示 8086CPU片有40个管脚 微处理器通过这些引脚与外部的逻辑部件连接 完成信息的交换 CPU的这些引脚称为微处理器级的总线 功能 与存储器之间交换信息 指令及数据 与I O设备之间交换信息
  • 8086微处理器的寄存器组织

    8086CPU内部有14个16位的寄存器 按功能可以分为8个通用寄存器 4个段寄存器和两个控制寄存器 通用寄存器 通用寄存器可以分为两类 数据寄存器 AX BX CX DX 和地址寄存器 变址寄存器 SI DI SP BP 8086CPU有
  • python dict setdefault()方法

    描述 Python 字典 setdefault 函数和 get 方法 类似 如果键不存在于字典中 xff0c 将会添加键并将值设为默认值
  • CPU原生支持的任务切换方式

    CPU 厂商原本计划的一种任务切换方法 xff0c 并不是操作系统实例中任务切换的方法 未采用的原因是此方法效率不高 xff0c 现代操作系统很少用这种方法切换任务 为了支持多任务 xff0c CPU 厂商提供了 LDT TSS 这两种原生
  • linux内核2.6.16版本启动分析(1)

    电脑的启动流程详见这篇博文电脑开机过程 简述一下就是按下电源键后 cs ip置位到0xffff0的位置 而这个位置是固化的 上面都刻录好了BIOS程序 BIOS执行基本的硬件自检以及建立中断向量表 初始化BIOS中断等 接下来会把第一块磁盘
  • linux内核目录分析

    最近准备开始研读linux的内核了 今天在deepin内核版本为4 8 15上编译安装了内核4 19 6 本来是先装2 6 16版本的 但2 6 16版本的内核版本要求gcc的版本为4 6之下 装4 6版本的gcc的时候出了点问题 还没解决
  • AT&T语法

    在linux内核编写中 为了维持与gcc输出汇编程序的兼容性 as汇编器使用AT amp T系统的V的汇编语法 下面简称为AT amp T语法 这种语法与Intel汇编程序使用的语法 简称Intel语法 很不一样 他们之间的主要区别有以下几
  • eBPF入门

    BPF和eBPF是什么 简单来说 BPF提供了一种在和各种内核和应用程序事件发生时运行一段小程序的机制 BPF是一项灵活而高效的技术 由指令集 存储对象和辅助函数等几部分组成 由于它采用了虚拟指令集规范 因此也可将它视作一种虚拟机的实现 这
  • make详解

    Make 1 学习make的必要性 在Linux中 有一个用来维护程序模块关系和生成可执行程序的工具 xff0d make 他可以根据程序模块的修改情况重新编译链接生成中间代码或最终的可执行程序 执行make 命令 xff0c 需要一个名为
  • Linux:网络编程——UDP代码及其封装

    Linux xff1a 网络编程 UDP代码及其封装 UDP代码封装UDP 前面我们了解了 UDP的编程步骤为 xff1a 客户端 xff1a 创建套接字 接收消息 发送消息 接收消息 服务端 xff1a 创建套接字 绑定地址信息 接收消息
  • 卷积神经网络CNN笔记(Tensorflow)

    卷积神经网络学习笔记 一 卷积神经网络相关定义二 基本步骤三 数据增强1 基本原理2 keras实现3 卷积神经网络中的应用 四 常用代码五 实验代码六 使用预训练的卷积神经网络结语 一 卷积神经网络相关定义 卷积层 xff08 Convo
  • 基于GTSRB数据集的交通标志识别实验(Tensorflow)

    基于GTSRB的交通标志识别实验 一 数据数据读取 二 搭建网络三 模型预测四 附录模块导入Code 结语 一 数据 官网下载太慢 xff0c 然后我找到了一个整理好的数据集 链接 GTSRB 德国交通标志识别图像数据 数据集很干净 xff
  • 贝叶斯分类器原理——学习笔记

    贝叶斯分类器原理 简介一 逆概率推理与贝叶斯公式1 确定性推理与概率推理2 贝叶斯公式 二 贝叶斯分类的原理三 概率估计1 先验概率的估计2 类条件概率的估计 四 贝叶斯分类的错误率五 常用贝叶斯分类器1 最小错误率贝叶斯分类器2 最小风险