机器学习笔记——概率生成模型

2023-11-15

假设有两类数据，每一类都有若干个样本；概率生成模型认为每一类数据都服从某一种分布，如高斯分布；从两类训练数据中得到两个高斯分布的密度函数，具体的是获得均值和方差两个参数；测试样本输入到其中一个高斯分布函数，得到的概率值若大于0.5，则说明该样本属于该类，否则属于另一类。

算法的核心在于获取分布函数的两个参数。具体的做法是：利用训练数据，构造似然函数，使得该似然函数最大的参数即为所求。事实上，一类数据的所有训练样本的均值和协方差即为所求。

得到其中一类的分布函数后，就可以对测试样本进行测试分类：

下图反映的是取样本的两个特征进行可视化的分类结果，可以看到只有47%的准确率。一个原因是选择的特征没有足够的区分性，另外一个原因是模型自身有问题

改进模型，使两类数据共用同一个协方差，均值不变。这里的协方差由两个类的协方差加权求和构成。

从下图可以看到，分类准确率提高到73%，决策边界也变成了直线

总结：

1、概率生成模型的三个步骤：

2、分布函数不唯一，可以是高斯分布，也可能是伯努利分布，根据数据特点人工决定

3、概率生成模型的决策函数可以转换成sigmoid函数：

4、判别模型和生成模型：前者直接计算求解w和b，后者通过求解分布函数的参数间接获得w和b，区别在哪里？

一般认为判别模型的分类效果比生成模型略胜一筹，但当训练数据较少时生成模型表现更好，而且生成模型对噪声点更鲁棒。从计算机复杂度来看，你认为呢？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

概率生成模型

机器学习笔记——概率生成模型的相关文章

像素鸟代码 html,2021-04-05像素鸟代码

html gt Document margin 0 padding 0 game width 800px height 600px background url images sky png position relative overfl

随机推荐

umi页面跳转定位问题

突然发现在umi页面中如果没有设置页面定位那么在页面中部或者底部点击跳转到下一页会默认跳转到该页面对应的中部或者下部的位置那么如果想要在跳转时直接定位到页面的头部应该怎么做呢首先确定需求目前项目的需求是无论从上一页的
Access&Trunk&单臂路由

一实验要求要求 1 pc1属于vlan10 配置静态IP地址192 168 1 2 24 2 pC2属于vlan20 配置静态IP地址192 168 2 2 24 3 LSw1交换机上配置PC1和PC2的网关地址分别为192 168
免费版对象存储【minIO】CentOS部署实践记录 2021

之前一直用的七牛不过是收费的然后有些定制化需求可能比较看重预算然后就有了这篇开源方式 minio 一简介官方文档 http docs minio org cn docs MinIO 是一个基于Apache License v2
react打包成html5,create-react-app项目打包相关问题

Q1 yarn build打包生成的文件直接点击index html报错打不开导致的问题是yarn build打包生成的文件部署到服务器时只能在服务器根目录如果在其他文件夹里面会报错 A1 默认情况下 index html中引入js和
XSS-5注入靶场闯关(小游戏)——第五关

一首先先尝试查看源代码可以看到他前面有一个引号并且
做出刷屏文字的6大哲学

title 做出刷屏文字的6大哲学 date 2019 09 05 23 39 16 tags 刷屏文字哲学 published true hideInList false feature https s2 ax1x com 2019
遥感影像语义分割论文笔记（二）Category Boundary Detection Network

A semantic segmentation method with category boundary for Land Use and Land Cover LULC mapping of Very High Resolution V
配置 gitlab https 访问

文章目录 1 备份 2 生成SSL证书 3 配置文件 4 重启 5 访问 1 备份 docker exec ti gitlab ce gitlab rake gitlab backup create 2 生成SSL证书 yum instal
药物 3D 打印新突破：圣地亚哥大学用机器学习筛选喷墨打印生物墨水，准确率高达 97.22%

内容一览药物喷墨打印是一种高度灵活和智能化的制药方式据相关报告统计该领域市场规模将在不久的未来呈现指数级增长过往筛选合适生物墨水的方法费时且费力因此也成为药物喷墨打印领域面临的主要挑战之一为解决这一问题国际药剂学期刊 Int
高斯牛顿法求非线性最小二乘的步骤和c++代码实现

slam图优化的本质是一个非线性优化问题 Gauss Newton求解步骤 1 线性化误差函数 2 构建线性系统 3 求解线性系统 4 更新解并不断迭代直至收敛一个简单的代码实现一维参数xy 高维变为对应的矩阵即可 include
如何用cublas计算逆矩阵？

cublas的文档中提供了一个用LU分解求逆矩阵的方法需要用到两个函数 cublas
yum Error downloading packages: xxx [Errno 256] No more mirrors to try.

问题解决 yum clean all执行后再执行yum makecache 清除缓存以及重新下载相关包信息缓存到本地
C语言之自定义函数的实现

自定义函数的作用方便管理代码编写程序时思路清晰代码复用同一段代码可以在不同位置多次执行函数声明使用返回值类型函数名类型变量名类型变量名例如 int sum int num1 int num2 实际上在函数声明时
【Leetcode】154. 寻找旋转排序数组中的最小值 II

题目描述已知一个长度为 n 的数组预先按照升序排列经由 1 到 n 次旋转后得到输入数组例如原数组 nums 0 1 4 4 5 6 7 在变化后可能得到若旋转 4 次则可以得到 4 5 6 7 0 1 4 若旋转 7
php脚本中利用mail函数发送邮件及问题归纳

最近在学php脚本语言书中有一个实例服务器端将浏览器发送的信息通过php脚本利用mail函数发送到一个邮箱自己讲书中实例代码上传至服务器在浏览器上填写表单并提交后邮箱迟迟收不到邮件 1 php中mail函数发送邮件失败问题邮
2021-10-19，Oracle VM VirtualBox中安装增强功能失败

问题 Oracle VM VirtualBox中安装增强功能失败根据给出的信息提示进行解决 This system is currently not set up to build kernel modules Please instal
静态博客提升访问速度：内嵌CSS，异步加载js，压缩HTML

在谷歌搜索的功能速度实验性中推荐使用工具PageSpeed Insights查看我的网页访问速度情况 PageSpeed Insights 分数很低只有33分优化建议的第一条是移除阻塞渲染的资源里面列出了非异步加载的css和js文
公告

作为一个稳定高效安全的区块链底层平台 FISCO BCOS一方面致力于保障系统稳定性兼容性鲁棒性易用性另一方面专注于提升区块链底层平台的性能可扩展性自FISCO BCOS v3 0开始社区更是秉着开源开放联合共建的原则
最长公共子序列算法_解决最长公共子序列问题的算法和过程

最长公共子序列算法最长的公共子序列 Longest common Subsequence Let X and Y be two subsequences and by LCS algorithm we can find a maximum
机器学习笔记——概率生成模型

假设有两类数据每一类都有若干个样本概率生成模型认为每一类数据都服从某一种分布如高斯分布从两类训练数据中得到两个高斯分布的密度函数具体的是获得均值和方差两个参数测试样本输入到其中一个高斯分布函数得到的概率值若大于0 5 则说明该

机器学习笔记——概率生成模型

机器学习笔记——概率生成模型 的相关文章

随机推荐

热门标签

机器学习笔记——概率生成模型的相关文章