ML-机器学习基础

2023-10-30

目录

 

偏差与方差

导致偏差和方差的原因

深度学习中的偏差与方差

生成模型与判别模型

两者之间的联系

优缺点

常见模型

先验概率与后验概率


偏差与方差


  • 偏差与方差分别是用于衡量一个模型泛化误差的两个方面:
    • 模型的偏差,指的是模型预测的期望值与真实值之间的差;
    • 模型的方差,指的是模型预测的期望值与预测值之间的差平方
  • 在监督学习中,模型的泛化误差可分解为偏差、方差与噪声之和
  • 偏差用于描述模型的拟合能力
  • 方差用于描述模型的稳定性

导致偏差和方差的原因

  • 偏差通常由于我们对学习算法做了错误的假设,或者模型的复杂度不够;
    • 比如真是模型是一个二次函数,而我们假设模型为一个一次函数,这就会导致偏差的增大(欠拟合);
    • 由偏差引起的误差通常在训练误差上能体现,或者说训练误差主要由偏差造成
  • 方差通常是由于模型的复杂度相对于训练集过高导致的
    • 比如真实模型是一个简单的二次函数,而我们假设模型是一个高次函数,这就会导致方差的增大(过拟合);
    • 由方差引起的误差通常体现在测试误差相对训练误差的增量上。

深度学习中的偏差与方差

  • 神经网络的拟合能力非常强,因此他的训练误差(偏差)通常较小
  • 但是过强的拟合能力会导致较大的方差,使模型的测试误差(泛化误差)增大;
  • 因此深度学习的核心工作之一就是研究如何降低模型的泛化误差,这类方法统称为正则化方法

生成模型与判别模型


  • 监督学习的任务是学习一个模型,对给定的输入预测相应的输出
  • 这个模型的一般形式为一个决策函数或一个条件概率分布(后验概率)
    • Y=f(X)  or  P(Y|X)
    • 决策函数:输入X返回Y;其中Y与一个阈值比较,然后根据比较结果判定X的类别
    • 条件概率分布:输入X返回X属于每个类别的概率;将其中概率最大的作为X所属的类别
  • 监督学习模型可分为生成模型与判别模型
    • 判别模型直接学习决策函数或者条件概率分布
      • 直观来说,判别模型学习的是类别之间的最优分隔面,反映的是不同类数据之间的差异
    • 生成模型学习的是联合概率分布P(X,Y),然后根据条件概率公式计算P(Y|X)
      • P(Y|X) = \frac{P(X,Y))}{P(X))}

​​​​​​​两者之间的联系

  • 由生成模型可以得到判别模型,但是由判别模型得不到生成模型
  • 当存在“隐变量”时,只能使用生成模型

隐变量:当我们找不到引起某一现象的原因时,就把这个在起作用,但无法确定的因素,叫做“隐变量”

优缺点

  • 判别模式
    • 优点
      • 直接面对预测,往往学习的准确率更高
      • 由于直接学习P(Y|X) 或 f(X),可以对数据进行各种程度的抽象,定义特征并使用特征,以简化学习过程
    • 缺点
      • 不能反映训练数据本身的特性
  • 生成模型
    • 优点
      • 可以还原联合概率分布P(X,Y),判别方法不能
      • 学习收敛速度更快——即当样本容量增加时,学到的模型可以更快地收敛到真实模型
      • 当存在“隐变量”时,只能使用生成模型
    • 缺点
      • 学习和计算过程比较复杂

常见模型

  • 判别模型
    • K近邻、感知机(神经网络)、决策树、罗辑回归、最大熵模型、SVM、提升方法、条件随机场
  • 生成模型
    • 朴素贝叶斯、隐马尔可夫模型、混合高斯模型、贝叶斯网络、马尔可夫随机场

先验概率与后验概率


条件概率(似然概率)

  • 一个事件发生后另一个事件发生的概率
  • 一般的形式为P(X|Y),表示y发生的条件下x发生的概率
  • 有时为了区分一般意义上的条件概率,也称为似然概率

先验概率

  • 事情发生前预判概率
  • 可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出
  • 一般都是单独发生的概率,如P(A)、P(B)

​​​​​​​后验概率

  • 基于先验概率求得的反向条件概率,形式上与条件概率相同(若P(X|Y)为正向,则P(Y|X)为反向)

贝叶斯公式

                P(Y|X) = \frac{P(X|Y)*P(Y)))}{P(Y))}

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ML-机器学习基础 的相关文章

  • 线性回归(两种方式代码实现)

    方式一 最小二乘法 正规方程 公式推导 其中 代码实现 1 导入库 import numpy as np from sklearn datasets import load boston boston load boston x bosto
  • cuda/cudnn/cuda 10.1安装教程

    方法1 NVIDIA 显卡驱动安装示例 ubuntu系统刚装好 推荐 Ubuntu 18 04 安装 NVIDIA 显卡驱动 ps 1 新系统的签名要重新注册 2 要禁用nouveau 新安装方法 其他参考 https zhuanlan z
  • pytorch/torch安装简明教程

    LINUX上安装 0 进入官网https pytorch org 按照你的系统以及配置 获取安装命令 1 安装gpu版本的torch cuda包 用于torch调用gpu加速库 pip install torch 1 5 0 cu101 t
  • 文本分类(六):使用fastText对文本进行分类--小插曲

    需要注意的问题 1 linux mac 平台 2 标签中的下划线是两个 两个 两个 环境说明 python2 7 linux 自己打自己脸 目前官方的包只能在linux mac环境下使用 误导大家了 对不起 测试facebook开源的基于深
  • 【机器学习杂烩】投票(Voting)算法在分类问题上的应用(一口气实现Logistic 回归、SVM、KNN、C4.5 决策树、 Adaboost、GBDT 和随机森林,并集成起来)

    投票算法简介 投票是在分类算法中广泛运用的集成学习算法之一 投票主要有硬投票和软投票 两种 硬投票即各基分类器权重相同的投票 其原理为多数投票原则 如果基分类器 的某一分类结果超过半数 则集成算法选择该结果 若无半数结果则无输出 软投票 的
  • python或anaconda下安装opencv提示Error:No matching distribution found for opencv

    python或anaconda下安装opencv提示Error No matching distribution found for opencv 错误提示 ERROR Could not find a version that satis
  • Pytorch 入门 ----学习笔记

    本文是在参加DataWhale开源组队学习 深入浅出Pytorch 过程中 整理的学习笔记 Pytorch 基础知识 张量 张量的创建 张量 也叫做多维数组 常常我们对于一维张量也叫做标量 二位张量叫做矩阵 大部分时候 张量是三维及三维以上
  • graphviz安装及使用、决策树生成

    一 graphviz下载安装 下载网址 http www graphviz org download 选择合适版本下载 1 1 双击安装 1 2 点击下一步 1 3 点击我接受 1 4 添加至系统路径 勾选添加至当前用户的系统路径 创建桌面
  • 朴素贝叶斯解决天气问题

    朴素贝叶斯是一种基于贝叶斯定理的分类方法 该算法是有监督的学习算法 解决分类问题 在该算法中 我们假设给定目标值时 属性之间相互条件独立 即 贝叶斯定理 对于分类问题 样本x属于类别y的概率 其中 P y 是指未使用数据训练分类器之前的y的
  • ML-机器学习实践

    目录 超参数选择 Gride Search Random Search 相关库 几种参数估计的区别与联系 MLE MAP 贝叶斯TODO 余弦相似度 cos距离 与欧式距离的区别和联系 1 区别 2 联系 归一化 标准化 混淆矩阵 模型度量
  • 周志华《Machine Learning》学习笔记(17)--强化学习

    上篇主要介绍了概率图模型 首先从生成式模型与判别式模型的定义出发 引出了概率图模型的基本概念 即利用图结构来表达变量之间的依赖关系 接着分别介绍了隐马尔可夫模型 马尔可夫随机场 条件随机场 精确推断方法以及LDA话题模型 HMM主要围绕着评
  • statsmodels.tsa.stattools.adfuller 的用法

    statsmodels tsa stattools adfuller x maxlag None regression c autolag AIC store False regresults False source 增广Dickey F
  • 基于时间序列的短期数据预测--ARMA模型的设计与实现(每个步骤附实现源码)

    本文demo源码 实验数据 传送门 引言 前面我有分享两篇关于时间序列模型的文章 一篇是 Holt Winters模型原理分析及代码实现 python 一篇是 LSTM模型分析及对时序数据预测的具体实现 python实现 holt wint
  • ValueError: Found array with dim 4. Estimator expected和ValueError: Expected 2D array, got 1D array i

    python3中对numpy数组进行降维或升维 解决报错如 1 ValueError Found array with dim 4 Estimator expected 2 ValueError Expected 2D array got
  • ML-熵、条件熵、信息增益

    通俗理解条件熵 特征选择之信息增益法 必看 系统介绍了熵 条件熵 信息增益的概念及推导 条件熵的计算 必看 知乎前三个回答都看一下 有关于熵 条件熵 信息增益的实践 我通过例子一步一步讲解这个概念 在决策树算法的学习过程中 信息增益是特征选
  • 最大似然估计(ML)

    1 说明 最大似然估计 Maximum Likelihood Estimation ML 是一种在给定观察数据情况下 来评估模型参数的算法 它属于一种统计方法 用来求一个样本集的相关概率密度函数的参数 例如 统计全校人口的身高 我们已知身高
  • Binary Classification Core PLA

    Target Step Verify My verification Pocket Algorithm Pros Cons of PLA
  • 用 OCaml 编写解释器 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在大学学习一门课程 要求我从操作语义开始 用 OCaml 编写一种语言的解释器 不幸的是 除了课程
  • 基于 SML 的文件查找

    有没有办法使用 SML Basis 库在特定位置打开文件 也就是说 使用操作系统调用来更改位置 而不是扫描文件并丢弃数据 这很棘手 不幸的是 不直接支持搜索 此外 文件位置仅对于二进制文件是透明的 即您使用BinIO结构 1 对于该结构体
  • SML 中的 'a 和 ''a 有什么区别?

    例如 fun example a a list list a 将有以下签名 a list gt a list 如果我定义不同但内容相同怎么办 例如 fun example a a list list a 它的签名是 a list gt a

随机推荐

  • 在Html中设置图片等宽等高,移动端图片处理,设定最大宽度,高度等比处理(纯CSS)...

    我是在给自己PC站博客做移动端适配 遇到了共用PC站内容 里面有时候会有图片 PC端是通过最大宽度来限制 如今要增加移动端适配 总不能重新调整图片大小吧 就利用CSS来限制图片在移动端的宽度 高度自适应 以下博文为引用 确认有效 有这样的应
  • 框架 - Mybatis 源码一步步深入(三)

    简介 上一章我们大概了解了SqlSessionFactoryBuilder和Configuration两个类 这一章我们主要了解XMLConfigBuilder类 它是Mybatis配置文件解析入口 BaseBuilder 类 在了解XML
  • 【FPGA零基础学习之旅#12】三线制数码管驱动(74HC595)串行移位寄存器驱动

    欢迎来到FPGA专栏 三线制数码管驱动 o o 嗨 我是小夏与酒 博客主页 小夏与酒的博客 该系列文章专栏 FPGA学习之旅 文章作者技术和水平有限 如果文中出现错误 希望大家能指正 欢迎大家关注 目录 三线制数码管驱动 一 效果演示 二
  • odoo16企业版实现从销售-仓库-采购-制造-制造外包-会计整个流程自动化单据功能的演示教程(带视频)

    Odoo 16销售 仓库 采购 制造 制造外包 会计整个流程自动化单据功能的演示教程 今天我们在odoo16企业版做一个实现从销售 仓库 采购 制造 制造外包到会计整个流程自动化单据功能的演示 也就是说在销售应用里下了一个销售单其他模块的单
  • C语言创建顺序表并插入元素 详细注释

    顺序表是用一组地址连续的存储单元依次存储数据元素的数据结构 顺序表是线性表的一种 线性表是最常用且最简单的一种数据结构 一个线性表是 n 个数据元素的有限序列 我们使用 c 语言来创建顺序表并插入元素 IDE Code Blocks 17
  • 使用 Open3D 生成空间直线点云

    使用 Open3D 生成空间直线点云 Open3D 是一个流行的开源库 被广泛应用于 3D 数据处理和可视化领域 本文将介绍如何使用 Open3D 生成空间直线点云 从而为后续的 3D 数据分析和可视化工作提供基础数据 首先 我们需要导入
  • ROS——Navigation功能包等你来查收!

    ROS Robot Operating System 机器人操作系统 我相信大家或多或少都听过 在如今机器人领域突飞猛进的时代 ROS也得到飞速发展 下图展示了其各版本的发展历程 ROS的原型源自斯坦福大学人工智能实验室的项目 其首要设计目
  • 最短路径(给定一个包含非负整数的 m x n 网格,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。 说明:每次只能向下或者向右移动一步。)...

    给定一个包含非负整数的 m x n 网格 请找出一条从左上角到右下角的路径 使得路径上的数字总和为最小 说明 每次只能向下或者向右移动一步 例 输入 1 3 1 1 5 1 4 2 1 输出 7 解释 因为路径 1 3 1 1 1 的总和最
  • a 标签 图片下载

    一般 a 标签下载文件的方式都是加download属性 但是对于图片下载来说 加了download的属性有时起作用 有时不起作用 如果真想下载远程图片在url后同加 response content type application oct
  • win10安装docker教程、常见问题和原理总结

    文章目录 前言 一 Docker是什么 Docker通常应用场景 准备开始 为什么要引入docker docker基本概念 docker工作流程 docker原理 二 win10上安装docker 三 linux安装docker 前言 wi
  • HC-05学习笔记

    大家好 新手上路 请多多指教 网上有很多大佬也做了这个HC 05的文章 我这个文章只是个人学习笔记 如果有侵犯到那位大佬请与我联系谢谢 也是希望对一次的学习做一个记录 也能够希望帮助到其他的小伙伴们 HC 05蓝牙 大家好 新手上路 请多多
  • Python中Xpath一些研究,node与*的一些区别

    Python中Xpath一些研究 node与 的一些区别理解 详细看下文 主要是一些区别 主要是注意 child node 与child 的一些区别 node 表示的是节点 表示的是元素 元素 文本 注释都属于节点 而标签属于元素 同时 标
  • Python研究生组蓝桥杯(省二)参赛感受

    为什么参加蓝桥杯 今年是读研的第一年 看着我简历上的获奖经历 优秀学生干部 优秀志愿者 优秀毕业生 大学四年 我竟然没有一次竞赛类的经历 也没有拿得出手的项目 我陷入了深深的焦虑 听说蓝桥杯的门槛相对较低 对我这种小白比较友好 于是我报名了
  • 软件配置管理(二)配置管理角色与过程

    文章目录 一 配置管理角色及职责 项目经理 PM 配置控制委员会 CCB 配置管理员 CMO 系统集成员 SIO 开发人员 DEV 二 配置管理基本流程 计划阶段 开发和维护阶段 三 软件配置管理七项基本活动 1 制定配置管理计划 2 识别
  • ubuntu2004/1804安装编译RocksDB

    Linux Ubuntu下载依赖 Upgrade your gcc to version at least 4 8 to get C 11 support Install gflags First try sudo apt get inst
  • XSS十五关通关秘籍

    文章来源 MS08067 Web零基础1期作业 本文作者 ymsli Web零基础1期学员 第一关 url输入关键字 完成第一关 第二关 文本框内输入 nclick alert 123 gt 点击搜索 文本框已被添加onclick事件 点击
  • 面试总结:测试常见面试题汇总

    文章目录 理论 测试流程 各个测试阶段 单元测试 集成测试 系统测试区别 测试用例设计 什么是好的测试用例 方法 用户登录 实例 App测试和Web测试的区别 典型测试场景 聊天功能测试用例怎么设计 怎么测试微信朋友圈 TODO 怎么测试微
  • do_mmap解读

    1 unsigned long do mmap pgoff struct file file unsigned long addr 2 unsigned long len unsigned long prot 3 unsigned long
  • Chat Gpt 4.0 API接口技术对接

    GPT Generative Pre trained Transformer 是一种基于Transformer网络架构的自然语言处理模型 能够生成自然 连贯的语言文本 GPT API接口技术是指将GPT模型应用于API接口开发 使得通过AP
  • ML-机器学习基础

    目录 偏差与方差 导致偏差和方差的原因 深度学习中的偏差与方差 生成模型与判别模型 两者之间的联系 优缺点 常见模型 先验概率与后验概率 偏差与方差 偏差与方差分别是用于衡量一个模型泛化误差的两个方面 模型的偏差 指的是模型预测的期望值与真