ML-机器学习基础

2023-10-30

偏差与方差

导致偏差和方差的原因

深度学习中的偏差与方差

偏差与方差

偏差与方差分别是用于衡量一个模型泛化误差的两个方面：
- 模型的偏差，指的是模型预测的期望值与真实值之间的差；
- 模型的方差，指的是模型预测的期望值与预测值之间的差平方
在监督学习中，模型的泛化误差可分解为偏差、方差与噪声之和
偏差用于描述模型的拟合能力
方差用于描述模型的稳定性

导致偏差和方差的原因

偏差通常由于我们对学习算法做了错误的假设，或者模型的复杂度不够；
- 比如真是模型是一个二次函数，而我们假设模型为一个一次函数，这就会导致偏差的增大（欠拟合）；
- 由偏差引起的误差通常在训练误差上能体现，或者说训练误差主要由偏差造成
方差通常是由于模型的复杂度相对于训练集过高导致的
- 比如真实模型是一个简单的二次函数，而我们假设模型是一个高次函数，这就会导致方差的增大（过拟合）；
- 由方差引起的误差通常体现在测试误差相对训练误差的增量上。

深度学习中的偏差与方差

神经网络的拟合能力非常强，因此他的训练误差（偏差）通常较小
但是过强的拟合能力会导致较大的方差，使模型的测试误差（泛化误差）增大；
因此深度学习的核心工作之一就是研究如何降低模型的泛化误差，这类方法统称为正则化方法

生成模型与判别模型

监督学习的任务是学习一个模型，对给定的输入预测相应的输出
这个模型的一般形式为一个决策函数或一个条件概率分布（后验概率）
- Y=f(X) or P(Y|X)
- 决策函数：输入X返回Y；其中Y与一个阈值比较，然后根据比较结果判定X的类别
- 条件概率分布：输入X返回X属于每个类别的概率；将其中概率最大的作为X所属的类别
监督学习模型可分为生成模型与判别模型
- 判别模型直接学习决策函数或者条件概率分布
  - 直观来说，判别模型学习的是类别之间的最优分隔面，反映的是不同类数据之间的差异
- 生成模型学习的是联合概率分布P(X,Y)，然后根据条件概率公式计算P(Y|X)
  - $P(Y|X) = \frac{P(X,Y))}{P(X))}$

两者之间的联系

由生成模型可以得到判别模型，但是由判别模型得不到生成模型
当存在“隐变量”时，只能使用生成模型

隐变量：当我们找不到引起某一现象的原因时，就把这个在起作用，但无法确定的因素，叫做“隐变量”

优缺点

判别模式
- 优点
  - 直接面对预测，往往学习的准确率更高
  - 由于直接学习P(Y|X) 或 f(X)，可以对数据进行各种程度的抽象，定义特征并使用特征，以简化学习过程
- 缺点
  - 不能反映训练数据本身的特性
生成模型
- 优点
  - 可以还原联合概率分布P(X,Y)，判别方法不能
  - 学习收敛速度更快——即当样本容量增加时，学到的模型可以更快地收敛到真实模型
  - 当存在“隐变量”时，只能使用生成模型
- 缺点
  - 学习和计算过程比较复杂

常见模型

判别模型
- K近邻、感知机（神经网络）、决策树、罗辑回归、最大熵模型、SVM、提升方法、条件随机场
生成模型
- 朴素贝叶斯、隐马尔可夫模型、混合高斯模型、贝叶斯网络、马尔可夫随机场

先验概率与后验概率

条件概率（似然概率）

一个事件发生后另一个事件发生的概率
一般的形式为P(X|Y)，表示y发生的条件下x发生的概率
有时为了区分一般意义上的条件概率，也称为似然概率

先验概率

事情发生前预判概率
可以是基于历史数据的统计，可以由背景常识得出，也可以是人的主观观点给出
一般都是单独发生的概率，如P(A)、P(B)

后验概率

基于先验概率求得的反向条件概率，形式上与条件概率相同（若P(X|Y)为正向，则P(Y|X)为反向）

贝叶斯公式

$P(Y|X) = \frac{P(X|Y)*P(Y)))}{P(Y))}$

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ML

ML-机器学习基础的相关文章

线性回归（两种方式代码实现）

方式一最小二乘法正规方程公式推导其中代码实现 1 导入库 import numpy as np from sklearn datasets import load boston boston load boston x bosto
cuda/cudnn/cuda 10.1安装教程

方法1 NVIDIA 显卡驱动安装示例 ubuntu系统刚装好推荐 Ubuntu 18 04 安装 NVIDIA 显卡驱动 ps 1 新系统的签名要重新注册 2 要禁用nouveau 新安装方法其他参考 https zhuanlan z
pytorch/torch安装简明教程

LINUX上安装 0 进入官网https pytorch org 按照你的系统以及配置获取安装命令 1 安装gpu版本的torch cuda包用于torch调用gpu加速库 pip install torch 1 5 0 cu101 t
文本分类（六）：使用fastText对文本进行分类--小插曲

需要注意的问题 1 linux mac 平台 2 标签中的下划线是两个两个两个环境说明 python2 7 linux 自己打自己脸目前官方的包只能在linux mac环境下使用误导大家了对不起测试facebook开源的基于深
【机器学习杂烩】投票(Voting)算法在分类问题上的应用（一口气实现Logistic 回归、SVM、KNN、C4.5 决策树、 Adaboost、GBDT 和随机森林，并集成起来）

投票算法简介投票是在分类算法中广泛运用的集成学习算法之一投票主要有硬投票和软投票两种硬投票即各基分类器权重相同的投票其原理为多数投票原则如果基分类器的某一分类结果超过半数则集成算法选择该结果若无半数结果则无输出软投票的
python或anaconda下安装opencv提示Error：No matching distribution found for opencv

python或anaconda下安装opencv提示Error No matching distribution found for opencv 错误提示 ERROR Could not find a version that satis
Pytorch 入门 ----学习笔记

本文是在参加DataWhale开源组队学习深入浅出Pytorch 过程中整理的学习笔记 Pytorch 基础知识张量张量的创建张量也叫做多维数组常常我们对于一维张量也叫做标量二位张量叫做矩阵大部分时候张量是三维及三维以上
graphviz安装及使用、决策树生成

一 graphviz下载安装下载网址 http www graphviz org download 选择合适版本下载 1 1 双击安装 1 2 点击下一步 1 3 点击我接受 1 4 添加至系统路径勾选添加至当前用户的系统路径创建桌面
朴素贝叶斯解决天气问题

朴素贝叶斯是一种基于贝叶斯定理的分类方法该算法是有监督的学习算法解决分类问题在该算法中我们假设给定目标值时属性之间相互条件独立即贝叶斯定理对于分类问题样本x属于类别y的概率其中 P y 是指未使用数据训练分类器之前的y的
ML-机器学习实践

目录超参数选择 Gride Search Random Search 相关库几种参数估计的区别与联系 MLE MAP 贝叶斯TODO 余弦相似度 cos距离与欧式距离的区别和联系 1 区别 2 联系归一化标准化混淆矩阵模型度量
周志华《Machine Learning》学习笔记（17）--强化学习

上篇主要介绍了概率图模型首先从生成式模型与判别式模型的定义出发引出了概率图模型的基本概念即利用图结构来表达变量之间的依赖关系接着分别介绍了隐马尔可夫模型马尔可夫随机场条件随机场精确推断方法以及LDA话题模型 HMM主要围绕着评
statsmodels.tsa.stattools.adfuller 的用法

statsmodels tsa stattools adfuller x maxlag None regression c autolag AIC store False regresults False source 增广Dickey F
基于时间序列的短期数据预测--ARMA模型的设计与实现(每个步骤附实现源码)

本文demo源码实验数据传送门引言前面我有分享两篇关于时间序列模型的文章一篇是 Holt Winters模型原理分析及代码实现 python 一篇是 LSTM模型分析及对时序数据预测的具体实现 python实现 holt wint
ValueError: Found array with dim 4. Estimator expected和ValueError: Expected 2D array, got 1D array i

python3中对numpy数组进行降维或升维解决报错如 1 ValueError Found array with dim 4 Estimator expected 2 ValueError Expected 2D array got
ML-熵、条件熵、信息增益

通俗理解条件熵特征选择之信息增益法必看系统介绍了熵条件熵信息增益的概念及推导条件熵的计算必看知乎前三个回答都看一下有关于熵条件熵信息增益的实践我通过例子一步一步讲解这个概念在决策树算法的学习过程中信息增益是特征选
最大似然估计（ML）

1 说明最大似然估计 Maximum Likelihood Estimation ML 是一种在给定观察数据情况下来评估模型参数的算法它属于一种统计方法用来求一个样本集的相关概率密度函数的参数例如统计全校人口的身高我们已知身高
Binary Classification Core PLA

Target Step Verify My verification Pocket Algorithm Pros Cons of PLA
用 OCaml 编写解释器 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在大学学习一门课程要求我从操作语义开始用 OCaml 编写一种语言的解释器不幸的是除了课程
基于 SML 的文件查找

有没有办法使用 SML Basis 库在特定位置打开文件也就是说使用操作系统调用来更改位置而不是扫描文件并丢弃数据这很棘手不幸的是不直接支持搜索此外文件位置仅对于二进制文件是透明的即您使用BinIO结构 1 对于该结构体
SML 中的 'a 和 ''a 有什么区别？

例如 fun example a a list list a 将有以下签名 a list gt a list 如果我定义不同但内容相同怎么办例如 fun example a a list list a 它的签名是 a list gt a

随机推荐

在Html中设置图片等宽等高,移动端图片处理，设定最大宽度，高度等比处理（纯CSS）...

我是在给自己PC站博客做移动端适配遇到了共用PC站内容里面有时候会有图片 PC端是通过最大宽度来限制如今要增加移动端适配总不能重新调整图片大小吧就利用CSS来限制图片在移动端的宽度高度自适应以下博文为引用确认有效有这样的应
框架 - Mybatis 源码一步步深入（三）

简介上一章我们大概了解了SqlSessionFactoryBuilder和Configuration两个类这一章我们主要了解XMLConfigBuilder类它是Mybatis配置文件解析入口 BaseBuilder 类在了解XML
【FPGA零基础学习之旅#12】三线制数码管驱动（74HC595）串行移位寄存器驱动

欢迎来到FPGA专栏三线制数码管驱动 o o 嗨我是小夏与酒博客主页小夏与酒的博客该系列文章专栏 FPGA学习之旅文章作者技术和水平有限如果文中出现错误希望大家能指正欢迎大家关注目录三线制数码管驱动一效果演示二
odoo16企业版实现从销售-仓库-采购-制造-制造外包-会计整个流程自动化单据功能的演示教程(带视频)

Odoo 16销售仓库采购制造制造外包会计整个流程自动化单据功能的演示教程今天我们在odoo16企业版做一个实现从销售仓库采购制造制造外包到会计整个流程自动化单据功能的演示也就是说在销售应用里下了一个销售单其他模块的单
C语言创建顺序表并插入元素详细注释

顺序表是用一组地址连续的存储单元依次存储数据元素的数据结构顺序表是线性表的一种线性表是最常用且最简单的一种数据结构一个线性表是 n 个数据元素的有限序列我们使用 c 语言来创建顺序表并插入元素 IDE Code Blocks 17
使用 Open3D 生成空间直线点云

使用 Open3D 生成空间直线点云 Open3D 是一个流行的开源库被广泛应用于 3D 数据处理和可视化领域本文将介绍如何使用 Open3D 生成空间直线点云从而为后续的 3D 数据分析和可视化工作提供基础数据首先我们需要导入
ROS——Navigation功能包等你来查收！

ROS Robot Operating System 机器人操作系统我相信大家或多或少都听过在如今机器人领域突飞猛进的时代 ROS也得到飞速发展下图展示了其各版本的发展历程 ROS的原型源自斯坦福大学人工智能实验室的项目其首要设计目
最短路径(给定一个包含非负整数的 m x n 网格，请找出一条从左上角到右下角的路径，使得路径上的数字总和为最小。说明：每次只能向下或者向右移动一步。)...

给定一个包含非负整数的 m x n 网格请找出一条从左上角到右下角的路径使得路径上的数字总和为最小说明每次只能向下或者向右移动一步例输入 1 3 1 1 5 1 4 2 1 输出 7 解释因为路径 1 3 1 1 1 的总和最
a 标签图片下载

一般 a 标签下载文件的方式都是加download属性但是对于图片下载来说加了download的属性有时起作用有时不起作用如果真想下载远程图片在url后同加 response content type application oct
win10安装docker教程、常见问题和原理总结

文章目录前言一 Docker是什么 Docker通常应用场景准备开始为什么要引入docker docker基本概念 docker工作流程 docker原理二 win10上安装docker 三 linux安装docker 前言 wi
HC-05学习笔记

大家好新手上路请多多指教网上有很多大佬也做了这个HC 05的文章我这个文章只是个人学习笔记如果有侵犯到那位大佬请与我联系谢谢也是希望对一次的学习做一个记录也能够希望帮助到其他的小伙伴们 HC 05蓝牙大家好新手上路请多多
Python中Xpath一些研究,node与*的一些区别

Python中Xpath一些研究 node与的一些区别理解详细看下文主要是一些区别主要是注意 child node 与child 的一些区别 node 表示的是节点表示的是元素元素文本注释都属于节点而标签属于元素同时标
Python研究生组蓝桥杯（省二）参赛感受

为什么参加蓝桥杯今年是读研的第一年看着我简历上的获奖经历优秀学生干部优秀志愿者优秀毕业生大学四年我竟然没有一次竞赛类的经历也没有拿得出手的项目我陷入了深深的焦虑听说蓝桥杯的门槛相对较低对我这种小白比较友好于是我报名了
软件配置管理（二）配置管理角色与过程

文章目录一配置管理角色及职责项目经理 PM 配置控制委员会 CCB 配置管理员 CMO 系统集成员 SIO 开发人员 DEV 二配置管理基本流程计划阶段开发和维护阶段三软件配置管理七项基本活动 1 制定配置管理计划 2 识别
ubuntu2004/1804安装编译RocksDB

Linux Ubuntu下载依赖 Upgrade your gcc to version at least 4 8 to get C 11 support Install gflags First try sudo apt get inst
XSS十五关通关秘籍

文章来源 MS08067 Web零基础1期作业本文作者 ymsli Web零基础1期学员第一关 url输入关键字完成第一关第二关文本框内输入 nclick alert 123 gt 点击搜索文本框已被添加onclick事件点击
面试总结：测试常见面试题汇总

文章目录理论测试流程各个测试阶段单元测试集成测试系统测试区别测试用例设计什么是好的测试用例方法用户登录实例 App测试和Web测试的区别典型测试场景聊天功能测试用例怎么设计怎么测试微信朋友圈 TODO 怎么测试微
do_mmap解读

1 unsigned long do mmap pgoff struct file file unsigned long addr 2 unsigned long len unsigned long prot 3 unsigned long
Chat Gpt 4.0 API接口技术对接

GPT Generative Pre trained Transformer 是一种基于Transformer网络架构的自然语言处理模型能够生成自然连贯的语言文本 GPT API接口技术是指将GPT模型应用于API接口开发使得通过AP
ML-机器学习基础

目录偏差与方差导致偏差和方差的原因深度学习中的偏差与方差生成模型与判别模型两者之间的联系优缺点常见模型先验概率与后验概率偏差与方差偏差与方差分别是用于衡量一个模型泛化误差的两个方面模型的偏差指的是模型预测的期望值与真

ML-机器学习基础

偏差与方差

导致偏差和方差的原因

深度学习中的偏差与方差

生成模型与判别模型

​​​​​​​两者之间的联系

优缺点

常见模型

先验概率与后验概率

ML-机器学习基础 的相关文章

随机推荐

热门标签

两者之间的联系

ML-机器学习基础的相关文章