02 机器学习中的评估指标

2023-05-16

机器学习中的评估指标

1. 机器学习的目标

  • 根本目标:

    在给定的训练数据上,试图训练出能够归纳数据的规律的模型,并且能在未知样本上也有好的效果。

  • 泛化能力强的模型最好

    能很好地适用于未知样本,如错误率低,精度高

2. 评估方法

使用测试集数据进行可靠的评估

测试集:测试集(用于评估)应该与训练集(用于模型学习)“互斥

常见方法:

  • 留出法 hold-out
    • 保持数据分布一致(如:分层采样)
    • 多次重复划分(如:100次随机划分)
    • 数量适中,20-30%

这里写图片描述

  • 交叉验证法 cross-validation
    • k折交叉验证
    • 若k = m,则得到留一法(leave-one-out,LOO)

这里写图片描述

  • 自助法 bootstrap

    • 基于“自助采样”的方法(bootstrap smapling)
    • 别称:“有放回采样”,“可重复采样
    • 约有36.8%的样本不出现
      • 训练集与原样本集同规模,且数据分布有所改变(可能会重复出现)
      • 测试集:训练集中未出现的原样本

limm+(11m)m=0.368(13) (13) lim m → + ∞ ( 1 − 1 m ) m = 0.368

3. 评估度量标准

性能度量 performance measure

  • 衡量模型泛化能力的数值评价标准,反应了当前问题(任务需求)
  • 使用不同的性能度量可能会导致不同的评判结果

    模型的“好坏”,不仅取决于算法和数据,还取决于**当前任务需求**
    

常用性能度量:

- 分类问题

1. 错误率

E(f;D)=1mi=1mI(f(x)yi)(14) (14) E ( f ; D ) = 1 m ∑ i = 1 m I ( f ( x ) ≠ y i )

2. 精度

acc(f;D)=1mi=1mI(f(x)=yi)=1E(f;D)(15) (15) a c c ( f ; D ) = 1 m ∑ i = 1 m I ( f ( x ) = y i ) = 1 − E ( f ; D )

指示函数,当括号内的条件成立时取 1 ,不成立时取 0

二分类混淆矩阵

真实情况预测情况
正例反例
正例TP(真正例)FN(假反例)
反例FP(假正例)TN(真反例)

3.查准率(准确率):预测出的正例中真实的正例所占比例

P=TPTP+FP(16) (16) P = T P T P + F P

4.查全率(召回率):真实的正例中预测正确的比例

R=TPTP+FN(17) (17) R = T P T P + F N

5.F1值

F1=2×P×RP+R=2×TPm+TPTN(18) (18) F 1 = 2 × P × R P + R = 2 × T P m + T P − T N

Fβ=(1+β2×P×R)(β2×P)+R(19) (19) F β = ( 1 + β 2 × P × R ) ( β 2 × P ) + R

通过设置权重 \beta ,调整查准率与查全率的重要度
\beta > 1 时,查全率有更大影响;
\beta < 1 时,查准率有更大影响;

6.ROC && AUC

ROC:Receiver Operating Characteristic Cruve
AUC:Area Under thd ROC Cruve,即曲线下方的面积

image

AUC=11m+mx+DxD(I(f(x+)<f(x))+12I(f(x+)=f(x)))(20) (20) A U C = 1 − 1 m + m − ∑ x + ∈ D ∑ x − ∈ D ( I ( f ( x + ) < f ( x − ) ) + 1 2 I ( f ( x + ) = f ( x − ) ) )

AUC值范围 0~1,值越大,结果越好

- 回归问题

1.平均绝对误差:MAE(Mean Absolute Error)

MAE=1ni=1nfiyi(57) (57) M A E = 1 n ∑ i = 1 n ∣ f i − y i ∣

2.均方误差:MSE(Mean Square Error)

MAE=1ni=1n(fiyi)2(58) (58) M A E = 1 n ∑ i = 1 n ( f i − y i ) 2

3.均方根误差:RMSE(Root Mean Square Error)

RMSE=MSE(59) (59) R M S E = M S E

4.R平方

r2=1SSresSStot=1(yifi)2(yiymean)2(60) (60) r 2 = 1 − S S r e s S S t o t = 1 − ∑ ( y i − f i ) 2 ∑ ( y i − y m e a n ) 2

其它详细内容:https://blog.csdn.net/batuwuhanpei/article/details/51884351

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

02 机器学习中的评估指标 的相关文章

  • 分析函数调用关系图(call graph)的几种方法

    绘制函数调用关系图对理解大型程序大有帮助 我想大家都有过一边读源码 xff08 并在头脑中维护一个调用栈 xff09 xff0c 一边在纸上画函数调用关系 xff0c 然后整理成图的经历 如果运气好一点 xff0c 借助调试器的单步跟踪功能
  • 车载总线系列——CAN总线入门(五)

    我是穿拖鞋的汉子 魔都中坚持长期主义的工程师 老规矩 分享一段喜欢的文字 避免自己成为高知识低文化的工程师 在松弛中打开自己 内心阔朗透气 对外界保持开放度 客气不争 但静守原则 慢慢让自己堆积成形 自性光明 回归正题 本文主要分享车载总线
  • Activiti7各种的坑

    数据库连接的问题 不创建表的问题 xff0c 一运行就发现 org apache ibatis exceptions PersistenceException Error querying database Cause java sql S
  • Git三大特色之Stage(暂存区)

    这是开篇 有人说 xff0c 暂存区是 Git 最精彩的设计 xff0c 同时也是最难理解的部分 xff0c 两者我都感觉不太明显 xff0c 但当我想写关于暂存区的理解后 xff0c 发现的确不怎么好讲 xff0c 这个玩意 xff0c
  • CentOS7.6 上安装 Docker-CE-19.03.05(详细安装步骤)

    Docker 的安装说明 Docker 是一个开源的商业产品 xff0c 有两个版本 xff1a 社区版 xff08 Community Edition xff0c 缩写为 CE xff09 和企业版 xff08 Enterprise Ed
  • 在VMware的虚拟机上安装ProXmoX-VE(PVE)

    1 ProXmoX VE简介 PVE xff08 ProXmoX VE xff09 是一个开源的虚拟化管理软件 xff0c 类似ESXI xff0c 用户可以通过网页的方式来管理服务器 xff0c 使用kvm以及lxc技术运行虚拟机 xff
  • 在Vue3中使用Element Plus时 el-icon无法显示的问题

    问题描述 按照官方文档安装了icons span class token function npm span span class token function install span 64 element plus icons 然后在页
  • 无法定位程序输入点GetOverlappedResultEx 于动态链接库 KERNEL32.dll 上。

    问题说明 在Windows7上安装配置instantclient 19 12用于访问Oracle的客户端 xff0c 在使用sqlplus连接的时候 xff0c 弹出对话框 提示 无法定位程序输入点GetOverlappedResultEx
  • NPM离线包的制作和使用

    说明 常规情况 xff0c node安装依赖库使用npm install命令安装 它会从互联网上的npm中央仓库中下载对应的包文件 但是在有些情况下需要在没有互联网的情况下安装依赖库 xff0c 比如有些公司中 xff0c 开发环境无法直接
  • Ubuntu安装Python3.8

    在ubuntu上安装Python有两种方法 在线安装和源码编译安装 方法1 xff1a 使用apt在线安装 1 更新软件包列表并安装必备组件 xff1a span class token function sudo span span cl
  • 使用免费负载生成器swingbench对oracle数据库进行压力测试(测试Oracle的功能或评估性能)

    1 Swingbench 简介 Swingbench 是一个免费负载生成器 xff08 和基准测试 xff09 xff0c 旨在对 Oracle 数据库 进行压力测试 目前最新版本 Swingbench 2 6 SwingBench 由负载
  • 在CentOS7上升级OpenSSL3和 OpenSSH9.0p1

    1 说明 CentOS7 自带的 OpenSSH 版本 xff08 OpenSSH 7 4p1 OpenSSL 1 0 2k fips 26Jan 2017 xff09 漏扫出很多高 风险漏洞 xff0c 预采用升级处理 xff08 升至
  • 编译升级OpenSSL报错:Can‘t locate IPC/Cmd.pm

    错误信息 span class token punctuation span root 64 dowhere openssl 3 0 3 span class token punctuation span span class token
  • 安装Paddlepaddle2.4.2以后导入模块报错: ImportError: libcudart.so.10.2: cannot open shared object file: No su

    问题描述 在使用 python3 8 安装 paddle 以后 xff0c 测试导入 paddle 报错 创建环境并安装 span class token builtin class name source span activate pa
  • 人工智能导论考前整理-思考题部分

    以下均为个人观点 xff08 也参考资料得到 侵删 xff09 xff0c 仅供参考 xff0c 可考试前用 我们学校的考点是基本都在上面了 xff08 考题雷达嘿嘿 xff09 xff0c 不同学校不太一样 xff0c 以下是我之前考前边
  • 自抗扰控制器中扩张状态观测器的设计

    状态观测器是根据系统的输入输出来确定系统内部状态变量的装置 xff0c 它的示意图如下 xff1a 在自抗扰控制器的设计过程中 xff0c 我们通常把未知的干扰都用 f f f 来表示 xff0c 如果利用状态观测器可以将未知的干扰观测出来
  • 前端页面小图标不显示问题

    这个问题困扰了我好久 xff0c 主要报错是Origin 39 http localhost 39 is therefore not allowed access 等 起因是我引入bootstrap框架后后端页面的一些小图标不显示 xff0
  • Thinkphp审核功能的实现

    审核功能经过几个小时的奋战终于完成了 xff0c 现在我就与广大网友分享我的成果 我定义未审核为 1 xff0c 审核通过为1 xff0c 审核不通过为0 下面请看HTML代码 lt div class 61 34 table respon
  • Thinkphp修改密码的实现

    密码修改是开发中很基础的一个功能 密码修改的HTML代码如下 span span lt form method 61 post class 61 form horizo ntal action 61 gt span span span st

随机推荐

  • 二维数组的输入和输出

    二维数组我知道的有两种方法 第一种方法是平时常见的方法 xff0c 用两个循环 xff0c 例如 for i 61 0 i lt 61 n 1 i 43 43 for j 61 0 j lt 61 n 1 j 43 43 cin gt gt
  • 怎样把网站前端页面扒取

    在网上经常看到一些很好看的页面 xff0c 这些页面其实都可以把代码扒取下来的 xff0c 可以用浏览器的另存为 xff0c 也有一些相应的软件 浏览器扒取 以火狐为例 右键鼠标点击网页另存为 然后保存即可 软件扒取 这种扒取的软件有很多种
  • 算法题1

    假设有这样一个国家 xff0c 其法律规定当公民月收入为x时 xff0c 若x gt 1 则每月应当缴纳的税金为x的因数中除了x之外的最大值 同时该国法律允许公民将月收入分成若干部分 每部分均为整数 xff0c 要求每部分收入都大于1 xf
  • 3.4日期处理

    include lt iostream gt include lt cstdio gt 平年和闰年的每月的天数 int month 13 2 61 0 0 31 31 28 29 31 31 30 30 31 31 30 30 31 31
  • 关于STL和Boost的理解

    xff11 xff0e STL STL是standard Template Library即标准模板库的英文缩写 xff0c 是惠普实验室开发的一系列软件的统称 从根本上讲 STL是一些 容器 的集合 xff0c 这些容器有list vec
  • Ubuntu 各版本号和名称对照

    版本开发代号中译发布日期支持结束时间内核版本桌面版服务器版4 10Warty Warthog多疣的疣猪2004 10 202006 04 302 6 85 04Hoary Hedgehog白发的刺猬2005 04 082006 10 312
  • 【无标题】安装ROS E: 无法定位软件包 ros-melodic-desktop-full

    一 遇到问题 二 可能的原因和解决方法 1 源换一下 xff1a xff08 1 xff09 我是看这位大佬的 5条消息 记录 解决Ubuntu安装ros报错E Unable to locate package ros kinetic de
  • 无线通信原理及协议栈(ZigBee、蓝牙等)解析

    1 天线 说起无线电通信 xff0c 不可不提起天线 在无线电设备中 xff0c 用来辐射和接收无线电波的装置称为天线 在发射端 xff0c 发射机产生的已调制的高频振荡电流 xff08 能量 xff09 经馈电 xff08 指被控制装置向
  • 串口Serial连接方式

    串口Serial连接方式 1 协议终端选择Serial 2 会话选项 xff0c 选择 串行 3 进入电脑 设备管理器 xff0c 查看USB Serial Port以及端口设置 串行选项根据端口设置配置 确定并连接即可
  • tcp/ip 协议栈实现2-socket文件系统

    core initcall sock init net socket c static int init sock init void int err Initialize sock SLAB cache sk init Initializ
  • VMware虚拟机安装Windows11(无需设置TPM密码)

    VMware虚拟机安装Windows11 xff08 无需设置TPM密码 xff09 注意 xff1a 需要新版VMware xff0c 目前小白的版本为 16 2 3 一 新建虚拟机向导 1 新建虚拟机 点击菜单栏文件 新建虚拟机 2 配
  • ROS相关:使用rospy 编写ros程序并使用rosbag存储数据

    为什么使用rospy ROS支持C 43 43 和Python xff0c 由于ROS的底层是由C 43 43 编写 xff0c 因此大多数的ROS程序都使用C 43 43 xff0c 但是Python语言接口简单 xff0c 更容易编写
  • C函数调用过程

    这几天在看GCC Inline Assembly xff0c 在C代码中通过asm或 asm 嵌入一些汇编代码 xff0c 如进行系统调用 xff0c 使用寄存器以提高性能能 xff0c 需要对函数调用过程中的堆栈帧 xff08 Stack
  • 【GitHub】Branches和Tags分别是做什么用的?

    在 GitHub 中 xff0c Branches xff08 分支 xff09 和 Tags xff08 标签 xff09 都是用于版本控制的重要工具 Branches xff08 分支 xff09 可以用来创建一个新的开发分支 xff0
  • git clone 指定分支

    我们在有一个工程的权限后 xff0c 按照常规操作去拉代码 xff0c 往往会拉到默认的master分支 若我们担心master分支拉下来后 xff0c 与其他代码有冲突 xff0c 想直接拉某分支的代码 xff0c 则该怎么操作呢 1 我
  • rocketmq的消息msgId和offsetMsgId

    1 rocketmq的消息发送时 xff0c producer客户端 生成msgId xff08 通过 ip 43 进程 43 自增值 43 当前与系统启动时间差值 xff09 xff0c 有另外的一个叫法uniqId 方法入口 xff1a
  • 算法 - 桶排序(Bucket Sort)

    执行流程 xff1a 创建一定数量的桶 xff08 比如用数组 链表作为桶 xff09 按照一定的规制 xff08 不同类型的数据 xff0c 规则不同 xff09 xff0c 将序列中的元素均匀分配到对应的桶分别对每个桶进行单独排序将所有
  • 测试Pangolin是否安装成功

    一 终端输入 cd Pangolin examples HelloPangolin cmake make HelloPangolin 二 显示这个结果则成功 三 顺便放一个 我可终于装完了ORB SLAM3 被内存不够折腾了好久 换个内存条
  • 交叉编译工具 aarch64-linux-gnu-gcc 的介绍与安装

    AArch64 是随 ARMv8 ISA 一起引入的 64 位架构 xff0c 用于执行 A64 指令的计算机 而且在 AArch64 状态下执行的代码只能使用 A64 指令集 xff0c 而不能执行 A32 或 T32 指令 但是 xff
  • 02 机器学习中的评估指标

    机器学习中的评估指标 1 机器学习的目标 根本目标 xff1a 在给定的训练数据上 xff0c 试图训练出能够归纳数据的规律的模型 xff0c 并且能在未知样本上也有好的效果 泛化能力强的模型最好 能很好地适用于未知样本 xff0c 如错误