模型调优:验证集的作用(就是为了调整超参数)

2023-11-09

一、总结

一句话总结:验证集的作用就是为了调整超参数

1、超参数?

【超参数的值不是学习出来的】:大多数机器学习算法都有超参数,可以设置来控制算法行为。超参数的值不是通过学习算法本身学习出来的。

【超参数如果学习太难优化】:有时一个选项被设为学习算法不用学习的超参数,是因为它太难优化了。更多的情况是该选项必须是超参数,是因为它不适合在训练集上学习。

【超参数是我们自己设定的】:这适用于控制模型容量的所有超参数。如果在训练集上学习超参数,这些超参数总是趋向于最大可能的模型容量,导致过拟合。

2、如何解决超参数设置的问题?

【验证集样本】:为了解决解决超参数设置的问题,我们需要一个训练算法观测不到的验证集样本。

3、测试集不能帮助改善超参数?

【测试样本不能以任何形式参与到模型的选择之中,包括超参数的设定】:测试集可以用来估计学习过程完成之后的学习器的泛化误差,其重点在于测试样本不能以任何形式参与到模型的选择之中,包括超参数的设定,基于这个原因,测试集中的样本不能用于验证集。

【验证集帮助改善超参数】:因此,我们总是从训练数据中构建验证集。用于估计训练中或训练后的泛化误差,更新超参数。

4、模型超参数一般有哪些?

例如学习速率和特征等等

5、验证集是验证还是训练?

训练集用于训练模型的参数,验证集用于训练模型的超参数。不同超参数(hyper-parameter)组合,就对应着不同的潜在模型。验证集上跑的,实际上是一个模型集合,验证集的存在,就是为了从这一堆可能的模型中,找出表现最好的那个。

6、超参数重要性?

超参数包括训练轮数,学习速率等等。如果一个模型,训练数据比别人多得多,效果就会很好(参数训练的很到位),但是模型的架构(超参数设定)未必比别人好。

7、为什么不能在训练集上训练超参数?

好比训练轮数(epochs),在同样的训练集上,训练3轮和训练10轮,结果肯定是不一样的模型。它们的参数并不相同。那么到底是训练3轮好,还是10轮好?或者二者都不好,应该训练6轮?这种决策,只能在训练后,在验证集上见分晓。一般训练几个 epoch 就跑一次验证看看效果,如果发现训练3轮效果更好,那么就应该丢弃掉训练6轮、10轮的潜在模型,只用训练3轮的结果。

再好比网络层数,在训练集上训练的时候肯定是层数越多,拟合效果越好。如果你这样选出你的模型,在验证集上的效果肯定是差很多,这就是过拟合啦。所以必须从训练样本中取出一部分样本,即验证集,让模型训练的过程看不到这些样本,然后评估模型在这一部分样本中的表现,最终选出合适的网络层数。

其他的超参数选取,你也可以举一反三。总之就是按照验证集的效果,来选超参数,从而决定最终模型。

总结一下:在验证集上相当于手动调参(在训练集上是通过误差逆传播自动调参) 

下一步,把模型交给测试集去检验。测试集应该既不同于训练集,又不同于验证集。至于这个最终选择模型,在测试集上表现如何,没人能打包票。就像你模拟考试考得很好了,高考也可能翻车。

怎样划分验证集

怎么设定验证集,划分多少数据做验证,其实是每个研究者需要独立作出的决策,不应该强行设定为一致。

10折交叉验证(10-fold Cross Validation)

选择固定训练集和测试集可能会出现划分偏差

因此将数据集随机分成10份,使用其中9份进行训练而将另外1份用作测试。该过程可以重复10次,每次使用的测试数据不同。

好处一是随即划分减小误差,二是每次采用90%的训练数据而不是2折交叉验证中仅仅50%的数据。

二、超参数和验证集

大多数机器学习算法都有超参数,可以设置来控制算法行为。超参数的值不是通过学习算法本身学习出来的。

有时一个选项被设为学习算法不用学习的超参数,是因为它太难优化了。更多的情况是该选项必须是超参数,是因为它不适合在训练集上学习。这适用于控制模型容量的所有超参数。如果在训练集上学习超参数,这些超参数总是趋向于最大可能的模型容量,导致过拟合。

为了解决这个问题,我们需要一个训练算法观测不到的验证集样本。

测试集可以用来估计学习过程完成之后的学习器的泛化误差,其重点在于测试样本不能以任何形式参与到模型的选择之中,包括超参数的设定,基于这个原因,测试集中的样本不能用于验证集。因此,我们总是从训练数据中构建验证集。特别地,我们将训练数据分成两个不相交的子集。其中一个用于学习参数。另一个作为验证集,用于估计训练中或训练后的泛化误差,更新超参数。用于学习参数的数据子集通常仍被称为训练集,尽管这会和整个训练过程用到的数据集相混。用于挑选超参数的数据子集被称为验证集。

使用测试集和训练集来推动模型开发迭代的流程。在每次迭代时,我们都会对训练诗句进行训练并评估测试数据,兵以基于测试数据的评估结果为指导来选择和更改各种模型超参数,例如学习速率和特征,这种方法是否存在问题?

存在,我们基于给定测试集执行评估的次数越多,不知不觉的过拟合该测试集的风险就越高。

将数据集划分为三个自己可以大幅度降低过拟合的发生几率。

该工作流程之所以更好,是因为它暴露给测试集的信息更少。

不断使用测试集和验证集会使其逐渐失去效果。也就是说,您使用相同数据来决定超参数设置或其他模型改进的次数越多,您对于这些结果能够真正泛化到未见过的新数据的信心就越低。请注意,验证集的失效速度通常比测试集缓慢。

如果可能的话,建议您收集更多数据来刷新测试集和验证集。重新开始是一种很好的重置方式。



验证集真正作用 - 范仁义 - 博客园

验证集到底有什么作用_anyanyanyway的博客-CSDN博客_验证集的作用

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

模型调优:验证集的作用(就是为了调整超参数) 的相关文章

  • 【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 图像 文章
  • 【路径规划】基于A*算法路径规划研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 喜报|华测导航荣获“张江之星”领军型企业称号

    近日 2023年度 张江之星 企业培育名单发布 上海华测导航荣获2023年度 张江之星 领军型企业称号 据悉 张江之星 企业培育是上海科创办为落实 关于推进张江高新区改革创新发展建设世界领先科技园区的若干意见 张江高新区加快世界领先科技园区
  • 什么是充放电振子理论?

    CHAT回复 充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型 这个模型把ENSO现象比喻成一个 热力学振荡系统 在这个模型中 ENSO现象由三个组成部分 充电 Char
  • 基于java的ssh医院在线挂号系统设计与实现

    基于java的ssh医院在线挂号系统设计与实现 I 引言 A 研究背景和动机 基于Java的SSH医院在线挂号系统设计与实现的研究背景和动机 随着信息技术的迅速发展和应用 医院在线挂号系统已成为医院管理的重要组成部分 传统的挂号方式存在许多
  • 链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

    近日 权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点 报道指出 波场TRON网络在2023年取得了一系列的发展和合作 提升了其在Web3领域的地位 其中 波场TRON网络账户数量增加了 54
  • 扬帆证券:三只松鼠去年扣非净利预增超1.4倍

    在 高端性价比 战略驱动下 三只松鼠 300783 重拾增势 1月15日晚间 三只松鼠发布成绩预告 预计2023年度净赢利为2亿元至2 2亿元 同比增加54 97 至70 47 扣非后净赢利为1亿元至1 1亿元 同比增速达146 9 至17
  • 无人机视角、多模态、模型剪枝、国产AI芯片部署

    无人机视角 多模态 模型剪枝 国产AI芯片部署是当前无人机技术领域的重要研究方向 其原理和应用价值在以下几个方面进行详细讲述 一 无人机视角 无人机视角是指在无人机上搭载摄像头等设备 通过航拍图像获取环境信息 并进行图像处理和分析 这种技术
  • 作物叶片病害识别系统

    介绍 由于植物疾病的检测在农业领域中起着重要作用 因为植物疾病是相当自然的现象 如果在这个领域不采取适当的护理措施 就会对植物产生严重影响 进而影响相关产品的质量 数量或产量 植物疾病会引起疾病的周期性爆发 导致大规模死亡 这些问题需要在初
  • 2024 人工智能与大数据专业毕业设计(论文)选题指导

    目录 前言 毕设选题 选题迷茫 选题的重要性 更多选题指导 最后 前言 大四是整个大学期间最忙碌的时光 一边要忙着备考或实习为毕业后面临的就业升学做准备 一边要为毕业设计耗费大量精力 近几年各个学校要求的毕设项目越来越难 有不少课题是研究生
  • AI在保护环境、应对气候变化中的作用

    对于AI生命周期数据领域的全球领导者而言 暂时搁置我们惯常的AI见解和AI生命周期数据内容产出 来认识诸如世界地球日这样的自然环境类活动日 似乎是个奇怪的事情 我们想要知道 数据是否真的会影响我们的地球环境 简而言之 是 确实如此 但作为一
  • AI在广告中的应用——预测性定位和调整

    营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前 从而增加他们购买的可能性 随着时间的推移 营销人员能够深入挖掘越来越精准的客户细分市场 他们不仅具备了实现上述目标的能力 而且这种能力还在呈指数级提升 在AI技术帮助下 现在的营销
  • AI帮助终结全球饥饿问题

    全球饥饿问题是牵动人心的头等大事 5月28日是 世界饥饿日 这一问题更值得关注 让人人都能吃饱的想法不仅令人向往 而且很快就会变成现实 与大多数新事物引进一样 对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用 人们还踟蹰不前
  • AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

    目录 参考 概述 部署安装 环境准备 原理和流程图 一键启动 启动WebAPI 服务 启动WebUI服务 Docker部署
  • 主流进销存系统有哪些?企业该如何选择进销存系统?

    主流进销存系统有哪些 企业该如何选择进销存系统 永久免费 的软件 这个可能还真不太可能有 而且就算有 也只能说是相对免费 因为要么就是数据存量有限 要么就是功能有限 数据 信息都不保障 并且功能不完全 免费 免费软件 免费进销存 诸如此类
  • 蒙特卡洛在发电系统中的应用(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
  • 3D点云检测神技 | UFO来了!让PointPillars、PV-RCNN统统涨点!

    作者 AI驾驶员 编辑 智驾实验室 点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 3D目标检测 技术交流群 本文只做学术分享 如有侵权 联系删文 在这篇论文中提出了一个关于在3D点云中检测未
  • 基于节点电价的电网对电动汽车接纳能力评估模型研究(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码 数据
  • GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

    详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模 第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验 注册与
  • 实力认证!鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

    近日 由中国科学院软件研究所 中科软科技股份有限公司联合主办的 2023中国软件技术大会 于北京成功举办 本届大会以 大模型驱动下的软件变革 为主题 数十位来自知名互联网公司和软件巨头企业的技术大咖 不同领域行业专家 畅销书作者等分享嘉宾

随机推荐

  • Mybatis开发积累的一些好用知识,mapper接口传参详解,源码解析

    Mybaits应该很多的Java开发者都用到了 但是有一些功能想必不少的开发者不能灵活使用 或者使用的时候不理解 使用的时候总犹豫感觉用的迷迷糊糊的 今天就结合源码给大家解决疑惑 mapper接口传参的方式有很多方式 下面会一一列举 最后看
  • JVM常见命令之jinfo

    1 jinfo help 帮助文档 参数说明 pid 对应jvm的进程id executable core 产生core dump文件 server id remote server IP or hostname 远程的ip或者hostna
  • c# 委托的同步调用(invoke)和异步调用(beginvoke)

    using System using System Collections Generic using System ComponentModel using System Data using System Drawing using S
  • css--边框 背景图

    边框 border width 20px 边框的宽度 border style solid dashed dotted double none 边框的样式 solid 实线 dashed 虚线 datted 点划线 double 双实线 n
  • 快速简单带你入门学会STM32串口通信以及USART

    快速简单带你入门学会STM32串口通信以及USART 通信的方式可以分为多种 按照数据传送方式可分为串行通信和并行 通信 按照通信的数据同步方式 可分为异同通信和同步通信 按照数 据的传输方向又可分为单工 半双工和全双工通信 下面我们就来简
  • windows安装nacos步骤,还有那些坑

    废话不多说 问题一一列出 下载nacos Releases alibaba nacos GitHub 1 找到解压目录 输入cmd 回车 执行命令 startup cmd启动 也可以执行startup cmd m standalone 单机
  • 驱动电路(电压驱动、电流驱动)

    1 驱动电路 百度百科 2 基于三极管的继电器驱动电路 电子发烧友网 3 led驱动电路 百度百科 4 驱动电路技术 电子发烧友网 5 详细分析常见开关电源中的7种驱动电路 附有图片 KIA MOS管 6 驱动电路的作用 7 恒流源驱动电路
  • python 判断等于0_Python 条件语句介绍

    Python条件语句是通过一条或多条语句的执行结果 True或者False 来决定执行的代码块 可以通过下图来简单了解条件语句的执行过程 Python程序语言指定任何非0和非空 null 值为true 0 或者 null为false Pyt
  • Qt图形化界面学习之资源文件添加

    首先 我们开始试着用ui界面来进行上节的功能实现 菜单栏 工具栏 状态栏 在菜单栏的二级菜单设计中 名字只能输入英文 创建后再修改为中文 因为文件创建action的时候是按照你输入的英文创建的 我们可以修改text属性来修改名字 改为中文
  • 安卓自动化工具:解锁屏幕+打开支付宝蚂蚁森林+收取能量+种树浇水+自动退出

    安卓自动化工具 解锁屏幕 打开支付宝蚂蚁森林 收取能量 种树浇水 自动退出 一 实现方法 Tasker 定时任务 启动各个部件 Auto js 脚本解锁屏幕 Autoinput 模拟点击屏幕 VirtualXposed 收集能量 遍历好友
  • 微信小程序——未读消息小红点的显示

    显示 tabBar 某一项的右上角的红点 属性 index 是tabBar 的哪一项 从左边算起 wx showTabBarRedDot index 2 效果
  • 【论文阅读】基于深度学习的时序预测——Informer

    系列文章链接 论文一 2020 Informer 长时序数据预测 论文二 2021 Autoformer 长序列数据预测 论文三 2022 FEDformer 长序列数据预测 论文四 2022 Non Stationary Transfor
  • Vue下载txt格式的文件

    2023年07月26日 天气 多云转阴 今天在做导出文件的时候 因包含有txt格式的文件 在导出的时候 浏览器会自动解析txt文件 而不是下载 于是快刀斩乱麻搜索资料 并结合总结 运用项目中 大功告成一半 因为导出时成功了 但txt文件下载
  • 根轨迹法学习

    根轨迹法 随着低频环路增益的变化 追踪闭环传递函数的极点和零点在复平面上的变化趋势 其中相角条件是决定根轨迹的充要条件 s平面上一点若满足相角条件 则一定在根轨迹上 幅值条件为必要条件 再通过幅值方程求出K值 K即为1 betaH中beta
  • 二阶段目标检测介绍

    二阶段目标检测算法 RCNN 家族 是目标检测中最经典的算法之一 有 R CNN gt Fast R CNN gt Faster R CNN 每一代的变化以及目的性都明确 也是目标检测领域二阶段检测必会的算法之一 如果想对目标检测有更多了解
  • VUE 构建清除注释、依赖包版本号

    问题 vue项目构建生成的js文件包含一些注释 里面含使用的依赖包及版本信息 可能会对网站造成危害 那么如何清除掉这些注释呢 解决方法 首先查看项目里webpack的版本号 npm list webpack 根据webpack版本号更新 h
  • Java解析省份城市

    Java解析省份城市 json文件 ps 地址可能不全 仅供参考 格式化导入地址 param address return public String formatAddr String address if address null re
  • 淘宝性能自动化测试平台搭建过程

    导读 ID TOP100case 淘宝网的性能测试自动化平台具备了分布式 高并发 低成本 可扩展等特性的性能测试平台工具 它包括性能项目管理 环境管理 脚本管理 场景管理 任务管理 监控管理 结果管理等模块 以及前端性能测试模块 性能测试报
  • 解决Makefile: recipe for target ‘xxx‘ failed

    author daisy skye的博客 CSDN博客 嵌入式 Qt Linux领域博主 问题 在android编译Kernel调用makefile引起的recipe for target 很多文章写的是由于编译文件路径引起或者是makef
  • 模型调优:验证集的作用(就是为了调整超参数)

    一 总结 一句话总结 验证集的作用就是为了调整超参数 1 超参数 超参数的值不是学习出来的 大多数机器学习算法都有超参数 可以设置来控制算法行为 超参数的值不是通过学习算法本身学习出来的 超参数如果学习太难优化 有时一个选项被设为学习算法不