深度学习激活函数和权值初始化

2023-10-30

激活函数选择总结

         尽量选择ReLU函数或者Leakly ReLU函数,相对于Sigmoid/tanh,ReLU函数或者Leakly ReLU函数会让梯度流更加顺畅,训练过程收敛得更快。

权值初始化总结

        好的初始化方法可以防止前向传播过程中的信息消失,也可以解决反向传递过程中的梯度消失。

        激活函数选择双曲正切或者Sigmoid时,建议使用Xaizer初始化方法;

        激活函数选择ReLU或Leakly ReLU时,推荐使用He初始化方法。

过拟合现象

        出现过拟合,得到的模型在训练集上的准确率很高,但在真实的场景中识别率确很低。

过拟合与欠拟合

        过拟合——是指学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测的很好,但对未知数据预测得很差的现象。这种情况下模型可能只是记住了训练集数据,而不是学习到了数据特征。

        欠拟合——模型描述能力太弱,以至于不能很好地学习到数据中的规律。产生欠拟合的原因通常是模型过于简单。

机器学习的根本问题是优化和泛化问题

        优化——是指调节模型以在训练数据上得到最佳性能;

        泛化——是指训练好的模型在前所未见的数据上的性能好坏。

应对过拟合

        最优方案——获取更多的训练数据

        次优方案——调节模型允许存储的信息量或者对模型允许存储的信息加以约束,该类方法也称为正则化。

                调节模型大小

                约束模型权重,即权重正则化(常用的有L1、L2正则化)

                随机失活(Dropout)

神经网络中的超参数

超参数:网络结构——隐层神经元个数,网络层数,非线性单元选择等

              优化相关——学习率、dropout比率、正则项强度等

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习激活函数和权值初始化 的相关文章

随机推荐

  • SQL语句中case、when、then的使用

    使用语法为 select pro id AS id pro title AS title pro name AS name pro ltime AS ltime pro place AS place pro linkman AS linkm
  • 【100天精通Python】Day58:Python 数据分析_Pandas时间序列数据处理,创建和解析时间数据pd.to_datetime(),.loc[],resample() 用法示例

    目录 时间序列数据处理 1 解析日期和时间数据 2 创建时间索引 3 访问时间索引数据 3 1 按年 月 日等级别访问数据 loc 3 2 使用部分日期作为索引 loc loc 3 3 使用时间索引的属性 index 4 时间索引的切片 5
  • 51单片机入门教程(2)——实现流水灯

    51单片机入门教程 2 实现流水灯 一 搭建流水灯电路 二 流水灯程序 2 1 延时程序 2 2 延时函数 2 3 按字节寻址 2 4 逻辑移位 2 5 条件判断 一 搭建流水灯电路 在Proteus中搭建流水灯电路如图 二 流水灯程序 我
  • 为什么我这么累?

    本月十六日 我和媳妇喜爱的歌手姚贝娜去世了 你是个好歌手 真正的热爱音乐 希望你在天堂里面开心的唱歌 我是个参加工作不久的小程序员 过着家 地铁 公司三点一线的生活 每天早上七点二十出门 地铁上一个多小时 8点五十到公司 下午六点下班 一个
  • 【FreeRTOS 信号量】互斥信号量

    互斥信号量与二值信号量类似 但是互斥信号量可以解决二值信号量出现的优先级翻转问题 解决办法就是优先级继承 普通互斥信号量创建及运行 参阅安富莱电子demo 互斥信号量句柄 static SemaphoreHandle t xMutex NU
  • 卷积神经网络中卷积层、池化层、全连接层的作用

    1 卷积层的作用 卷积层的作用是提取输入图片中的信息 这些信息被称为图像特征 这些特征是由图像中的每个像素通过组合或者独立的方式所体现 比如图片的纹理特征 颜色特征 比如下面这张图片 蓝色框框住的地方就是脸部特征 这些特征其实是由一个个像素
  • 消息鉴别码的原理与应用

    消息鉴别码可以确认自己收到的消息是否就是发送者的本意 也就是说 使用消息鉴别码可以判断消息是否被篡改 以及是否有人伪装成发送者发送该消息 消息鉴别码实现鉴别的原理是 用公开函数和密钥产生一个固定长度的值作为认证标识 用这个标识鉴别消息的完整
  • uml活动图

    活动图与交互图的区别 交互图强调的是对象到对象的控制流 而活动图则强调的是从活动到活动的控制流 初始节点和活动终点 用一个实心圆表示初始节点 用一个圆圈内加一个实心圆来表示活动终点 活动节点 是活动图中最主要的元素之一 它用来表示一个活动
  • 基于CNN的人脸表情识别系统

    基于CNN的人脸表情识别系统 主要功能 1 图片识别 可以通过上传本地图片 进行表情识别 2 拍照识别 点击拍照识别按钮 可以调用摄像头实现拍照 并进 行表情识别 实现原理 1 表情库的建立 fer2013人脸数据集 可以从kaggle网站
  • 上/下采样的方法

    下采样方式一般使用池化 pooling 操作 上采样 upsampling 的三种方式 插值法 Interpolation 插值就是在周围像素色彩的基础上用数学公式计算补充插入像素点的色彩 但必须注意的是插值并不能增加图像信息 如双线性插值
  • 数字电子技术-逻辑门电路

    文章目录 一 理想开关 二 基本CMOS逻辑门电路 2 1 MOS管开关特性 2 2 CMOS反相器 2 3 常用CMOS逻辑门电路 2 4 CMOS传输门 2 5 CMOS漏极开路门和三态输出门电路 2 6 CMOS逻辑门电路的重要参数
  • 写一个GitHub图床

    刚刚完成一个作业 涉及到图片的上传服务 因为自己经常会有一些图片管理的需求 七牛云 阿里云的oos存储又是付费的 所以自己根据GitHub的官方API搭建一个自己的图床服务 以便后续自己开发使用 参考地址 GitHubAPI import
  • GoLang - colly爬虫框架

    大家好 我是TheWeiJun 很高兴又和大家见面了 国庆假期马上就要结束了 在国庆假期里小编看了下colly框架 故这篇文章中将提到colly的使用及分析 欢迎各位读者多多阅读与交流 特别声明 本公众号文章只作为学术研究 不作为其它不法用
  • 实践安装minio

    一 下载安装文件 1 在home目录下创建minio文件夹 mkdir home minio 2 进入 home minio 文件夹 cd home minio 3 下载文件 此处下载比较慢 建议手动下载 然后上传到目录中 wget htt
  • springboot集成nacos配置中心踩坑记录

    目录 1 下载安装 准备 下载地址 可以尝试选择最新版本 解压 2 添加数据库配置 特别注意 3 登陆nacos添加配置 4 springboot项目中获取配置中心配置 1 引入依赖 2 创建bootstrap yaml配置文件 3 启动注
  • 在嵌入式板子ARMv7 上利用neon对彩色图转换为灰度图进行加速

    RGB转GRAY公式如下 本实验通过对一张1920 1080 分辨率大小RGB彩色图进行灰度图转换测试耗时时间 测试条件为 嵌入式开发板ssc9381g A7 通过四种转换方式进行耗时对比 结果如下 方式1 通过opencv 库函数cvtC
  • 线程池异常java.util.concurrent.RejectedExecutionException

    问题及代码 使用 ThreadPoolExecutor 自定义线程池时 出现java util concurrent RejectedExecutionException的错误信息 源代码如下 public static void main
  • JVM系列(二) Java 堆内存分析

    Java 堆内存分析 堆是GC 垃圾收集器 执行垃圾回收的重点区域 所以今天我们着重讲下堆内存 自己的项目 如果出现OOM或者出现内存泄露 一定是出在堆内存上 因为堆是JVM中最大的一块内存空间 所有线程共享Java堆 物理上不连续的逻辑上
  • Vue/cli 3.0中使用百度地图api

    1 申请百度地图ak ak会在引入百度js的时候用到 你可以点击这里申请一个唯一ak 2 引入百度地图js 在public index html里面添加下面代码 注意把 你的ak 替换成你申请的ak 复制代码 3 配置webpack 由于c
  • 深度学习激活函数和权值初始化

    激活函数选择总结 尽量选择ReLU函数或者Leakly ReLU函数 相对于Sigmoid tanh ReLU函数或者Leakly ReLU函数会让梯度流更加顺畅 训练过程收敛得更快 权值初始化总结 好的初始化方法可以防止前向传播过程中的信