Deep Learning 最优化方法之Momentum(动量)

2023-05-16

本文是Deep Learning 之 最优化方法系列文章的Momentum(动量)方法。主要参考Deep Learning 一书。

整个优化系列文章列表:

Deep Learning 之 最优化方法

Deep Learning 最优化方法之SGD

Deep Learning 最优化方法之Momentum(动量)

Deep Learning 最优化方法之Nesterov(牛顿动量)

Deep Learning 最优化方法之AdaGrad

Deep Learning 最优化方法之RMSProp

Deep Learning 最优化方法之Adam

先上结论:

1.动量方法主要是为了解决Hessian矩阵病态条件问题(直观上讲就是梯度高度敏感于参数空间的某些方向)的。

2.加速学习

3.一般将参数设为0.5,0.9,或者0.99,分别表示最大速度2倍,10倍,100倍于SGD的算法。

4.通过速度v,来积累了之间梯度指数级衰减的平均,并且继续延该方向移动:

这里写图片描述

再看看算法:
这里写图片描述

动量算法直观效果解释:

  如图所示,红色为SGD+Momentum。黑色为SGD。可以看到黑色为典型Hessian矩阵病态的情况,相当于大幅度的徘徊着向最低点前进。
  而由于动量积攒了历史的梯度,如点P前一刻的梯度与当前的梯度方向几乎相反。因此原本在P点原本要大幅徘徊的梯度,主要受到前一时刻的影响,而导致在当前时刻的梯度幅度减小。
  直观上讲就是,要是当前时刻的梯度与历史时刻梯度方向相似,这种趋势在当前时刻则会加强;要是不同,则当前时刻的梯度方向减弱。

这里写图片描述

从另一个角度讲:

  要是当前时刻的梯度与历史时刻梯度方向相似,这种趋势在当前时刻则会加强;要是不同,则当前时刻的梯度方向减弱。
  假设每个时刻的梯度g总是类似,那么由这里写图片描述我们可以直观的看到每次的步长为:

这里写图片描述

即当设为0.5,0.9,或者0.99,分别表示最大速度2倍,10倍,100倍于SGD的算法。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Deep Learning 最优化方法之Momentum(动量) 的相关文章

随机推荐

  • 使用Linux可视化远程工具Remmina来实现远程桌面共享(RDPP快速平台部署计划)

    Remmina 功能不在阐述 xff0c 如果你想远程共享桌面 xff0c Remmina 绝对是一个不错的工具 xff0c 我指的不是它有多强大 xff0c 而是它再强大的同时还提供了比较良好的用户界面 xff0c 并且简化了远程桌面的操
  • Linux Sleep命令暂停Bash脚本

    Bash脚本在Linux在为寻常不过了 xff0c 就如Windows上的bat文件一样 xff0c 那么有些人在运行bash脚本时 xff0c 循环和想暂停怎么做这就要用到Linux中的 sleep命令 xff0c 故名思意sleep x
  • 与其他数据库相比,MySQL的特点

    与其他数据库系统相比 xff0c MySQL有点与众不同 1 MySQL并不完美 xff0c 却足够灵活 xff0c 能够适应高要求的环境 xff0c 例如Web类应用 2 MySql既可以嵌入式到应用程序中 xff0c 也可以支持数据仓库
  • MySQL服务器逻辑架构分析

    MySQL逻辑架构大致分为三层 最上层 xff0c 大多数基于网络的客户端 服务器的工具或者服务都有类似的架构 比如链接处理 授权认证 安全等等 第二层架构 xff0c 大多数MySQL的核心服务功能都在这一层 xff0c 所有跨存储引擎的
  • (一)Android与Java语言有什么关系?

    Java编程语言与Java平台是两个完全不同的概念 前者泛指一系列编程的语法 xff0c 而后者包括前者 xff0c 同时又超出前者的范围 一般而言 xff0c Java平台由三部分组成 xff0c 分为核心的Java API xff08
  • 记一次因gstreamer安装错误导致的系统报错

    问题出现 xff1a 前一天无脑安装gstreamer xff0c 按照网上杂七杂八的教程一通乱装 xff0c 最后死于qt gstreamer安装 第二天发现 xff0c 进入系统设置后 xff0c 点击 详细信息 无效 xff1a 第一
  • Kotlin扩展插件 kotlin-android-extensions

    Kotlin扩展插件 kotlin android extensions 在学习第一行代码第三版的时候 xff0c 发现书中有提到 kotlin android extensions这个插件 xff0c 可以直接使用布局中的控件id来操作v
  • linux软件管理

    1 使用网络安装资源安装软件 1 切换目录 cd etc yum repos d 2 建立文件 vim westos repo 文件必须以 repo结尾 redhat 仓库名称 name 61 haha 对软件源的描述 baseurl 61
  • 移除JSONArray中匹配的元素

    移除JSONArray中匹配的元素 helper isBookOrChange获取类中isBookOrChange值 64 param jarr 64 return 64 author taiyang public JSONArray ge
  • 移动平均法又称滑动平均法、滑动平均模型法(Moving average,MA)

    转自http jingji 100xuexi com view otdetail 20130625 230f09b0 6e36 473b 8830 7f2b873a5252 html 什么是移动平均法 移动平均法是用一组最近的实际数据值来预
  • centos7 结束多pid同名进程脚本文件

    centos7 结束多pid同名进程脚本文件 创建脚本 vi k sh 输入脚本内容 PIDS 61 96 ps e awk 39 0 9 0 9 0 9 39 1 39 printf 34 d 34 1 39 96 echo PIDS k
  • Docker之Linux(Centos)安装

    系统 Docker官网 Home Docker 关闭防火墙和关闭SELinux都是因为我使用虚拟机安装了纯净的centos系统 非必需 关闭防火墙 systemctl stop firewalld service 关闭防火墙 systemc
  • 微信小程序开发工具格式化代码快捷键以及更改快捷键

    Alt 43 Shift 43 f 如果不喜欢默认可以自定义更改 注意事项
  • 最新UNI-APP 安卓本地(离线)打包(图文详细教程)

    uni app 官方文档地址 原生开发者支持 Android Studio 下载地址 xff1a Download Android Studio and SDK tools Android Developers App离线SDK下载 xff
  • Git 命令行学习笔记( 图解 )

    Git 官网 分布式版本控制工具 可以团队协作合作开发 代码合并等 github 和 国产 码云gitee 都是代码托管工具就是远程仓库 下载可以去官网或者去腾讯软件中心下载 官网有时候下载很慢 腾讯软件中心 如果有腾讯电脑管家直接管家下载
  • Laravel安装与初始化

    下载Laravel 使用 composer 安装 首先composer切换成中国镜像 下载更快 composer config g repo packagist composer https packagist phpcomposer co
  • 虚拟机安装Centos图文安装教程

    清华大学开源软件镜像站 Tsinghua Open Source Mirror 清华镜像 http mirrors aliyun com 阿里云镜像 vm虚拟机下载 VMware虚拟机中文版官方下载 虚拟机 华军软件园 虚拟机 安装 错误1
  • 虚拟机LNMP图文安装教程(一)

    xshell 链接虚拟机 centos 7 ip addr 查看本地IP地址 安装LNMP LNMP 官网 LNMP一键安装包 CentOS RadHat Debian Ubuntu下自动编译安装Nginx PHP MySQL PHPMyA
  • 虚拟机LNMP操作记录(二)

    netstat nltp 查看当前端口 LNMP php多版本 lnmp文件目录里 运行 install sh mphp MySQL连接 更换环境变量的PHP版本 cd usr bin ll grep php rm rf php php f
  • Deep Learning 最优化方法之Momentum(动量)

    本文是Deep Learning 之 最优化方法系列文章的Momentum xff08 动量 xff09 方法 主要参考Deep Learning 一书 整个优化系列文章列表 xff1a Deep Learning 之 最优化方法 Deep