梯度下降法的推导(非常详细、易懂的推导)

2023-11-15

原作者: 红色石头 | 来自: AI有道
梯度下降 算法的公式非常简单,”沿着梯度的反方向(坡度最陡)“是我们日常经验得到的,其本质的原因到底是什么呢?为什么局部下降最快的方向就是梯度的负方向呢?也许很多朋友还不太清楚。没关系,接下来我将以通俗的语言来详细解释梯度下降算法公式的数学推导过程。
下山问题
假设我们位于黄山的某个山腰处,山势连绵不绝,不知道怎么下山。于是决定走一步算一步,也就是每次沿着当前位置最陡峭最易下山的方向前进一小步,然后继续沿下一个位置最陡方向前进一小步。这样一步一步走下去,一直走到觉得我们已经到了山脚。这里的下山最陡的方向就是梯度的负方向。
首先理解什么是梯度?通俗来说,梯度就是表示某一函数在该点处的方向导数沿着该方向取得较大值,即函数在当前位置的导数。
其中,θo是自变量参数,即下山位置坐标,η是学习因子,即下山每次前进的一小步(步进长度),θ是更新后的θo,即下山移动一小步之后的位置。
一阶泰勒展开式
这里需要一点数学基础,对泰勒展开式有些了解。简单地来说,一阶泰勒展开式利用的就是函数的局部线性近似这个概念。我们以一阶泰勒展开式为例:
不懂上面的公式?没有关系。我用下面这张图来解释。
凸函数f(θ)的某一小段[θo,θ]由上图黑色曲线表示,可以利用线性近似的思想求出f(θ)的值,如上图红色直线。该直线的斜率等于f(θ)在θo处的导数。则根据直线方程,很容易得到f(θ)的近似表达式为:
这就是一阶泰勒展开式的推导过程,主要利用的数学思想就是曲线函数的线性拟合近似。
梯度下降数学原理
知道了一阶泰勒展开式之后,接下来就是重点了!我们来看一下梯度下降算法是如何推导的。
想要两个向量的乘积小于零,我们先来看一下两个向量乘积包含哪几种情况:
A和B均为向量,α为两个向量之间的夹角。A和B的乘积为:
总结
我们通过一阶泰勒展开式,利用线性近似和向量相乘最小化的思想搞懂了梯度下降算法的数学原理。也许你之前很熟悉梯度下降算法,但也许对它的推导过程并不清楚。看了本文,你是否有所收获呢?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

梯度下降法的推导(非常详细、易懂的推导) 的相关文章

  • git push提交报错文件过大,且去掉大文件也报同样的错误(转)

    错误原因 大文件存在没有被提交的commit记录里面 解决方案 删除有大文件的commit记录即可移除大文件的正确姿势 git rm cached giant file 文件名 Stage our giant file for remova
  • 三种常见的卷积概述(线性卷积周期卷积圆周卷积)

    note 2020 07 26搬运 下面的内容来自我的公众号 yhm同学 upd 2020 10 18 推荐学习辅助用书 江志红的 深入浅出数字信号处理 有别于学院派的教材 这本书讲得比较易懂清楚 upd 2020 10 18 数字信号处理
  • 【收藏向】一文弄懂什么是ERC20

    本文只做技术探讨 谨防数字加密货币炒作风险 Token Token 即通证 是以数字形式存在的权益凭证 它代表的是一种权利 一种固有和内在的价值 货币 积分 股票等权益证明 都可以由通证来代表 它代表着数字资产 下图就是在 opensea
  • 搜索引擎算法系列-BloomFilter算法解析及扩展算法

    通常存在下面的一些存在性检查方法 1 使用Set
  • QT--emit

    本文为学习记录 若有错误 请联系作者 谦虚受教 文章目录 前言 一 emit 二 相关代码 1 h文件 2 cpp文件 总结 前言 要努力 但是不要急 繁花锦簇 硕果累累都需要过程 一 emit emit是不同窗口 类间的触发信号 当对象改
  • 主线科技拿下数亿元新融资,自动驾驶卡车迎来拐点

    自图森未来敲响了自动驾驶公司上市的第一钟后 自动驾驶卡车赛道似乎迎来了非常不错的拐点 一批科技公司在产品落地 商业模式上也形成了独特的竞争优势 比如主线科技 其不仅率先实现了超百台港口无人驾驶集卡的交付 港口无人驾驶 去安全员 的常态化运营
  • 想用好虚幻4引擎做游戏,你需要避免这些扰人的坑(备忘)

    在手游品质越发上扬的如今 已经有不少厂商开始使用一些性能更好的引擎 去尝试游戏制作了 而虚幻4引擎 以下简称UE4 就是其中之一 在这款引擎中已经诞生了诸如 铁拳7 地狱之刃 帕拉贡 等一系列大作 对玩家而言 这些作品都是不折不扣的视觉盛宴
  • gitlab修改密码后无法pull的解决方法

    在登录gitlab的时候发现密码忘记了 在重新设置了密码之后 git无法pull代码 需要改windows下的凭据管理器中对应gitlab地址的凭据密码 把密码修改成你的新密码 个人建的交流群1125844267 欢迎大家加入 如果内容对大
  • OpenGL文字渲染的实例(C/C++)

    OpenGL文字渲染的实例 C C 在计算机图形学中 文字渲染是一个常见的任务 它涉及将字符或文本字符串呈现在屏幕上 OpenGL是一个广泛使用的图形库 它提供了强大的功能来渲染2D和3D图形 并且也支持文字渲染 本文将介绍如何使用Open
  • springboot 没有找到service_Spring Boot 应用程序五种部署方式

    翻译自 Deploying Spring Boot Applications 1 原作者 Murat Artim 2 可以使用各种方法将 Spring Boot 应用程序部署到生产系统中 在本文中 我们将通过以下 5 种方法来部署 Spri
  • 卡尔曼滤波之线性滤波,标量滤波

    卡尔曼滤波器由一系列递归数学公式描述 它们提供了一种高效可 计算的方法来估计过程的状态 并使估计均方误差最小 卡尔曼滤波 器应用广泛且功能强大 它可以估计信号的过去和当前状态 甚至能 估计将来的状态 即使并不知道模型的确切性质 对于Kalm
  • JAVA 快速排序算法(详细实现过程介绍)

    快速排序采用了一种分治的策略 通常称其为分治法 Divide and ConquerMethod 空间复杂度 快速排序是一种原地排序 只需要一个很小的栈作为辅助空间 空间复杂度为O log2n 所以适合在数据集比较大的时候使用 时间复杂度
  • 右腿驱动电路

    转自 http www 360doc com content 18 0312 15 1751130 736374982 shtml 1 使用目的 人和外界环境 尤其是电力线会形成容性耦合 这个耦合到的能量通过人体流入大地 而人体是带电阻的
  • 最全的目标检测与跟踪发展文献综述

    实时目标检测技术作为计算机视觉领域的重要研究方向之一 他在军事侦察 视频监控 智能战斗等领域有着重要的应用场景 随着深度学习的发展和硬件水平的提升 各种深度学习的算法对于航空影响的自动化起到了巨大的推动作用 基于深度神经网络的视觉算法通过自
  • 装饰者模式---装饰者模式和桥接模式的区别

    装饰者模式 什么是装饰者模式 动态将职责附加到对象上 若要扩展功能 装饰者提供了比继承更具弹性的代替方案 装饰者模式又称为包装模式 它主要是为了扩展对象的功能 包装类通过持有对象的引用 将对象传到包装类里面 聚合 把对象包装起来 可以在调用
  • 【数学建模】灰度预测之关联度求解

    灰度预测适用范围 在实际中 若得到的是离散的 规律性不强的数据 此时线性回归就不适用了 我们需要采用灰度预测的方法 灰度预测法则是一种对含有不确定因素的系统进行预测的方法 白色系统 黑色系统 灰色系统 白色系统 指一个系统的内部特征是完全已
  • TP6关于hasOne的用法

    TP6关于hasOne的用法 实际操作中看如下案例 文章分类表 CREATE TABLE case category id bigint 20 unsigned NOT NULL AUTO INCREMENT COMMENT 主键id na
  • GO语言网络编程(并发编程)Channel

    GO语言网络编程 并发编程 Channel 1 Channel 1 1 1 Channel 单纯地将函数并发执行是没有意义的 函数与函数间需要交换数据才能体现并发执行函数的意义 虽然可以使用共享内存进行数据交换 但是共享内存在不同的goro
  • hmcl启动器安装游戏版本失败_有关HMCL的个人粗糙介绍

    简单介绍关于HMCL Hello Minecraft Launcher 受欢迎的 Minecraft 启动器的使用 github https github com huanghongxun HMCL releases 1 使用前的一些调试

随机推荐

  • 「问题记录|VirtualBox」OSX系统启动就异常退出的问题

    背景说明 需要一个OSX系统进行软件打包 原本想在docker中进行 奈何电脑配置不够格 所以还是回归VirtualBox的怀抱 这里记录一个小操作 问题描述 虚拟机启动后加载完毕后闪退 快到甚至有可能没看到窗口 然后就看到侧边列表的虚拟机
  • Python USB通讯

    1 下载libusb 地址 Releases libusb libusb GitHub 下载7z压缩包文件到本地 解压后将32位版本的dll文件拷贝到C Windows System32 64位的dll文件拷贝到C Windows SysW
  • pytorch中的二分类及多分类交叉熵损失函数

    本文主要记录一下pytorch里面的二分类及多分类交叉熵损失函数的使用 import torch import torch nn as nn import torch nn functional as F torch manual seed
  • bin目录下存放的是什么文件?

    bin文件夹通常里面都是什么文件 经常使用电脑系统安装程序的朋友可能会发现 很多软件在安装后都会产生一个bin文件夹 那么bin文件夹是什么 里面大多放着什么文件呢 下面我们来学习一下 避免一些错误的认知导致程序损坏等误操作 软件的安装后文
  • activiti5.17.0流程图及节点显示

    引用 activiti流程图上获取各节点的信息获取 这篇文章写得很好 揭示了图片点击出现信息的方法 于是我也做了 只不过有些改动 可能是activiti的版本不同的原因 jsp页面 通过流程实例id进行操作
  • 【从嵌入式视角学习香山处理器】四、Chisel语言基础

    文章目录 一 前言 二 Linux上对scala工程的操作 1 helloworld执行命令 2 有多个工程目录时 需要切换工程 3 编译报错 4 给vscode的scala插件设置JAVA HOME路径 三 ch4 基本组成部分 ch4
  • 第二章实验1

    周末没事正好练习下 前边 r原以为是只查看cpu寄存器内容 原来还有修改的意思 只用r即查询 用r 寄存器 则是修改该寄存器 不只是可以修改ax 可以修改其他寄存器 d 段地址 偏移地址 查看内存内容 最左边是每行的起始地址 中间是从指定内
  • dev-tool安装方法(手动安装版)

    记录一下vue调试神器dev tool的安装过程 由于是在公司内网 也不方便挂梯子 所以手动安装 下载源码在本地编译 再添加扩展程序的方式安装 过程如下 一 dev tool源码获取 git地址 https github com vuejs
  • Git分支管理策略

    原文地址 http www ruanyifeng com blog 2012 07 git html 如果你严肃对待编程 就必定会使用 版本管理系统 Version Control System 眼下最流行的 版本管理系统 非Git莫属 相
  • 通过post请求下载接口,接口返回流数据,前端处理下载或展示出错信息

    需求描述 1 使用post请求 参数放在请求体内 所以不能用get请求 2 后端返回流 二进制数据 前端自己处理下载 3 如果后端出错 后端返回json数据 前端处理 展示错误内容 实现 1 后端需要设置 response Content
  • 攻防世界--web--新手区

    攻防世界 web 新手区 0x01 view source 题目描述 X老师让小宁同学查看一个网页的源代码 但小宁同学发现鼠标右键好像不管用了 解题思路 进去之后显示FLAG is not here 然后就按F12查看Elements选项
  • 计算机网络---应用层概述

    一 应用层概述 基本定义 应用层 Application layer 是OSI模型的第七层 应用层直接和应用程序接口并提供常见的网络应用服务 应用层也向表示层发出请求 应用层是开放系统的最高层 是直接为应用进程提供服务的 其作用是在实现多个
  • TVM Relay softmax算子调度分析

    https github com apache tvm pull 8909 files 计算 调度分离 TOPI中的算子分为其算子的定义和算子的schedule两部分 算子的定义是唯一的 而对于不同的后端 x86 cuda等 schedul
  • 论文笔记:A Time Series is Worth 64 Words: Long-term Forecasting with Transformers

    ICLR 2023 比较简单 就不分intro model这些了 1 核心思想1 patching 给定每个时间段的长度 划分的stride 将时间序列分成若干个时间段 时间段之间可以有重叠 也可以没有 每一个时间段视为一个token 1
  • B - Can you solve this equation?(简单二分)

    Can you solve this equation Time limit 1000 ms Memory limit 32768 kB OS Windows Problem Description Now given the equati
  • C语言【二分查找】详解

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 二分 文章目录 前言 一 二分查找 的步骤 二 二分查找 的注意事项 三 举例详解 二分查找 前言 一 二分查找 步骤 二 二分查找 的注意事项 三 举例详细讲解 二分查找
  • redis使用rightPushAll保存List,List的size为1

    redis使用rightPushAll保存List List的size为1 问题描述 问题定位 解决方案 问题疑惑 问题描述 使用RedisTemplate保存List 期望是直接将Java的List直接转换redis的list 但是rig
  • C++智能指针简介

    C 智能指针简介 一 简介 前言 从C到C C malloc 和 free C new 和 delete 从C 到Morden C C new 和 delete morden C shared ptr unique ptr 和 weak p
  • IDEA创建Zookeeper客户端

    IDEA创建Zookeeper客户端 解决单机Zookeeper的错误 不是Zookeeper集群问题 但是集群问题也可以参考 网上看到的教程基本上都是服务器端口号 防火墙的问题 但是个人测试之后发现没有解决问题 于是自己尝试一下方法 最后
  • 梯度下降法的推导(非常详细、易懂的推导)

    原作者 红色石头 来自 AI有道 梯度下降 算法的公式非常简单 沿着梯度的反方向 坡度最陡 是我们日常经验得到的 其本质的原因到底是什么呢 为什么局部下降最快的方向就是梯度的负方向呢 也许很多朋友还不太清楚 没关系 接下来我将以通俗的语言来