BP算法公式推导

2023-05-16

W^l_{ji}表示第l-1层的第i个神经元到第l层的第j个神经元的连接权值,x^l_j表示第l层第j个神经元的输入,y^l_j表示第l层第j个神经元的输出,\Theta^l_j表示l层第j个神经元的偏置,C表示代价函数,

则有:

x^l_j = \sum _k w^l_{ji}y^{l-1}_i + \Theta ^l_j

y^l_j = f\left ( x^l_j \right )

其中,f\left ( \cdot \right )表示激活函数。训练多层网络的目的就是使代价函数C最小化.

定义代价函数为:

C= \frac{1}{2}\left \| Y-y^L \right \|^2

可以看出,这个函数依赖于实际的目标值Yy^L可以看成权值和偏置的函数,通过不断的修改权值和偏置值来改变神经网络的输出值.

接下来更新权值和偏置:

首先定义误差\delta,令\delta ^l_j表示第l层第j个神经元上的误差(?),定义为

\large \delta ^l_j = \delta x^l_j = \frac{\partial C}{\partial x^l_j}

由链式求导法则可得输出层的误差方程为:

\large \delta ^l_j = \delta x^l_j = \frac{\partial C}{\partial y^l_j}{f \left(x^l_j\right)}'

因为当前层神经元的输出是上一层神经元输出的线性组合,由链式法则可通过下层神经元的误差来表示当前层的误差:

\large \delta ^l_j = \delta x^l_j = \frac{\partial C}{\partial x^l_j} = \sum _i \frac{\partial C}{\partial x^{l+1}_i} \frac{\partial x^{l+1}_i}{\partial x^l_j} = \sum _i \frac{\partial x^{l+1}_i}{\partial x^l_j} \delta x^{l+1}_i   # 建立了 前一层误差 和 后一层误差的关系

又因为: 建立了 \large x^{l+1}_i\large x^l_i的联系

\large x^{l+1}_i = \sum _j w^{l+1}_{ij} y^l_j + \theta ^{l+1}_i = \sum _j w^{l+1}_{ij} f\left(x^l_j \right ) + \theta ^{l+1}_i

\large x^l_j求偏导,可得:

\large \frac{\partial x^{l+1}_i}{\partial x^l_j} = w^{l+1}_{ij} f'\left(x^l_j \right )

故有:   前一层误差 和 后一层误差的关系推导

\large \delta ^l_j = \sum _i w^{l+1}_{ij} f'\left(x^l_j \right ) \delta^{l+1}_i

权重和偏置更新公式:

\large \frac{\partial C }{ \partial w^l_{ji}} = \frac{\partial C}{\partial x^l_j} \frac{\partial x^l_j}{\partial w^l_{ji}} = \delta ^l_j y^{l-1}_i

\large \frac {\partial C}{\partial \theta ^l_j} = \frac{\partial C}{\partial x^l_j}\frac{\partial x^l_j}{\partial \theta ^l_j} = \delta^l_j

由梯度下降法可得到更新规则为:

\large w^l_{ji} = w^l_{ji} - \alpha \frac{\partial C}{\partial w^l_{ji}} = w^l_{ji} - \alpha \delta^l_j y^{l-1}_i

\large \theta ^l_j = \theta ^l_j - \alpha\frac{\partial C}{\partial \theta^l_j} = \theta^l_j - \alpha \delta ^l_j

BP反向传播的过程;

 

 

 

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BP算法公式推导 的相关文章

  • CentOS服务器署Springboot的java项目最简单操作步骤

    CentOS服务器署Springboot的java项目最简单操作步骤 准备工作 1 首先本地有一个能跑起来正常的 java 项目的 jar 包 2 有一个前端项目 可以仅是一个 index html 文件 3 需要备案好的域名 可选 否则只
  • SQL Server 定时备份

    前言 由于公司的业务需求 xff0c 防止数据丢失 xff0c 防止意外发生 所以需要备份 xff0c 之前没搞过这玩意儿 xff0c 所以自己动手先练习一下 开始 启动SQL Server 代理服务 xff08 确保SQL Server
  • SSIS数据定时同步方案

    第一次接触到SSIS xff0c 借此机会学习一下 SSIS是Microsoft SQL Server Integration Services的简称 xff0c 是生成高性能数据集成解决方案 xff08 包括数据仓库的提取 转换和加载 E
  • SQL Server数据库同步Oracle数据

    第一步 配置Oracle服务 电脑上需要安装Oracle客户端 xff08 因为需要Oracle的驱动 xff09 Oracle win64 11gR2 client 配置Oracle服务 第二步 配置SQL Server链接服务器 xff
  • SR04声波传感器原理详解及其Arduino编程——人人都能玩硬件

    通过前两篇文章 xff0c 我们已经熟悉了Arduino的基本GPIO编程和PC与Arduino的串口通信 接下来我们将开始一边学习各种传感器操作 xff0c 一边深入学习Arduino编程 再开始编程之前 xff0c 首先我们需要熟悉SR
  • 从UV位置图获得3D人脸

    1 这部分主要写从UV位置图获得3D人脸 xff0c 并不包括如何产生UV位置图 我已经获取一张图片的UV位置图 xff0c 如下图 xff1a xff08 a 裁剪后的人脸区域 xff09 xff08 b UV位置图 xff08 仅用来展
  • Ubuntu matplotlib 中文乱码问题

    1 下载字体 Microsoft YaHei 放到 matplotlib库文件夹字体下 lib python3 6 site packages matplotlib mpl data fonts ttf 自己的机器上路径 自己更改 字体下载
  • faster R-CNN中anchors 的生成过程代码

    import numpy as np def whctrs anchor 34 34 34 将 anchor 四个坐标的形式 转化成 宽 xff0c 高 xff0c 中心点横坐标 xff0c 中心点纵坐标 的形式 Return width
  • 5461. 仅含 1 的子串数

    给你一个二进制字符串 s xff08 仅由 39 0 39 和 39 1 39 组成的字符串 xff09 返回所有字符都为 1 的子字符串的数目 由于答案可能很大 xff0c 请你将它对 10 9 43 7 取模后返回 示例 1 xff1a
  • print end=“lr“

    print 34 epoch 34 format i end 61 34 r 34
  • python 调试 PDB

    https aistudio baidu com aistudio projectdetail 69987
  • pcl求取三维模型每个点的曲率以及法向量

    转载 xff1a http blog csdn net lming 08 article details 18360329 做个笔记 xff0c 写得很不错
  • 3D人脸重建: BFM结合表情模型

    MATLAB代码 xff1a addpath genpath pwd gt model 载入原始的BFM模型 load 39 raw 01 MorphableModel mat 39 载入3dffa中 BFM信息 load 39 3ddfa
  • 构建副对角线全为1的矩阵,

    突然用到 副对角线 全为1的矩阵 xff0c 不知道怎么调用numpy xff0c 自己写了一个 xff1a import numpy as np 副对角线 全为 1 def get subdiag n value ar 61 for i
  • day1: 357. 计算各个位数不同的数字个数

    给定一个非负整数 n xff0c 计算各位数字都不同的数字 x 的个数 xff0c 其中 0 x lt 10n 示例 输入 2 输出 91 解释 答案应为除去 11 22 33 44 55 66 77 88 99 外 xff0c 在 0 1
  • day1: 二叉树

    1 二叉树的层序遍历 给你一个二叉树 xff0c 请你返回其按 层序遍历 得到的节点值 xff08 即逐层地 xff0c 从左到右访问所有节点 xff09 示例 xff1a 二叉树 xff1a 3 9 20 null null 15 7 3
  • 求正整数的平方根

    34 34 34 求正整数的平方根 二分查找 34 34 34 def sqrt val t if val lt 0 or t lt 0 return 0 left 61 0 right 61 val mid 61 left 43 righ
  • 对BN的理解

    BN原理与使用过程详解 内部协变量偏移 Internal Covariate Shift 和批归一化 Batch Normalization 对于BN层的理解 关于BN防止过拟合的分析 BN Batch Normalization 原理与使
  • 感受野的计算方法

    卷积神经网络基础题 如何计算多层卷积 池化网络每一层的感受野 Receptive Field
  • day2:215. 数组中的第K个最大元素 快速排序 python代码

    34 34 34 快速排序 思想 xff1a 基本思想是 xff1a 通过一趟排序将要排序的数据分割成独立的两部分 xff0c 其中一部分的所有数据都比另外一部分的所有数据都要小 xff0c 然后再按此方法对这两部分数据分别进行快速排序 x

随机推荐

  • 梯度消失和梯度爆炸原因及其解决方案

    梯度消失和梯度爆炸原因及其解决方案
  • day3: 剑指 Offer 48. 最长不含重复字符的子字符串

    剑指 Offer 48 最长不含重复字符的子字符串 请从字符串中找出一个最长的不包含重复字符的子字符串 xff0c 计算该最长子字符串的长度 示例 1 输入 34 abcabcbb 34 输出 3 解释 因为无重复字符的最长子串是 34 a
  • idea中java版本设置

    1 打开file gt Project structure gt project Settings gt Project gt Project SDK中设置 2 设置IDEA本身的jdk版本 打开file gt settings gt ja
  • 剑指 Offer 59 - II. 队列的最大值

    剑指 Offer 59 II 队列的最大值 请定义一个队列并实现函数 max value 得到队列里的最大值 xff0c 要求函数max value push back 和 pop front 的均摊时间复杂度都是O 1 若队列为空 xff
  • 剑指 Offer 46. 把数字翻译成字符串

    剑指 Offer 46 把数字翻译成字符串 给定一个数字 xff0c 我们按照如下规则把它翻译为字符串 xff1a 0 翻译成 a xff0c 1 翻译成 b xff0c xff0c 11 翻译成 l xff0c xff0c 25 翻译成
  • python 异或的应用

    符号 描述 运算规则 amp 与 两个位都为1时 xff0c 结果才为1 xff08 统计奇数 xff09 全1为1 或 两个位都为0时 xff0c 结果才为0 xff08 统计偶数 xff09 全0为0 异或 两个位相同为0 xff0c
  • day4: 剑指 Offer 64. 求1+2+…+n

    剑指 Offer 64 求1 43 2 43 43 n 求 1 43 2 43 43 n xff0c 要求不能使用乘除法 for while if else switch case等关键字及条件判断语句 xff08 A B C xff09
  • day5: 链表

    1 剑指 Offer 22 链表中倒数第k个节点 输入一个链表 xff0c 输出该链表中倒数第k个节点 为了符合大多数人的习惯 xff0c 本题从1开始计数 xff0c 即链表的尾节点是倒数第1个节点 例如 xff0c 一个链表有6个节点
  • LCP 18. 早餐组合

    小扣在秋日市集选择了一家早餐摊位 xff0c 一维整型数组 staple 中记录了每种主食的价格 xff0c 一维整型数组 drinks 中记录了每种饮料的价格 小扣的计划选择一份主食和一款饮料 xff0c 且花费不超过 x 元 请返回小扣
  • 第 208 场周赛

    1 5523 文件夹操作日志搜集器 class Solution def minOperations self logs List str gt int 栈 xff0c 先进 后出 zhan 61 39 main 39 for log in
  • day 5: 字符串

    1 剑指 Offer 38 字符串的排列 输入一个字符串 xff0c 打印出该字符串中字符的所有排列 你可以以任意顺序返回这个字符串数组 xff0c 但里面不能有重复元素 示例 xff1a 输入 xff1a s 61 34 abc 34 输
  • day6: 数组

    1 18 四数之和 给定一个包含 n 个整数的数组 nums 和一个目标值 target xff0c 判断 nums 中是否存在四个元素 a xff0c b xff0c c 和 d xff0c 使得 a 43 b 43 c 43 d 的值与
  • day7: 剑指 Offer 44. 数字序列中某一位的数字

    1 剑指 Offer 44 数字序列中某一位的数字 数字以0123456789101112131415 的格式序列化到一个字符序列中 在这个序列中 xff0c 第5位 xff08 从下标0开始计数 xff09 是5 xff0c 第13位是1
  • casbin 使用说明记录

    本文简单记录casbin 安装步骤 使用 Casbin 作为 ThinkPHP 的权限控制中间件 PHP Casbin 是一个强大的 高效的开源访问控制框架 xff0c 它支持基于各种访问控制模型的权限管理 Think Casbin 是一个
  • 844. 比较含退格的字符串

    给定 S 和 T 两个字符串 xff0c 当它们分别被输入到空白的文本编辑器后 xff0c 判断二者是否相等 xff0c 并返回结果 代表退格字符 注意 xff1a 如果对空文本输入退格字符 xff0c 文本继续为空 示例 1 xff1a
  • 笔试题记录

    1 逆波兰表达式 是称为 后缀表达式 xff0c 把运算量写在前面 xff0c 把算符写在后面 写出a b c d 43 e f g h 43 i j k 的逆波兰表达式 拆开写各个部分的 xff1a 按优先级 xff08 1 xff09
  • 牛客网 赛码在线编程中数据读取问题

    一 数据读取的方式 xff08 python3 xff09 1 input 读取输入数据 while True try inputs 61 input except break 2 网站的数据输入是是一个含有多行数据的input文件 in文
  • 贪心算法 leetcode编程题

    1 452 用最少数量的箭引爆气球 在二维空间中有许多球形的气球 对于每个气球 xff0c 提供的输入是水平方向上 xff0c 气球直径的开始和结束坐标 由于它是水平的 xff0c 所以纵坐标并不重要 xff0c 因此只要知道开始和结束的横
  • 排序题 LeetCode题

    1 1370 上升下降字符串 给你一个字符串 s xff0c 请你根据下面的算法重新构造字符串 xff1a 从 s 中选出 最小 的字符 xff0c 将它 接在 结果字符串的后面 从 s 剩余字符中选出 最小 的字符 xff0c 且该字符比
  • BP算法公式推导

    令表示第层的第个神经元到第层的第个神经元的连接权值 xff0c 表示第层第个神经元的输入 xff0c 表示第层第个神经元的输出 xff0c 表示层第个神经元的偏置 xff0c C表示代价函数 则有 xff1a 其中 表示激活函数 训练多层网