多层网络和反向传播笔记

2023-05-16

在我之前的博客中讲到了感知器（感知器），它是用于线性可分模式分类的最简单的神经网络模型，单个感知器只能表示线性的决策面，而反向传播算法所学习的多层网络能够表示种类繁多的非线性曲面。

对于多层网络，如果使用线性单元的话，多个线性单元的连接仍然是线性函数，所以还不能表征非线性函数。使用感知器单元，但是它不连续所以也就不可微，不适合梯度下降算法。我们需要这么一种单元，它的输出是输入的非线性函数，而且输出是输入的可微函数。那么可以使用sigmoid单元，它非常类似于感知器单元，而且基于一个平滑的可微阈值函数，It looked like this:
sigmoid

sigmoid函数公式如下：

σ(y)=11+e −y

$\sigma (y)=\frac{1}{1+e^{-y}}$ 它的输出范围为[0,1]，随输入单调递增，这个函数把非常大的输入值映射到一个小范围的输出，它经常被称为sigmoid单元的挤压函数（squashing function）。sigmoid函数的导数很容易以它的输出表示，即

dσ(y)dy =σ(y)⋅(1−σ(y))

$\frac{d\sigma (y)}{dy}=\sigma (y)·(1-\sigma (y))$ 有时候可以使用其他容易计算导数的可微函数代替，比如sigmoid函数中的 e −y $e^{-y}$ 有时候被替换为 e −ky $e^{-ky}$ 其中 k $k$ 是个正常数，用来决定函数的陡峭性。双曲正切函数也可用来代替sigmoid函数。

对于由一系列确定的单元相互连接形成的多层网络，反向传播算法可以用来学习这个网络的权值，它使用梯度下降方法来最小化网络输出值和目标值之间的误差平方。

在这里我们要考虑网络中多个输出单元，而不是一个单元，所以可以看到下面的误差公式中要计算两次和：

E(w ⃗ )≡12 ∑ d∈D ∑ k∈outputs (t kd −o kd ) 2

$E(\vec{w}) \equiv \frac{1}{2} \sum_{d\in D} \sum_{k\in outputs}(t_{kd}-o_{kd})^2$ 其中 outputs $outputs$ 是网络输出单元的集合， t kd $t_{kd}$ 和 o kd $o_{kd}$ 是与训练样例 d $d$ 和第k $k$ 个输出单元相关的输出值。

反向传播算法需要解决的问题是搜索一个巨大的假设空间，这个空间由网络中所有单元的所有可能权值定义，此时可以用一个误差曲面来形象表示。在和训练单个单元的情况一样，梯度下降可以用来寻找使 $E$ 最小化的一个假设。

多层网络的一个主要不同是它的误差曲面可能有多个局部最小值，那么这就会带来一个问题，使用梯度下降的时候不能保证一定能收敛到全局最小值。不过在实践中反向传播都产生了出色的结果。

反向传播首先把输入 $\vec{x}$ 沿网络前向传播，然后计算每个单元 $u$ 的输出 $o_u$ ，然后是误差沿网络反向传播（反向传播算法名字应该就是这么得来的吧），对于网络的每个输出单元 $k$ ，计算它的误差项 $\delta_k$ ：

δ k ←o k (1−o k )(t k −o k )

$\delta_k \gets o_k(1-o_k)(t_k-o_k)$ 对于网络的每个隐藏单元 h $h$ 计算它的误差项δ h $\delta_h$ :

δ h ←o h (1−o h )∑w kh δ k

$\delta_h \gets o_h(1-o_h) \sum w_{kh}\delta_k$ 更新每个网络的权值 w ji $w_{ji}$ :

w ji ←w ji +Δw ji

$w_{ji} \gets w_{ji}+\Delta w_{ji}$ 其中

Δw ji =ηδ j x ji

$\Delta w_{ji} = \eta \delta_jx_{ji}$ 反向传播已经开发除了许多变种，最常见的是修改权值更新法则，使第 n $n$ 次迭代的权值更新部分依赖于第n−1 $n-1$ 次迭代时的更新，即

Δw ji (n)=ηδ j x ji +αΔw ji (n−1)

$\Delta w_{ji}(n) = \eta\delta_jx_{ji} + \alpha\Delta w_{ji}(n-1)$ 其中 α∈[0,1) $\alpha \in [0,1)$ ，一个冲量常数，上式右边第二项叫做冲量项。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

多层网络和反向传播笔记的相关文章

Jetson TX2核心板系统烧录、烧写

1 从官网https developer nvidia com embedded jetpack 中下载sdkmanager xff0c 需登录事先在官网注册的账号 xff08 免费 xff09 xff0c 但Jetpack4 3版本一直无
C语言实现汉诺塔详细步骤（递归与非递归）及代码

前言 C语言汉诺塔问题是一个经典的问题 xff0c 在学习编程的初学者中非常流行它涉及到了递归的思想 xff0c 能够帮助我们理解递归的基本原理首先 xff0c 我们来了解一下汉诺塔的问题汉诺塔问题是指 xff1a 有三根柱子A B
C语言 | 输出月份的英文

要成为绝世高手 xff0c 并非一朝一夕 xff0c 除非是天生武学奇才 xff0c 但是这种人万中无一包租婆这道理放在C语言学习上也一并受用在编程方面有着天赋异禀的人毕竟是少数 xff0c 我们大多数人想要从C语言小白进阶到高手
C语言实例：3个数从小到大排序

需求任意输入3个整数 xff0c 对这3个整数由小到大进行排序 xff0c 并将排序后的结果输出源码 64 author 冲哥 64 date 2021 5 7 13 37 64 description 实现对这3个整数由小到大进行排序
C 预处理指令

C 预处理指令 C语言 C 语言的预处理器用于在编译器处理程序之前预扫描源代码 xff0c 完成头文件的包含宏扩展条件编译行控制 xff08 line control xff09 等操作编译的四个阶段 C语言标准规定 xff0c
c语言怎么输入3个数输出最大值

方法 xff1a 首先使用scanf 接收从键盘输入的三个数 xff1b 然后使用 if else 语句比较三个数的大小 xff0c 获得最大值 xff1b 最后使用print 函数将最大值输出即可 c语言输入3个数输出最大值 includ
C 运算符中不能重载的是哪些

C 运算符中不能重载的有 xff1a 1 条件运算符 xff1b 2 成员访问运算符 xff1b 3 域运算符 xff1b 4 长度运算符 sizeof xff1b 5 成员指针访问运算符 gt 和重载 xff1a 让操作符可以有新的语义
scanf在c语言中的作用是什么？

scanf 函数 scanf 是C语言中的一个输入函数与printf函数一样 xff0c 都被声明在头文件stdio h里 xff0c 因此在使用scanf函数时要加上 include xff08 在有一些实现中 xff0c printf
C语言中字符串的结束标志是什么

C语言中字符串的结束标志是 39 0 39 C语言中没有专门的字符串变量 xff0c 通常用一个字符数组来存放一个字符串 xff0c 字符串总是以 39 0 39 作为结束符 39 0 39 就是8位的00000000 xff0c 因为字符
Linux驱动开发（十八）---网络（网卡）驱动学习

前文回顾 Linux驱动开发 xff08 一 xff09 环境搭建与hello world Linux驱动开发 xff08 二 xff09 驱动与设备的分离设计 Linux驱动开发 xff08 三 xff09 设备树 Linux驱动开发 x
c语言源文件经过编译后生成文件的后缀是什么？

c语言源文件经过编译后 xff0c 生成文件的后缀是 obj C语言源文件后缀名是 c xff0c 编译生成的文件后缀名是 obj xff0c 连接后可执行文件的后缀名是 exe C语言创建程序的步骤 xff1a 编辑 xff1a 就是创建
C语言strcmp函数用法

C语言strcmp函数用法 strcmp函数语法为 int strcmp char str1 char str2 xff0c 其作用是比较字符串str1和str2是否相同 xff0c 如果相同则返回0 xff0c 如果不同 xff0c 前者
C++ 空指针和野指针

点击蓝字关注我们来源于网络 xff0c 侵删 1 空指针指针变量指向内存中编号为0的空间为空指针空指针指向的内存空间是不可以访问的代码 xff1a include lt iostream gt using namespace st
如何用C++实现动态放烟花（附源码）

点击蓝字关注我们来源于网络 xff0c 侵删一前言 C 43 43 实现的放烟花程序用到了EGE图形库 xff0c 没有的需要自行安装可调项 xff1a 背景图和背景音乐粒子模糊度亮度以及上升速度的参数实现的动态烟花非常好
C语言内存泄漏问题及其检视方法

点击蓝字关注我们来源于网络 xff0c 侵删通过介绍内存泄漏问题原理及检视方法 xff0c 希望后续能够从编码检视环节就杜绝内存泄漏导致的网上问题发生本文通过介绍内存泄漏问题原理及检视方法 xff0c 希望后续能够从编码检视环节就杜
C语言进阶之回调函数详解

点击蓝字关注我们因公众号更改推送规则 xff0c 请点在看并加星标第一时间获取精彩技术分享来源于网络 xff0c 侵删在讲回调函数之前 xff0c 我们需要了解函数指针我们都知道 xff0c C语言的灵魂是指针 xff0c
C语言和C++的区别和联系，大多数人都说错了

点击蓝字关注我们因公众号更改推送规则 xff0c 请点在看并加星标第一时间获取精彩技术分享来源于网络 xff0c 侵删 C语言和C 43 43 到底是什么关系 xff1f 首先C 43 43 和C语言本来就是两种不同的编程语言
深入理解C语言中的malloc，malloc() 与 free() 原理图解

点击蓝字关注我们因公众号更改推送规则 xff0c 请点在看并加星标第一时间获取精彩技术分享来源于网络 xff0c 侵删本文分为三个等级自顶向下地分析了glibc中内存分配与回收的过程本文不过度关注细节 xff0c 因此只是
C语言项目：灰度处理技术

Hello xff0c 今天给大家带来的是一个比较简单的图形处理技术灰度处理技术那么到底什么是灰度处理技术呢 xff1f 简单来说 xff0c 所谓的灰度处理技术就是把一张彩色的图片变成一张灰色的图片如下图所示 xff0c 左边是原图
React Native重启APP

有时会用到APP重启操作 xff0c 比如更新代码或者特殊情况的用户注销 0 62及以上版本只重启JS部分 import DevSettings from 39 react native 39 DevSettings reload 详细请

随机推荐

树莓派3 Ubuntu系统 SD卡或U盘启动

之前先用SD卡装过Ubuntu系统后 xff0c 用着用着SD卡满了 xff0c 就拿了个U盘来重装一遍 xff0c 发现U盘按照SD卡那样的流程安装之后 xff0c 树莓派配置成可以U盘启动 xff0c 再修改刻录好的U盘里的两个文件就可
手把手教你安装黑苹果之openCore-0.6.3 EFI制作全过程，非常详细

文章目录前言一 EFI是什么 xff1f 二获取EFI1 Hackintosh黑苹果长期维护机型整理清单2 搜索efi 二自制EFI1 OC Gen X图形化一键自动生成EFI 推荐 2 手动下载EFI所需要的文件下载哪些文件下载op
OpenCore 启动菜单界面美化增加gui界面

前言 OpenCore 默认启动界面是类似于命令行一样的黑乎乎的界面习惯了clover华丽的启动界面的小伙伴可能不适应了甚至我之前以为OpenCore启动界面就是这样的不能变呢 xff1f 第一次看到感觉还是clover讨喜其实Ope
secoclient全版本下载分享

前言工作需要使用 secoclient xff0c 同事们大多都用 Windows环境客户提供的客户端也是Windows版本的这就让使用Mac几个同事难受啦用Windows虚拟机 xff1f 根据我的经验 xff0c 一般的VPN客
Centos升级ruby

CentOS7 安装的ruby默认版本是 xff1a ruby v span class token punctuation span 11 43 53 span class token punctuation span ruby 2 0
Windows 11下载

Windows 11是微软于2021年推出的Windows NT系列操作系统 xff0c 为Windows 10的后继者正式版本于2021年10月5日发行 xff0c 并开放给符合条件的Windows 10设备通过Windows Upda
docker容器安装图形桌面

文章目录视频教程版本信息创建一个CONTAINERubuntu官方国内源docker镜像unminimize中文环境设置中文环境安装安装TigerVNC Server安装 xfce4精简版本配置设置vnc密码 vnc xstartup
ubuntu官方国内源

背景之前我一直在使用中科大的源 xff0c 还是挺快的一直也没有感觉有什么问题直到最近在折腾vnc xff0c 发现中科大的源有一些包会404 xff0c 安装不了而我在vmware中的正好是默认的cn archive ubuntu
mame新版ROM下载网站推荐

网站地址 https www retroroms info index php 中文插件安装浏览器插件 https www tampermonkey net UP主自己写的脚本已经失效 https gitee com lxyoucan
RuoYi若依打包发布与部署

上一节我们已经讲过了如果搭建开发环境 xff0c 那么如果代码写完了 xff0c 如何打包发布部署到生产环境呢 xff1f RuoYi开发实战搭建开发环境 https blog csdn net lxyoucan article det
vscode设置Prettier为默认格式化插件

1 目的 xff1a ctrl 43 s保存 xff0c 自动格式化文档 2 所需插件Prettier 3 操作步骤先打开vscode软件 xff0c 左下角点击设置 gt 打开设置 gt 在右上方有一个搜索框先设定自动保存文件 xff
ASUS X415安装系统找不到硬盘解决办法

同事让我帮忙安装系统 xff0c 笔记本电脑型号是ASUS X415 原本以为是手到擒来的事情 xff0c 结果我在上面还是消耗了不少时间现象老毛桃PE 无法识别到硬盘微PE可以识别到硬盘 xff0c 但是系统安装以后 xff0c 无
archlinux中navicat无法使用fcitx5输入法

现象 archlinux中navicat无法使用fcitx5输入法而我在ubuntu中使用navicat调用fcitx输入法是可以正常使用的在网上搜索了很久 xff0c 这方面的文章比较少而我的其他程序输入法又是正常的解决办法参考
JetBrains Gateway IDEA远程开发

为什么进行远程开发 xff1f 无论身处何处数秒内连接至远程环境充分利用远程计算机的强大功能在任何笔记本电脑上都可以轻松工作 xff0c 无论其性能如何借助远程计算机的计算资源 xff0c 充分利用最大规模的数据集和代码库在远程服务
ubuntu 22.04安装nvm

执行安装脚本 span class token function sudo span span class token function apt span span class token function install span spa
手推DNN，CNN池化层，卷积层反向传播

反向传播算法是神经网络中用来学习的算法 xff0c 从网络的输出一直往输出方向计算梯度来更新网络参数 xff0c 达到学习的目的 xff0c 而因为其传播方向与网络的推理方向相反 xff0c 因此成为反向传播神经网络有很多种 xff0c
软件架构概念和面向服务的架构

摘要软件架构作为软件开发过程的一个重要组成部分 xff0c 有着各种各样的方法和路线图 xff0c 它们都有一些共同的原则基于架构的方法作为控制系统构建和演化复杂性的一种手段得到了推广引言在计算机历史中 xff0c 软件变得越来越复
初识强化学习，什么是强化学习？

相信很多人都听过机器学习和深度学习但是听过强化学习的人可能没有那么多那么什么是强化学习呢强化学习是机器学习的一个子领域它可以随着时间的推移自动学习到最优的策略在我们不断变化的纷繁复杂的世界里从更广的角度来看即使是单
强化学习形式与关系

在强化学习中有这么几个术语智能体 Agent 环境 Environment 动作 Action 奖励 Reward 状态 State 有些地方称作观察 Observation 奖励 Reward 在强化学习中奖励是一个标量它是从环境中
多层网络和反向传播笔记

在我之前的博客中讲到了感知器 xff08 感知器 xff09 xff0c 它是用于线性可分模式分类的最简单的神经网络模型 xff0c 单个感知器只能表示线性的决策面 xff0c 而反向传播算法所学习的多层网络能够表示种类繁多的非线性曲面对

多层网络和反向传播笔记

多层网络和反向传播笔记 的相关文章

随机推荐

热门标签

多层网络和反向传播笔记的相关文章