第1.2章 神经网络中隐藏层、偏置单元、激活函数的作用(使用激活函数的原因)

2023-11-16

神经网络中隐藏层、偏置单元、激活函数的作用

摘要:这篇文章主要是对上一篇文章中所给例题中部分知识点的讲解,较多的参考了网上其他朋友的资料,主要是供大家学习和自己以后查看资料方便,如有侵权,请告知!我会及时修改、删除!

首先给出上一篇文章的例题,一道题道出神经网络的本质,下面将介绍例题中涉及的隐藏层、偏置单元、激活函数。

隐藏层

例题中除了输入层和输出层,还有几层隐藏层。从图中可以看出,隐藏层不直接接受外界的信号,也不直接向外界发送信号。隐藏层的作用,简单来说就是构造出一个复杂的模型,复杂的程度由隐藏层的层数和各隐藏层神经元的个数决定。

因此,当隐藏层层数等于0时,相当于一个最简单的模型——线性或非线性回归模型。

有兴趣的朋友们可以参考以下文章详细了解
1.使用隐藏层和神经元的目的
2.对隐藏层的简单理解

偏置单元

偏置单元(bias unit),也称为偏置项(bias term)或者截距项(intercept term),它其实就是函数的截距,与线性方程 y=wx+b 中的 b 的意义是一致的。
在 y=wx+b 中,b表示函数在y轴上的截距,控制着函数偏离原点的距离,其实在神经网络中的偏置单元也是类似的作用。

下面举个简单的例子:
神经网络最重要的用途是分类,如垃圾邮件识别、疾病判断、猫狗分类这种能自动对输入的东西进行分类的机器,就叫做分类器。现在我们有一个简单的任务,需要将下面三角形和圆形进行分类:
例题1
如果没有偏置单元,我们可以轻易得到一条过原点的直线y=wx线性分开这些数据点。

但是,假如我现在的样本点是如下这种:

例题2
则方程应为y=wx+b,由此,我们发现,增加偏置单元可以给网络分类增加平移的能力

激活函数

input layer✖权重后,往往要对结果进一步处理,即把结果作为激活函数的输入值。一般,激活函数要取非线性的激活函数。从ReLU到GELU,一文概览神经网络的激活函数


如果我们不使用或使用线性激活函数会怎么样呢?

变量声明:
x:输入,下角标代表是第几个输入
y:输出,上面的符号代表y值是通过网络计算出的值,并不是真实值
W:权重,一般是向量或矩阵。上角标1代表是输入层和第一层之间的权重
b:偏置,常数。每一层只有一个,上角标意义同权重。
z:使用激活函数前的输出,上角标1代表是输入层和第一层计算后的输出
a:使用激活函数后的输出,上角标1代表是输入层和第一层计算并经过激活函数后的输出
g:代表某一个激活函数g(x),上角标1代表是第一层的激活函数

如下图,图中第一列圆圈为第一层,第二列为第二层。如果不使用激活函数,则第一层的a=z,第二层的a=z。如右边公式,最后得到的结果仍然是线性的。

我们使用神经网络的目的是为了得到复杂的函数关系,如果不使用激活函数,最后得到的只是线性关系,并不是我们所需要的。

使用线性的激活函数同理,只不过在最后结果前面加了一个系数。

在这里插入图片描述


权重

为了理解方便,我们采用最简单的方式:每个连接的权值由随机数函数产生,权重w就是我们需要训练的模型参数,但这样得到的效果并不好,收敛速度慢,因此采用某些函数对权值进行初始化,深度学习中神经网络的几种权重初始化方法

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

第1.2章 神经网络中隐藏层、偏置单元、激活函数的作用(使用激活函数的原因) 的相关文章

随机推荐

  • 一文搞懂ChatGPT 和 AIGC 到底是什么?【最强科普】

    目录 1 AIGC是什么 2 ChatGPT是什么 3 ChatGPT发展的几个阶段 4 ChatGPT能做什么 5 ChatGPT的应用场景 一 AIGC是什么 GC Generated Content 内容生成 PGC Professi
  • LeetCode 18. 四数之和 4Sum(C语言)

    题目描述 给定一个包含 n 个整数的数组 nums 和一个目标值 target 判断 nums 中是否存在四个元素 a b c 和 d 使得 a b c d 的值与 target 相等 找出所有满足条件且不重复的四元组 注意 答案中不可以包
  • 处理糊涂工具包 和easyexcle jar报poi冲突问题

    项目中使用的糊涂工具包是高版本的 使用的easyexcle 是2 x版本 导致出现问题 同时引用hutool和easyExcel会导致其中一者功能不可用 因为poi版本不兼容 easyExcel依赖了poi 3 17版本 Hutool文档说
  • 计算机算法基础总结(借鉴、整理)

    作者 Jerry4me 链接 https www jianshu com p f6e35db6bc51 排序算法 算法 最优复杂度 最差复杂度 平均复杂度 稳定性 选择排序 O n O n O n 不稳定 冒泡排序 O n O n O n
  • Spring原理-IoC容器初始化过程

    IoC容器初始化过程 IoC容器的两个核心接口BeanFactory和ApplicationContext大概功能都讲解了一些 接下来我们讲解一下IoC容器的初始化过程 让大家有一个深一点的理解 讲解还是以FileSystemXmlAppl
  • 卷积神经网络CNN在自然语言处理中的应用

    卷积神经网络 Convolution Neural Network CNN 在数字图像处理领域取得了巨大的成功 从而掀起了深度学习在自然语言处理领域 Natural Language Processing NLP 的狂潮 2015年以来 有
  • 【vulnhub靶机】DC-3

    原知识星球老文搬运 拿到靶机之后导入到virtualBOX里面 1 nmap扫描主机存活 192 168 56 104 有个80端口 不放心的话可以用masscan 2 直接访问看下 这里提示只有一个flag 直接拿到root权限 3 习惯
  • uniapp开发的h5网页如何去掉网址里的#号

    在manifest json里配置history模式 这里特别注意下面的 运行的基础路径 里不要写 因为这个默认会强制hash模式 如图 然后再服务器端配置下规则 history模式下配置nginx location try files u
  • GPL和MIT开源协议

    GPL GNU通用公共许可证简称为GPL 是由发行的用于计算机软件的协议证书 使用该证书的软件被称为自由软件 大多数的GNU程序和超过半数的自由软件使用它 GPL的出发点是代码的开源 免费使用和引用 修改 衍生代码的开源 免费使用 但不允许
  • char码值对应列表大全

    Char 0 为0的字符 Char 1 Char 2 Char 3 Char 4 Char 5 Char 6 Char 7 响铃 Char 8 回格 Char 9 tab 水平制表符 Char 10 换行 Char 11 tab 垂直制表符
  • Dump文件的生成以及使用WinDbg静态分析

    前言 本文章主要介绍了如何生成Dump文件 包括两种方式 通过代码生成和通过注册表生成 并且介绍了WinDbg工具的下载和使用 以及如何使用WinDbg工具去静态分析Dump文件 从而找到程序的崩溃位置 生成Dump文件 通过调用WinAP
  • cas 编译安装依赖时提示: Failure to find net.shibboleth.tool:xmlsectool:jar:2.0.0

    错误信息 Could not resolve dependencies for project org apereo cas cas overlay war 1 0 Failure to find net shibboleth tool x
  • 本地 Django 部署 Heroku的时候某个 / 某些数据库显示总是无法创建成功 relation “nnsh_backend_new_userinfo“ does not exist LINE

    文章目录 情景 原因 操作 手动 自动 情景 假设你有一个项目 A 你之前部署了项目 A 里面包含了两个数据库的表 table1 和 table2 他们都顺利部署 然后你相加一些功能 于是又创建了一张表 table3 于是再部署的时候发现
  • glBindFragDataLocation

    异构计算GLSL学习笔记 1 原文地址 http blog csdn net hjimce article details 51475644 作者 hjimce 最近开始学习深度学习的一些gpu编程 大体学了cuda后 感觉要在手机上跑深度
  • python-查看帮助

    help 一 不同的环境下 1 交互模式下 命令行 查看模块的帮助信息 import pickle help pickle 可以看到详细信息 More 上回车 滚动信息 q 退出帮助 2 ide里 需要做一个输出 import pickle
  • unity基础编程(一)

    以此来记录系统学习使用unity的知识方便以后复习使用 如果能得到监督和指导 不胜感激 unity常用使用快捷键 1 Q 抓手工具 W 移动工具 E 旋转工具 R 缩放工具 T 横切面工具 就在键盘一排试一试就会很清楚了 2 Z 轴点模式切
  • 自动在图片上添加页码

    在一次工作中 需要对几百GB的图片文件添加页码 也就是在图片添加一定的流水号 那么 在图片上添加页码 总的需要四个步骤 1 图片重命名 批量修改原图片名 设置流水号作为图片文件名 如 0001 gt 0036 2 添加页码 通iSee软件批
  • Docker赋能物联网:探索软件供应链的优势、挑战和安全性

    作者 JFrog大中华区总经理董任远 随着联网设备硬件性能的日益提升及价格愈发低廉 物联网应用的复杂性随之提升 常用的容器化平台Docker能够帮助精简流程 助力开发人员更轻松地创建和维护物联网应用 本文将探讨Docker为物联网开发带来的
  • 最大熵原理

    最近看到一位高手 说了最大熵原理应用在排名 让我倍感发抖 网上有个人连研究基本步骤都写完了 着实让蛋疼了一小下 就引用一下吧 最大熵原理在1957 年由E T Jaynes 提出的 主要思想是 在只掌握关于未知分布的部分知识时 应该选取符合
  • 第1.2章 神经网络中隐藏层、偏置单元、激活函数的作用(使用激活函数的原因)

    神经网络中隐藏层 偏置单元 激活函数的作用 隐藏层 偏置单元 激活函数 权重 摘要 这篇文章主要是对上一篇文章中所给例题中部分知识点的讲解 较多的参考了网上其他朋友的资料 主要是供大家学习和自己以后查看资料方便 如有侵权 请告知 我会及时修