softmax函数的定义及求导

2023-11-02

本文中 (x0,x1,...,xm) 代表一个向量，也就是一个 m 行1列的矩阵。

在监督式的深度学习中，输入通常是一个向量，用x表示，输出 y 则可以分为多种情况。

标量。y表示输入 x 属于某一类别的概率。
向量。此时输入x可能属于多个类别。 y=(y0,y1,...,yn) 。元素 yi 代表向量属于类别 i 的可能性。数值越大，可能性越高。但是，深度学习模型输出的yi不必然是介于0和1之间的概率值， softmax 函数的作用就是对向量进行归一化，生成概率值。
softmax 函数的作用如下。

softmax((y0,y1,...,yn))=(y0Σni=0yi,...,ynΣni=0yi)

也就是说， softmax 函数的输入是一个向量，而其输出也是一个向量，向量中的每个元素都是介于0和1之间的概率值。下面将以最简单的形式来描述 softmax 函数的定义和求导问题。假设输入是包含3个元素的向量，而输出是包含2个元素的向量，也就说 m=2,n=1 ，如下图所示。

图中表示了从输入到输出的一个转换过程，参数有6个，可以写成一个矩阵的形式。

θ=[w00,w10,w20w01,w11,w21]
这里把与输出向量中每个元素链接的权重组织成一行，所以共有两行。令 θ0=[w00,w10,w20] ， θ1=[w01,w11,w21] ，则有。

θ=[θ0θ1]
用 h 来代表转换函数，则有如下式子。

y0=h(θ0,x)

y1=h(θ1,x)

针对这个具体例子则有。

softmax((y0,y1))=(h(θ0,x)h(θ0,x)+h(θ1,x),h(θ1,x)h(θ0,x)+h(θ1,x))

为了方便书写，令
z0=h(θ0,x)h(θ0,x)+h(θ1,x)

z1=h(θ1,x)h(θ0,x)+h(θ1,x)
按照对向量求导的定义，其结果应该是一个Jacobian矩阵，则对 softmax 函数的求导可以写为如下形式。

∂softmax((y0,y1))∂x=⎡⎣⎢⎢∂z0∂x∂z1∂x⎤⎦⎥⎥=⎡⎣⎢⎢⎢∂z0∂x0∂z0∂x1∂z0∂x2∂z1∂x0∂z1∂x1∂z1∂x2⎤⎦⎥⎥⎥

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

心得

Softmax

深度学习

求导

偏微分

softmax函数的定义及求导的相关文章

见习网工之综合实验

需求一信息中心配置Eth trunk实现链路冗余 SW1 interface Eth Trunk1 mode lacp static least active linknumber 1 trunkport GigabitEthernet
【每日一练】在JSX中使用条件渲染

条件渲染技术方案三元表达式逻辑运算 1 三元表达式满足条件才渲染一个span标签 const flag true function App return div flag div h1 span 我是JackWoot span h
自动化测试如何做？接口自动化测试如何才能做好？

前言接口自动化测试常用框架 Python requests pytest yaml alluer Jenkins 接口自动化测试的目的自动化测试的主要目的是用来回归测试的当代码有变化时有可能影响不应该变化的逻辑这个时候为了确认这种

随机推荐

There was a problem importing one of the Python modules required to run yum

为什么80 的码农都做不了架构师 gt gt gt 最近从python 2 6 升级到python2 7 导致 yum 不可用原因主要是yum 不支持python27 因此需要更改yum的可用路径 which yum 查看下yum的安装路
js拖拽实现
强化学习的A3C算法应用（训练Atari游戏）

A3C算法的全称是Asynchronous Advantage Actor Critic 异步优势执行者评论者算法这个算法和优势执行者评论者算法的区别在于在执行过程中不是每一步都更新参数而是在回合结束后用整个轨迹进行更新因此可以
多个git合并，并保留log历史记录

面临的需求是将多个git仓库作为一个单独目录整合到一个新的git仓库中并且保留历史记录 1 新建一个summary仓库新建一个summary仓库用于整合一系列git仓库 git clone
openwrt编译x86固件

x86 openwrt固件编译 2017年十月四日我在珠海中秋之际写下这篇文章祝各位看官花好月圆有情人终成眷属最近一直在玩Openwrt 以前上学的时候接触一丁丁但是只限于烧写别人编译好的固件这次要真刀实干了学习了一周各种百度
专访用自己姓氏命名编译器YC++的创始人

在CSDN的论坛里看到了这样的一条帖子请使用中国人开发的C C 编译器网页浏览器内核并提供了该软件的下载地址从大家的跟帖来看很多人是很有兴趣的但是作者并没有留下太多的介绍说明类的文字为了一探究竟我拨通了作者留下的电话并完成了
Ubuntu 16.04设置root用户登录图形界面

Ubuntu默认的是root用户不能登录图形界面的只能以其他用户登录图形界面这样就很麻烦因为权限的问题不能随意复制删除文件用gedit编辑文件时经常不能保存只能用vim去编辑下面以Ubuntu 16 04版为例说明 1 打开终
STM32实战项目：HAL_RCC_OscConfig中程序卡死问题解决办法

STM32实战项目经验 HAL RCC OscConfig中程序卡死问题解决办法工程环境 STM32CUBEIDE STM32F405VG 现象复现项目中一个是IAP程序另一个是APP程序两个程序都是使用STM32CubeIDE生成
搜索题目综合

BFS 1 小X学游泳题解枚举每一个点作为连通块的起点求得连通块大小然后打擂台求最值即可参考代码 include
element-ui和element-plus的自定义列表格用法

前言 element plus 这个 UI 组件库虽说基本和 vue2 element ui 差不多但还是有点区别以至于按emenent ui的写法来写会发现报错下面我将讲解一下element ui和element plus的自定义
一文彻底讲清Linux tty子系统架构及编程实例

摘要本文详细解读了linux系统下的tty子系统的深层次原理和架构并参考了LDD3中的代码实例讲述了无硬件下实现一个简单的tty设备驱动模块的编写对了解tty子系统及下部串口驱动模块的学习有较好的参考价值 1 tty设备简介 tty一
抖音广告IOS/Android接入笔记：

一抖音广告接入 Android接入注意内容输出对接中已包含广告对接建议使用广告4 6 0 7版本如使用其他广告版本建议做好自测 2600及以上版本需要使用如下Maven命令火山引擎maven仓库地址 maven url htt
红帽系统服务器格式化,Redhat Linux默认的文件系统是什么格式?

满意答案现在Redhat Linux默认的文件系统格式是ext4 可以通过如下多种方法查询文件系统类型 1 mount mount dev sda1 on type ext4 rw errors remount ro user xattr
第五周总结

已知字符串 this is a test of java 按要求执行以下操作统计该字符串中字母s出现的次数统计该字符串中子串 is 出现的次数统计该字符串中单词 is 出现的次数实现该字符串的倒序输出 public class da
MySQL之常见的CRUD面试题【下】

Welcome Huihui s Code World 接下来看看由辉辉所写的关于MySQL数据库的相关操作吧目录 Welcome Huihui s Code World 导读一 MySQL常见的内置函数 1 字符串函数 2 数值函数
测绘地理信息标准规范汇总下载

经常我们要下载一些相关的规范来指导作业每次都在网上找这里一次性全部整理好欢迎大家来下载打包下载链接百度网盘地址分页下载一国家测绘局制定的测绘地理信息国家标准专题地图信息分类与代码 GBT 18317 2001 被GBT
4-C语言-冒泡排序以及数组名的使用

问题给数组进行从小到大的升序排序思想一般给冒泡排序进行封装写成一个函数这就需要让数组传进去而传数组实际传的数组的首元素的地址因此如果在冒泡内部进行数组数据个数的计算用sizeof a sizeof a 0 实际上为1
Braft--工作日记

建议在阅读本笔记之前先观看此网址的动画Raft 分布式共识算法动画演示首先bRaft是实现分布式共识的协议一个节点可以处于三种状态 Follower跟随者状态 Candidate候选者状态 Leader领导者状态而所有的节点都以跟随者
计算机毕业设计SSM大型零售电商平台——购物车管理子系统【附源码数据库】

项目运行环境配置 Jdk1 8 Tomcat7 0 Mysql HBuilderX Webstorm也行 Eclispe IntelliJ IDEA Eclispe MyEclispe Sts都支持项目技术 SSM mybatis Ma
softmax函数的定义及求导

本文中 x0 x1 xm x 0 x 1 x m 代表一个向量也就是一个 m m行1列的矩阵在监督式的深度学习中输入通常是一个向量用xx表示输出 y y则可以分为多种情况标量 yy表示输入 x x属于某一类别的概率向量此时输

softmax函数的定义及求导

softmax函数的定义及求导 的相关文章

随机推荐

热门标签

softmax函数的定义及求导的相关文章