为什么需要softmax函数？为什么不进行简单的标准化呢？

2024-01-11

我对深度学习不熟悉，所以这可能是一个初学者问题。根据我的理解，多层感知器中的softmax函数负责标准化和分配每个类别的概率。如果是这样，我们为什么不使用简单的标准化呢？

假设我们得到一个向量x = (10 3 2 1)应用softmax，输出将是y = (0.9986 0.0009 0.0003 0.0001).

应用简单的归一化（将每个元素除以sum(16)）输出将是y = (0.625 0.1875 0.125 0.166).

看起来简单的标准化也可以分布概率。那么，在输出层使用softmax函数有什么好处呢？

归一化并不总是产生概率，例如，当您考虑负值时它不起作用。或者如果值的总和为零怎么办？

但是使用 logits 的指数改变了这一点，理论上它永远不会为零，并且它可以将 logits 的整个范围映射为概率。所以它是首选，因为它确实有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

deeplearning

Softmax

为什么需要softmax函数？为什么不进行简单的标准化呢？的相关文章

Google Inceptionism：按类别获取图像

在著名的 Google Inceptionism 文章中 http googleresearch blogspot jp 2015 06 inceptionism going deeper into neural html http goo
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
如何在快速人工智能中获得给定测试集的预测并计算准确性？

我正在尝试加载由导出的学习者learn export 我想针对测试集运行它我希望我的测试集有标签以便我可以测量其准确性这是我的代码 test src TextList from df df path cols texts split
Google Colab：为什么 CPU 比 TPU 快？

我正在使用 Google colabTPU训练一个简单的Keras模型删除分布式strategy并在CPU比TPU 这怎么可能 import timeit import os import tensorflow as tf from sk
如何以 HDF5 格式提供 caffe 多标签数据？

我想将 caffe 与矢量标签一起使用而不是整数我检查了一些答案似乎 HDF5 是更好的方法但后来我陷入了这样的错误 precision layer cpp 34 检查失败 outer num inner num bottom 1
如何修复：AttributeError：模块“neat”没有属性“config”

我正在浏览使用发现的 NEAT 神经网络 API 玩 flappybird 的 AI 的指南当我运行从 Github 下载的代码时出现错误 Traceback most recent call last File test py lin
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
梯度下降有哪些替代方案？

梯度下降存在局部极小值问题我们需要运行梯度下降指数次来找到全局最小值谁能告诉我梯度下降的任何替代方案及其优缺点 Thanks See 我的硕士论文 https arxiv org pdf 1707 09725 pdf page 96对于
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
访问 GCP 深度学习平台映像的 dockerfiles

我正在使用源自的图像深度学习容器 https cloud google com ai platform deep learning containers docs 在 AI Platform Notebooks 产品中运行多个任务为了对我
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs

随机推荐

获取 facebook api 的访问令牌

要获取访问令牌 GET https graph facebook com oauth access token client id YOUR APP ID client secret YOUR APP SECRET redirect uri
Python Pandas TypeError：第一个参数必须是字符串或编译模式

我很抱歉这个超级简单的问题但我无法让它发挥作用我正在清理数据并且想要添加一个标志如果名称分为名字和姓氏两列错误我建立了多种模式但现在我正在处理单独的语句我可以将所有这些语句合并为一个吗 pattern match incr
Rails：使用回形针上传文件

我想使用回形针上传文件通过基本的开箱即用设置我能够将文件上传到默认目录公共系统中的某个目录但是当我尝试更改 url 或路径或两者时 class Cvit lt ActiveRecord Base has attached f
时间：2019-03-17 标签：c#richtextboxoutofmemory

我编写了一个应用程序可以读取传入的聊天内容有点像即时通讯工具对其进行格式化并将其插入到 Richtextbox 中如果您让程序运行足够长的时间您将收到内存不足错误查看我的代码后我认为这是因为我从不修剪 Richtextbox
如何布局图像及其左侧和下方的文本？

我需要制作一个特定于网页的布局它需要看起来像一篇网络文章其中包含图像和文本看图片由于这在网络世界中很容易做到所以我不确定如何在 XML 布局中做到这一点显然 TextView当图像存在时必须位于左侧并且在到达图像底部后它必须
如何在springboot中跳过失败的bean以避免reportFailure:771 >>应用程序启动失败

有没有办法跳过失败 bean 以避免应用程序启动失败让我解释一下这个场景我在应用程序启动时创建 hazlecast bean 有时 hazecast 服务器可能不存在那时当我启动 springboot 应用程序时 hazecast
UI 测试中的呼叫按钮？

我想知道是否可以从电话方案中点击呼叫按钮例如 tel 555555555 因为如果我触摸通话按钮我会收到一条提醒提示我需要确认通话或取消通话是否可以我的代码中有这个 addUIInterruptionMonitor withDes
使用 NSPredicate 删除对象

我有以下词典其中有很多子词典如何删除其中的对象isChanged 1从父字典中使用NSPredicate 0 496447097042228 cellHeight 437 isChanged 1 100000019882803 1936
如何为 PHP 全局设置 CURLOPT_CAINFO？

我知道我可以在任何特定实例上设置该选项但是我真正想要的是设置 php ini 或类似的地方以便在所有项目和所有实例中处理此问题有谁知道我可以实现这个目标的方法吗编辑我对允许证书位于不同服务器上的不同位置的解决方案特别感兴趣我正在
使用 JavaScript 代替 AppleScript 实现邮件规则自动化

我正在尝试使用 Javascript 自动化而不是 AppleScript 构建 Mail app 规则在 OS X Yosemite 上但我停留在基础知识上我在 AppleScript 中看到这段代码 using terms fro
如何将参数传递给 Rails 控制器方法，然后使用 JQuery/AJAX 返回值？

我使用单击函数首先获取数组位置然后通过 AJAX 调用将其发布到控制器方法然后我希望该方法返回一个布尔值以启用 jquery 函数中的 addClass 控制台始终抛出 500 服务器错误这是 js 文件 document read
安装 GDL 以在 Python 中使用

我需要使用一些GDL http gnudatalanguage sourceforge net credits php我的 Python 代码中的例程 In the GitHub 仓库 https github com cenit GDL
如何调整对象大小 - Autodesk Forge Viewer

我怎样才能改变对象的大小我需要改变物体的高度例如我们需要更改门或窗帘的高度在此代码中我的对象消失了 let change function const viewer oViewer const model viewer model
当涉及到finally块的返回值时，在try块中包含return语句是一个好习惯吗？

我想知道这是一个好的做法吗return from try block package debug author Owner public class Main public static void main String args Syst
t-sql 中的正确/标题大小写

我正在使用 SQL 2012 RC0 并寻找一个可以将保存名字和姓氏的列转换为正确标题大小写的函数我环顾四周但似乎找不到任何东西如果有另一篇文章请告诉我我会关闭这篇文章我想要转换的表格列是从 Web 前端的用户输入字段填充的
Rails 中什么时候需要重启服务器？

我注意到当我更改 Rails 项目文件时例如html erb or css 我不必使用以下命令重新启动服务器rails s命令但我认为当我想安装新的 gem 时我必须这样做问题是我正在尝试让 jQuery 工作所以我厌倦了这样做ra
api_platform 产生错误“找不到 uri [/index/_doc/_search] 和方法 [POST] 的处理程序”

当尝试通过 fos elastica bundle v6 0 0 将 elasticsearch v7 9 3 实现到我的 Symfony v5 3 10 App with api platform v2 6 6 中时我不断收到此错误 e
asp.net mvc参数从页面到局部视图

我遇到了一个问题我有一个传递参数的 ajax 链接但是它打开的页面不需要该参数该页面仅加载 2 个部分视图其中一个需要将该参数传递给页面才能正确加载数据另一个只需要加载表单因此不需要该参数我怎样才能做到这一点为了执行您想要的
使用 Spring MVC 处理 MaxUploadSizeExceededException

当文件大小超出时如何拦截并发送文件上传的自定义错误消息我在控制器类中有一个带注释的异常处理程序但请求未到达控制器我在此链接中找到的答案如何处理MaxUploadSizeExceededException https stackove
为什么需要softmax函数？为什么不进行简单的标准化呢？

我对深度学习不熟悉所以这可能是一个初学者问题根据我的理解多层感知器中的softmax函数负责标准化和分配每个类别的概率如果是这样我们为什么不使用简单的标准化呢假设我们得到一个向量x 10 3 2 1 应用softmax 输出将是

为什么需要softmax函数？为什么不进行简单的标准化呢？

为什么需要softmax函数？为什么不进行简单的标准化呢？ 的相关文章

随机推荐

热门标签

为什么需要softmax函数？为什么不进行简单的标准化呢？的相关文章