为何pytorch nn.KLDivLoss()损失计算为负数？

2023-11-11

参考文献：https://www.zhihu.com/question/384982085
先来看一下KL散度的定义
在这里插入图片描述

这里是要用分布Q为标签（原始分布），分布P作为预测值（预测分布）

在pytorch中，nn.KLDivLoss()的计算公式如下：
在这里插入图片描述
上图y为标签，x为预测值，则pytorch应该以如下代码使用

lossfunc = nn.KLDivLoss()
loss = lossfunc(预测值, 标签值)

但是，由于计算公式中，预测值x的输入要是对数形式，而标签值y则不需要，所以如果我们要对预测值和标签值的softmax值求KL散度就需要如下：

temp = 1 #温度系数
probs = torch.Tensor([[2, 6, 8], [7, 1, 2], [1, 9, 2.3], [1.9, 2.8, 5.4]])
target = torch.Tensor([[0.8, 0.1, 0.1], [0.1, 0.7, 0.2], [0.5, 0.2, 0.3], [0.4, 0.3, 0.3]])
loss = lossfunc(F.log_softmax(probs / temp, dim=1), F.softmax(target / temp, dim=1))#如果probs和target已经是softmax的形式，就只需要给probs取对数输入就行了

也就是说要给输入的预测值预先取个对数，这样计算结果就不为负数了

错误示范：

probs = torch.Tensor([[2, 6, 8], [7, 1, 2], [1, 9, 2.3], [1.9, 2.8, 5.4]])
target = torch.Tensor([[0.8, 0.1, 0.1], [0.1, 0.7, 0.2], [0.5, 0.2, 0.3], [0.4, 0.3, 0.3]])
loss1 = lossfunc(F.softmax(probs / temp, dim=1), F.softmax(target / temp, dim=1))
loss2 = lossfunc(probs, target)

这样两个散度算出来就都是负数

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

KL散度

python

为何pytorch nn.KLDivLoss()损失计算为负数？的相关文章

通过 boto3 承担 IAM 用户角色时访问被拒绝

Issue 我有一个 IAM 用户和一个 IAM 角色我正在尝试将 IAM 用户配置为有权使用 STS 承担 IAM 角色我不确定为什么收到访问被拒绝错误 Details IAM 角色 arn aws iam 123456789 r
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
python celery -A 的无效值无法加载应用程序

我有一个以下项目目录 azima init py main py tasks py task py from main import app app task def add x y return x y app task def mul
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
在Python中读取tiff标签

我正在尝试用 Python 读取 tiff 文件的标签该文件是 RGB 的uint16每个通道的值我目前正在使用tifffile import tifffile img tifffile imread file tif 然而 img是一
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette
Jupyter 笔记本中未显示绘图图表

我已经尝试解决这个问题几个小时了我按照上面的步骤操作情节网站 https plot ly python getting started start plotting online并且图表仍然没有显示在笔记本中这是我的情节代码 color
时间序列数据预处理 - numpy strides 技巧以节省内存

我正在预处理一个时间序列数据集将其形状从二维数据点特征更改为三维数据点时间窗口特征在这样的视角中时间窗口有时也称为回顾指示作为输入变量来预测下一个时间段的先前时间步长数据点的数量换句话说时间窗口是机器学习算法在对
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
如何从列表类别中对 pandas 数据框进行排序？

所以我在下面有这个数据集我想根据我的列表从名称列进行排序以及按 A 升序和按 B 降序排序 import pandas as pd import numpy as np df1 pd DataFrame from items A 1
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
寻找完美的正方形

我有这个Python代码 def sqrt x ans 0 if x gt 0 while ans ans lt x ans ans 1 if ans ans x print x is not a perfect square return

随机推荐

数字IC后端设计技术全局观

数字IC后端设计flow 不含DFT 数字IC后端设计工具 DC 用于逻辑综合 FM 用于形式验证 ICC 用于物理实现 PrimeTime 用于STA 步骤或文件类型简述 RTL Register Transfer Level v文件
mysql8.0收费价格,MySQl 8.0遇到的坑

报错 Illuminate Database QueryException SQLSTATE HY000 1045 Access denied for user root localhost using password NO SQL cr
Trying to access array offset on value of type int

问题描述出现报错信息先百度翻译试图访问int类型值的数组偏移量通过翻译得知 int型的数据被其他不能使用的类型使用了个人理解关于这块 php7 4升级之后会有这个bug 网上大多人是说 7 4 版本的向后不兼容更改非数组的数组
valgrind Massif

valgrind检查内存泄露 valgrind 程序内存泄漏问题我们有memcheck工具来检查很爽但是有时候memcheck工具查了没泄漏程序一跑内存还是狂飙这又是什么问题其实memcheck检查的内存泄漏只是狭义的内存泄
Docker——安装和启动

一环境准备 1 安装Linux虚拟机软件 VMware或VirtualBox 比VMware更小巧轻便且免费此处安装VirtulaBox 2 安装Linux虚拟系统在管理中选择导入虚拟电脑记得选中重新初始化所有网卡的MAC地址双击
Dynamics CRM 365 如何设置经典登录页面

Don t be surprised If you don t see classic interface post your sign up for dynamics 365 Okay let s face it We are losin
复选框check的选中、不选中设置以及判断是否选中

复选框的设置一 JavaScript判断是否选中checkbox框二 JavaScript设置选中checkbox框三 JavaScript移除选中checkbox框四使用jQuery判断是否选中checkbox框五使用jQu
国密(1) - 私钥Key文件（ PEM格式）编解码方法

详细的PEM文件格式解析 PEM文件是按照私钥的ASN 1的格式 RFC5208 5915 5480 进行DER编码后输出二进制串的基础上再进行Base64的编码也就是每6个bit为一组生成一个ascii码字符需要4组6个bit
学习笔记59—收藏这7个在线配色神器，再也不愁配色灵感了

在设计中配色方案是必要的也是让设计师头疼的一个问题所以编辑专为大家整理了一波配色神器网站不用下载任何应用程序打开即用不仅能快速的做出符合设计概念的颜色组合且有很多样品供你确认的工具设计新手们千万别错过了一 Khroma h
【macOS】Win通过VNC远程控制Macbook

Win通过VNC远程控制Macbook 参考 https zhuanlan zhihu com p 74162964 仅局域网内可用 Macbook配置进入电脑设置勾选两个选项 Windows配置安装VNC Viewer https
openpyxl操作表格的基本用法

创建文件以及创建xlsx表格 from openpyxl import Workbook load workbook import os 创建excel文件默认会有一个sheet命名的表 def create xlsx path nam
Beginng_Rust(译)：借用和生命周期（第二十二章）

在本章中您将学习借用和生命周期的概念哪些是关于借用的典型编程错误即困扰系统软件 Rust严格语法如何使用借用检查器来防止此类典型错误插入块的方式如何限制借用范围为什么函数返回引用需要生命周期指示符如何使用寿命指定符来表示
应用层的原理

目录应用层协议原理网络应用程序体系结构客户服务器 P2P 混合模式 UDP TCP 所有能产生网络流量的程序应用层协议原理网络应用程序体系结构客户服务器 P2P 混合模式 UDP TCP 可供应用程序使用的运输服务因特网提
解决liquibase.exception.LockException: Could not acquire change log lock. Currently locked by XXXX

项目启动后报liquibase exception LockException Could not acquire change log lock 解决方案执行下面语句 use job job为你的数据库 select from DATA
HTML5 history新特性pushState、replaceState

DOM中的window对象通过window history方法提供了对浏览器历史记录的读取让你可以在用户的访问记录中前进和后退从HTML5开始我们可以开始操作这个历史记录堆栈 1 History 使用back forward 和go
windows dll 装载过程

windows dll 装载过程 2010 12 04 19 13 56 分类 Windows系统平台上你可以将独立的程序模块创建为较小的DLL Dynamic Linkable Library 文件并可对它们单独编译和测试在运行时
MySQL--事务+存储引擎+表类型+视图+用户管理

目录 1 事务 1 1 概念 1 2 回退事务 1 3提交事务 1 4事务细节注意点 1 5事务的隔离级别 1 5 1 介绍 1 5 2 解决这些安全性问题 1 5 3演示脏读 1 5 4避免脏读演示不可重复发生 1 5 5 演示不可重复
Hexo 博客利用 Nginx 实现中英文切换

本文记录了对 Hexo 博客进行中英文切换的配置过程实现同一应用共用模版任何页面可以切换到另一语言的对应页面并对未明确语言的访问地址根据浏览器语言进行自动跳转实现细则中英文地址区分博客中文首页 https chanvinxia
Filter内存马浅析

1 何谓内存马以Tomcat为例内存马主要利用了Tomcat的部分组件会在内存中长期驻留的特性只要将我们的恶意组件注入其中就可以一直生效直到容器重启 Java内存shell有很多种大致分为 1 动态注册filter 2 动态注册
为何pytorch nn.KLDivLoss()损失计算为负数？

参考文献 https www zhihu com question 384982085 先来看一下KL散度的定义这里是要用分布Q为标签原始分布分布P作为预测值预测分布在pytorch中 nn KLDivLoss 的计算公式如下上

为何pytorch nn.KLDivLoss()损失计算为负数？

为何pytorch nn.KLDivLoss()损失计算为负数？ 的相关文章

随机推荐

热门标签

为何pytorch nn.KLDivLoss()损失计算为负数？的相关文章