torch的交叉熵损失函数(cross_entropy)计算(含python代码)

2023-11-16

1.调用

首先，torch的交叉熵损失函数调用方式为：

torch.nn.functional.cross_entropy(input, target, weight=None, size_average=None, ignore_index=-100, reduce=None, reduction='mean')

一般会写成：

import torch.nn.functional as F
F.cross_entropy(input, target)

2.参数说明

输入（张量）–(N, C)，其中C = 类别数；或在 2D 损失的情况下输入尺寸为(N, C, H, W) ，或在K≥1 在 K 维损失的情况下输入尺寸为 (N, C, d1, d2, ..., dK) 。
target（张量）-(N)，其中每个值是 0≤target[i]≤C-1，或者在 K≥1 对于 K 维损失，目标张量的尺寸为(N, d1, d2, ..., dK)。
weight ( Tensor , optional ) – 对每个类别的手动重新缩放权重。如果给定，则必须是大小为C的张量
size_average ( bool , optional ) – 不推荐使用。默认情况下，损失是批次中每个损失元素的平均值。请注意，对于某些损失，每个样本有多个元素。如果该字段size_average 设置为False，则对每个小批量的损失求和。当 reduce 为时忽略False。默认：True
ignore_index ( int , optional ) – 指定一个被忽略且对输入梯度没有贡献的目标值。当size_average为时 True，损失在未忽略的目标上取平均值。默认值：-100
reduce ( bool , optional ) – 不推荐使用。默认情况下，损失对每个小批量的观察进行平均或求和，取决于size_average。当reduceis 时False，返回每个批次元素的损失并忽略size_average。默认：True
reduce ( string , optional ) – 指定应用于输出的缩减： 'none'| 'mean'| 'sum'. 'none': 不会应用减少, 'mean': 输出的总和将除以输出中的元素数, 'sum': 输出将被求和。注意：size_average 和reduce正在被弃用，同时，指定这两个参数中的任何一个都将覆盖reduction. 默认：'mean'

3.举例说明

代码：

import torch
import torch.nn.functional as F
input = torch.randn(3, 5, requires_grad=True)
target = torch.randint(5, (3,), dtype=torch.int64)
loss = F.cross_entropy(input, target)
loss.backward()

变量输出：


input:
tensor([[-0.6314,  0.6876,  0.8655, -1.8212,  0.0963],
        [-0.5437,  0.2778, -0.1662, -0.0784, -0.6565],
        [-0.1164,  0.3882,  0.2487, -0.5318,  0.3943]], requires_grad=True)
target:
tensor([1, 0, 0])
loss:
tensor(1.6557, grad_fn=<NllLossBackward>)

4.注意

python里的torch.nn.functional.cross_entropy函数的实现是：

def cross_entropy(input, target, weight=None, size_average=None, ignore_index=-100,
                  reduce=None, reduction='mean'):
    if size_average is not None or reduce is not None:
        reduction = _Reduction.legacy_get_string(size_average, reduce)
    return nll_loss(log_softmax(input, 1), target, weight, None, ignore_index, None, reduction)

注意1：输入张量不需要经过softmax，直接从fn层拿出来的张量就可以送入交叉熵中，因为在交叉熵中已经对输入input做了softmax了。

注意2：不用对label进行one_hot编码，因为nll_loss函数已经实现了类似one-hot过程，不同之处是当class = [1, 2, 3]时要处理成从0开始[0, 1, 2]。

这里把官方网站的地址也放这里：torch.nn.functional — PyTorch master documentationhttps://pytorch.org/docs/1.2.0/nn.functional.html#torch.nn.functional.cross_entropy

整理不易，欢迎一键三连！！！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

基本知识

python

Pytorch

交叉熵

crossentropy

torch的交叉熵损失函数(cross_entropy)计算(含python代码) 的相关文章

动态向类添加类方法

我有以下片段 FEED TYPES fan mail Fan Mail review Review tip Tip fan user Fan User fan song Fan Song fan album Fan Album played
在Python中，如何将矩阵逆时针旋转90度？

gt gt gt def rotate matrix k List List int For example if I have m 1 2 3 2 3 3 5 4 3 rotate matrix m should give me 3 3
如果 Excel 文件是由程序创建的，Pandas read_excel 对于具有简单公式的单元格返回 nan [重复]

这个问题在这里已经有答案了 I use pd read excel读取由以下命令创建的 excel 文件openpyxl并从一个网址下载解析后的数据框将给出nan如果单元格值是公式 which formula is simply 100
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
Django 2、python 3.4 无法解码 urlsafe_base64_decode(uidb64)

我正在尝试通过电子邮件激活用户电子邮件有效编码有效我使用了 django1 11 中的方法该方法运行成功在 Django 1 11 中以下内容成功解码为 28 其中 uidb64 b Mjg force text urlsafe
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何在matplotlib中调整x轴

I have a graph like this x轴上的数据表示小时所以我希望x轴设置为0 24 48 72 而不是现在的值很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
如何使用 enumerate 来倒数？

letters a b c 假设这是我的清单在哪里for i letter in enumerate letters 将会 0 a 1 b 2 c 我怎样才能让它向后枚举如 2 a 1 b 0 c 这是一个很好的解决方案并且工作完美 i
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA

随机推荐

三维数据处理软件架构

三维数据处理软件都包含哪些模块三维数据处理软件一般包含三个模块数据管理和处理三维渲染 UI 这与图形学的三个经典问题是相对应的建模渲染和交互与一般常见的数据处理软件比如图像视频处理不同的是这里的数据展示模块需要三维渲染
numpy中的mean()函数

mean 函数定义 numpy mean a axis dtype out keepdims mean 函数功能求取均值经常操作的参数为axis 以m n矩阵举例 axis 不设置值对 m n 个数求均值返回一个实数 axis 0
VB联合Python开发

用到 Python 首先你肯定得装一个Python吧用3 x的创建一个 py文件说明需要引用pythoncom 这个需要pip install pywin32 import pythoncom class PythonUtiliti
R语言缺失值填补

本文主要介绍如何利用R语言进行数值型缺失值的填补主要使用zoo包中的na aggregate na approx na locf 函数进行缺失值的均值填补线性插值填补以及邻近值填补 install packages zoo librar
开源是物联网的驱动力量

本文转载至 http www infoq com cn articles open source as a driver of internet of things utm campaign infoq content utm source
Shell脚本攻略：通配符、正则表达式

目录一理论 1 通配符 2 正则表达式二实验 1 通配符 2 正则表达式一理论 1 通配符 1 概念通配符只用于匹配文件名目录名等不能用于匹配文件内容而且是已存在的文件或者目录各个版本的shell都有通配符这些通配符
《Android 开发艺术探索》笔记2--IPC机制

Android 开发艺术探索笔记2 IPC机制思维导图 Android IPC简介 Android中的多进程的模式 IPC基础概念 Serializable接口 Parcelable接口 Android的几种跨进程的方式使用Bundl
having where 你真的了解了吗？

where group by group by 字句和 where条件语句结合在一起使用当结合在一起时 where在前 group by 在后即先对select xx from xx的记录集合用where进行筛选然后再使用group
QT 三种关联信号和槽的办法

1 手动关联 connect ui gt showChildButton QPushButton clicked this MyWidget showChildDialog 2 自动关联右键单击按钮弹出菜单中选择转到槽 void MyD
Basic Level 1052 卖个萌 (20分)

题目萌萌哒表情符号通常由手眼口三个主要部分组成简单起见我们假设一个表情符号是按下列格式输出的左手左眼口右眼右手现给出可选用的符号集合请你按用户的要求输出表情输入格式输入首先在前三行顺序对应给出手眼口的可选
vue添加水印踩坑

介绍前景 app页面添加水印展示技术实现 watermark dom 完整代码 vue watermark 实现效果功能描述添加删除更新水印引入方式一推荐方便拓展在index html引入相关文件方式二 npm包引入
java byte[] 学习总结

最近在学习netty 突然发现自己对字符数组是那么的陌生吓死宝宝了然后各种学习然后测试终于会用一些了下线的都是本人的学习笔记 byte表是字符一个字节 8位可以组成2 8 256中不同数字 byte存值范围 128 127 1
pytorch基本使用_02

import numpy as np import torch 从numpy引入tensor a np array 2 3 3 print torch from numpy a tensor 2 0000 3 3000 dtype torc
java线上CPU100%如何排查

定位耗费CPU的进程 top c 就可以显示进程列表然后输入P 按照cpu使用率排序你会看到类似下面的东西 2 定位耗费CPU的线程 top Hp 1500 就是输入那个进程id就好了然后输入P 按照cpu使用率排序你会看到类型下面
单片机c语言数码管显示0到9,单片机如何让8个数码管同时流水显示0到9，大家帮我看看！...

按你的要求修改如下 include reg52 h 此文件中定义了单片机的一些特殊功能寄存器 typedef unsigned int u16 对数据类型进行声明定义 typedef unsigned char u8 sbit LSA P2
Java 网络编程UDP协议之发送数据和接收数据的详解

博主前些天发现了一个巨牛的人工智能学习网站通俗易懂风趣幽默忍不住也分享一下给大家点击跳转到网站 UDP协议用户数据报协议 User Datagram Protocol UDP是无连接通信协议即在数据传输时数据的发送端和接收端不
《信号与系统》4.10.2工频干扰的滤除

平台版本 Multisim14 1 参考书籍信号与系统 4 10 2工频干扰的滤除工程上滤除工频干扰比较常用的电路是无源双T陷波滤波器图示双T的无源陷波滤波器电路陷波器是某一小频率范围内的带阻滤波器陷波器的一个常见的应用是滤除
Seaborn入门详细教程

作者 luanhz 来源小数志 Seaborn入门详细教程导读今天我们来介绍 seaborn 这是一个基于matplotlib进行高级封装的可视化库相比之下绘制图表更为集成化绘图风格具有更高的定制性教程目录 01 初始seab
一文带你了解序列化与反序列化基本原理与操作

文章目录一什么是序列化与反序列化二为什么我们需要序列化与反序列化三步骤说明四注意说明五代码说明六序列化与反序列化原理一什么是序列化与反序列化序列化是指将对象转换为字节序列的过程以便于存储或传输在序列化过程中
torch的交叉熵损失函数(cross_entropy)计算(含python代码)

1 调用首先 torch的交叉熵损失函数调用方式为 torch nn functional cross entropy input target weight None size average None ignore index 100