深度理解yolov3损失函数

2023-11-11

深度理解yolov3损失函数

在yolov3中，loss分为三个部分：

一个是xywh部分带来的误差，也就是bbox带来的loss
一个是置信度带来的误差，也就是obj带来的loss
最后一个是类别带来的误差，也就是class带来的loss

在代码中分别对应lbox,lobj,lcls，yolov3中使用的loss公式如下：

$\begin{aligned} lbox &= \lambda_{coord}\sum_{i=0}^{S^2}\sum_{j=0}^{B}1_{i,j}^{obj}(2-w_i\times h_i)[(x_i-\hat{x_i})^2+(y_i-\hat{y_i})^2+(w_i-\hat{w_i})^2+(h_i-\hat{h_i})^2] \\ lcls &= \lambda_{class}\sum_{i=0}^{S^2}\sum_{j=0}^{B}1_{i,j}^{obj}\sum_{c\in classes}p_i(c)log(\hat{p_i}(c)) \\ lobj &= \lambda_{noobj}\sum_{i=0}^{S^2}\sum_{j=0}^{B}1_{i,j}^{noobj}(c_i-\hat{c_i})^2+\lambda_{obj}\sum_{i=0}^{S^2}\sum_{j=0}^{B}1_{i,j}^{obj}(c_i-\hat{c_i})^2 \\ loss &= lbox + lobj + lcls \end{aligned}$

其中：

S:代表grid size， $S^2$ 代表 13×13,26×26,52×52

B：box

$1_{i,j}^{obj}$ ：如果在i,j处的box有目标，其值为1，否则为0

$1_{i,j}^{noobj}$ ：如果在i,j处的box没有目标，其值为1，否则为0

BCE(binary cross entropy)具体计算公式如下：

$BCE(\hat{c_i},c_i)=-\hat{c_i}\times log(c_i)-(1-\hat{c_i})\times log(1-c_i)$

以上是论文中yolov3对应的损失函数分析，对应框架为darknet。而pytorch版本的yolov3改动比较大，分成三个部分进行具体分析：

1.lbox部分

在U版yolov3中，使用的是GIOU，具体讲解见GIOU讲解链接

简单来说其IoU公式如下：

$IoU=\frac{|A\cap B|}{|A\cup B|}$

而GIoU公式如下：

$GIoU=IoU-\frac{|A_c-U|}{|A_c|}$

其中 $A_c$ 代表两个框最小闭包区域面积，也就是同时包含了预测框和真实框的最小框的面积。

yolov3中提供了IoU，GIoU，DIoU和CIoU等计算方式，以GIoU为例：

if GIoU:  # Generalized IoU https://arxiv.org/pdf/1902.09630.pdf
    c_area = cw * ch + 1e-16  # convex area
    return iou - (c_area - union) / c_area  # GIoU

可以看到代码和GIoU公式是一致的，再来看一下lbox计算部分：

giou = bbox_iou(pbox.t(), tbox[i],
				x1y1x2y2=False, GIoU=True) 
lbox += (1.0 - giou).sum() if red == 'sum' else (1.0 - giou).mean()

可以看到box的loss是1-giou的值。

2.lobj部分

lobj代表置信度，即该bounding box中是否含有物体的概率。在yolov3代码中obj loss可以通过arc来指定，有两种模式：

如果采用default模式，使用BCEWithLogitsLoss，将obj loss和cls loss分开计算：

BCEobj = nn.BCEWithLogitsLoss(pos_weight=ft([h['obj_pw']]), reduction=red)
if 'default' in arc:  # separate obj and cls
    lobj += BCEobj(pi[..., 4], tobj)  # obj loss
    # pi[...,4]对应的是该框中含有目标的置信度，和giou计算BCE
    # 相当于将obj loss和cls loss分开计算

如果采用BCE模式，使用的也是BCEWithLogitsLoss，计算对象是所有的cls loss：

BCE = nn.BCEWithLogitsLoss(reduction=red)
elif 'BCE' in arc:  # unified BCE (80 classes)
    t = torch.zeros_like(pi[..., 5:])  # targets
    if nb:
        t[b, a, gj, gi, tcls[i]] = 1.0 # 对应正样本class置信度设置为1
        lobj += BCE(pi[..., 5:], t)#pi[...,5:]对应的是所有的class

3.lcls部分

如果是单类的情况，cls loss=0

如果是多类的情况，也分两个模式：

如果采用default模式，使用的是BCEWithLogitsLoss计算class loss。

BCEcls = nn.BCEWithLogitsLoss(pos_weight=ft([h['cls_pw']]), reduction=red)
# cls loss 只计算多类之间的loss,单类不进行计算
if 'default' in arc and model.nc > 1:
    t = torch.zeros_like(ps[:, 5:])  # targets
    t[range(nb), tcls[i]] = 1.0 # 设置对应class为1
    lcls += BCEcls(ps[:, 5:], t)  # 使用BCE计算分类loss

如果采用CE模式，使用的是CrossEntropy同时计算obj loss和cls loss。

CE = nn.CrossEntropyLoss(reduction=red)
elif 'CE' in arc:  # unified CE (1 background + 80 classes)
    t = torch.zeros_like(pi[..., 0], dtype=torch.long)  # targets
    if nb:
    t[b, a, gj, gi] = tcls[i] + 1 # 由于cls是从零开始计数的，所以+1
    lcls += CE(pi[..., 4:].view(-1, model.nc + 1), t.view(-1))
    # 这里将obj loss和cls loss一起计算，使用CrossEntropy Loss

以上三个部分总结下来就是下图：

参考链接：https://www.cnblogs.com/pprp/p/12590801.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

YOLO

深度学习

YOLOv3

深度理解yolov3损失函数的相关文章

【网络通信】Netty面试专题之十大考问

1 BIO NIO 和 AIO 的区别 BIO 一个连接一个线程客户端有连接请求时服务器端就需要启动一个线程进行处理线程开销大伪异步 IO 将请求连接放入线程池一对多但线程还是很宝贵的资源 NIO 一个请求一个线程但客户端发送的
你知道this.$options吗？（Vue）

题记我们在Vue项目中会有很多情况下需要用到this options 所以接下来我们介绍几个场景会用到 options 我们想第一个问题当我们在template经常使用filter 那么你可以直接在methods里边用过滤器吗我们在表单
GC 的三种基本实现方式

GC 的三种基本实现方式参考资料代码的未来作者日松本行弘由于并非本人原著我只是个搬运工 SO 未经本人允许请尽情转载另外个人像说明一下这里所说的GC指泛指垃圾回收机制而单指Java或其他某种特定语言中的GC 可能具体语言
【PTA】7-6 整除光棍

7 6 整除光棍这里所谓的光棍并不是指单身汪啦说的是全部由1组成的数字比如1 11 111 1111等传说任何一个光棍都能被一个不以5结尾的奇数整除比如 111111就可以被13整除现在你的程序要读入一个整数x 这个整数一
设计模式-day02

4 创建型模式 4 2 工厂模式 4 2 1 概述需求设计一个咖啡店点餐系统设计一个咖啡类 Coffee 并定义其两个子类美式咖啡 AmericanCoffee 和拿铁咖啡 LatteCoffee 再设计一个咖啡店类 CoffeeS
Ubuntu虚拟机和Windows实现文件拖拽复制粘贴

方法安装vm tools 1 在Ubuntu内部鼠标右键打开终端 2 更新apt get 一般新装的系统都需要更新apt get sudo apt get update ps 若无法更新可以试着换一下镜像站 Ubuntu系统配置镜像站
Python基础系列2——Numpy数值计算及分析

文章目录 1 实验内容 2 实验过程 2 1 numpy数组的建立索引计算统计等 2 2 利用numpy对数据集 iris data 进行分析 3 实验结论及注意事项 1 实验内容 1 numpy数组的建立索引计算统计等 2 利
BIOS和BootLoader uboot

BIOS BIOS是英文 Basic Input Output System 的缩略语直译过来后中文名称就是基本输入输出系统其实它是一组固化到计算机内主板上一个ROM芯片上的程序它保存着计算机最重要的基本输入输出的程序系统设置信

随机推荐

Java Sort方法

Java的sort方法就是排序而且排的是升序你要想降序可以先获得升序的然后倒过来或者你重新写比较器Comparator的接口就可以一 sort 排序方法本身这里讲的sort方法都是以Arrays类里面的方法为准因为很多类的so
STM32 端口复用学习

一 STM32端口复用 1 端口复用定义 STM32有很多的内置外设这些外设的外部引脚都是与GPIO复用也就是说一个GPIO如果可以复用为内置外设的功能引脚那么当这个GPIO作为内置外设使用的时候就叫做复用 2 作用最大限度的利
vue 实现计时器组件

vue 实现计时器组件结果图 v if 和 v show 的区别总结来说v if是在不断的销毁和重建 v show 只是改变 display 属性元素依然存在 dom 中 v if 切换开销大 v show 初始化开销大 time v
人称代词用法大全

语言发明出来自然是要给人用的所以跟人相关的词就特别多划分的很细我们提到某个具体的人一般就直接说名字但有时是泛指或者前面已经提过名字了后面用个啥简称指代下就清楚了这就需要代词代词嘛顾名思义是一个代称是指代某个人或者某类人某
搭建使用 VS 开发 Qt 项目的环境

搭建使用 VS 开发 Qt 项目的环境个人认为使用 Qt 工具开发 Qt 项目是最好的方案在开发的过程出现的 bug 会比较少一些但是有些同伴可能对 VS 比较钟爱而 VS 又有此功能因此想采用 VS 进行开发本文将本人搭建成
nacos源码启动找不到istio包

现象源码版本2 1 0 启动时编译不通过报错找不到 istio mcp v1alpha1 MetadataOuterClass Metadata istio networking v1alpha3 ServiceEntryOuter
算法：链表

单链表单链表是一种链式存取的数据结构链表中的数据是以结点来表示的每个结点存储两个数据一是该结点本身的值二是其指向的下一结点的下标用e i 表示节点i的值用ne i 表示结点i指向的下一结点的坐标 head表示头结点的下标 id
网关系统架构

目录一 API网关业务域 1 业务域 2 统一接入 3 安全防护 4 流量管控 5 协议转换 6 其他业务 1 接口文档管理 2 调试工具和示例 3 SDK自动生成能力 4 API增强二 API网关核心指标 1 模型 2 安全性 3 高
C语言编写的简单计算器程序

这两天在看一个C语言写的计算器程序做了不少的功夫跟着作者一步步的进行完善了解了许多细节性的东西在此自己做个总结加深自己对程序的印象也算是梳理在该计算器程序能进行加减乘除 sin cos exp等操作同时能进行数值保存功能
2021浙江工商计算机机试1

1不在数列中的数字给出一个长度为n的数列包含1到n的数字输出1到n中不在数列中的数字 include
Android studio64新建APP项目时,报错 junit:junit:4.12

大家都是要求注释掉但不想这样看了很多博客快绝望的时候用这个办法成功了文件 E android app 工程文件目录下面的 build gradle 文件在这个文件中加入最后划线3行保存即可然后再retry apply pl
VS安装配置OpenCV(C++)

目录第一章 Opencv安装及其环境变量配置 1 1下载并安装OpenCV 1 2 OpenCV环境变量配置第二章 Visual Studio 2019 编译器下载安装第三章 OpenCV开发环境配置 C 3 1创建项目 3 2 添加
全国信息技术标准化技术委员会汉字内码扩展规范(GBK)

全国信息技术标准化技术委员会汉字内码扩展规范 GBK Chinese Internal Code Specification 1 0 版按编码顺序排列 81 丂丄丅丆丏丒丗丟丠両丣並丩丮丯丱丳丵丷丼
记一次使用EasyExcel出现Convert excel format exception.You can try specifying the ‘excelType‘ yourself

EasyExcel 3 0 出现 com alibaba excel exception ExcelCommonException Convert excel format exception You can try specifying
Vue常用知识点汇总

1 Vue常见的指令有哪些有什么用 1 v text 会替换掉元素里的内容 2 v html 可以渲染html界面 3 v clock 防止界面闪烁 4 v bind 界面元素属性值的绑定简写为 5 v on 事件绑定简写为 6 v
K8s 管理工具 kubectl 详解

文章目录一陈述式管理 1 陈述式资源管理方法 2 k8s 相关信息查看 2 1 查看版本信息 2 2 查看资源对象简写 2 3 查看集群信息 2 4 配置kubectl自动补全 2 5 查看日志 2 6 基本信息查看 2 6 1 查看m
SPRING是如何解决循环依赖的？为什么无法解决多例和构造器的循环依赖

标签 java spring 文章目录 1 什么是循环依赖 2 解决循环依赖思路 3 二级缓存能否解决循环依赖三级缓存存在的意义 4 多例和构造器为什么无法解决循环依赖 5 如何进行扩展 6 spring在创建bean的时候在哪里创建的
【C++数据结构】程序性能分析

程序性能分析 2 1 什么是程序性能程序性能所谓程序性能 performance of a program 是指运行这个程序所需要的内存和时间的多少性能分析在性能分析 performance analysis 时采用分析方法性能
在gitee网页中创建分支后，在vscode中更新分支

在vscode中更新gitee上创建的分支在网页创建分支之后 vscode中git pull origin更新在gitee创建的分支更新之后这里有origin test分支选中之后通过git bracn就可以看到线上的分支了
深度理解yolov3损失函数

深度理解yolov3损失函数在yolov3中 loss分为三个部分一个是xywh部分带来的误差也就是bbox带来的loss 一个是置信度带来的误差也就是obj带来的loss 最后一个是类别带来的误差也就是class带来的loss

深度理解yolov3损失函数

深度理解yolov3损失函数

深度理解yolov3损失函数 的相关文章

随机推荐

热门标签

深度理解yolov3损失函数的相关文章