目标检测之YOLOv3算法分析

2023-11-02

基本原理

特征网络
在这里插入图片描述

输入输出
输入 416 ∗ 416 ∗ 3 416*416*3 4164163大小的图片(不唯一,但图片大小必为32的倍数),输出3个尺度的feature map,分别为 13 ∗ 13 ∗ 255 13*13*255 1313255 26 ∗ 26 ∗ 255 26*26*255 2626255 52 ∗ 52 ∗ 255 52*52*255 5252255,即分成 13 ∗ 13 13*13 1313, 26 ∗ 26 26*26 2626, 52 ∗ 52 52*52 5252个grid cell.
每个grid cell生成3个anchor,每个anchor对应一个预测框,每个预测框有 5 + 80 5+80 5+80个参数, { ( x , y , w , h , c ) , 80   k i n d s   o f   c l a s s } \{(x,y,w,h,c),80 \space kinds \space of \space class\} {x,y,w,h,c,80 kinds of class}

输出分析
(该图取自知乎博主)
在这里插入图片描述

13 ∗ 13 ∗ 255 13*13*255 1313255 26 ∗ 26 ∗ 255 26*26*255 2626255 52 ∗ 52 ∗ 255 52*52*255 5252255分别预测大,中,小物体。
13 ∗ 13 ∗ 255 13*13*255 1313255为下采样32倍得到的特征;
26 ∗ 26 ∗ 255 26*26*255 2626255为下采样16倍与 13 ∗ 13 13*13 1313一次上采样结合得到的特征;
52 ∗ 52 ∗ 255 52*52*255 5252255为下采样8倍与 26 ∗ 26 26*26 2626一次上采样结合得到的特征;

正负样本
正样本为anchor与真实框的IOU大于指定阈值,且最大IOU的anchor;
负样本为anchor与真实框IOU小于指定阈值的anchor。

损失函数
由正样本的坐标损失、置信度损失和类别损失,负样本的置信度损失构成。
λ c o o r d ∑ i = 0 S 2 ∑ J = 0 B 1 i , j o b j [ ( b x − b x ^ ) 2 + ( b y − b y ^ ) 2 + ( b w − b w ^ ) 2 + ( b h − b h ^ ) 2 ] + ∑ i = 0 S 2 ∑ J = 0 B 1 i , j o b j [ − l o g ( p c ) + ∑ i = 1 n B C E ( c i , c i ^ ) ] + λ n o o b j ∑ i = 0 S 2 ∑ J = 0 B 1 i , j n o o b j [ − l o g ( 1 − p c ) ] \lambda_{coord} \sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{obj}[(b_x-\hat{b_x})^2+(b_y-\hat{b_y})^2+(b_w-\hat{b_w})^2+(b_h-\hat{b_h})^2]\\+\sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{obj}[-log(p_c)+\sum_{i=1}^{n}BCE(c_i,\hat{c_i})]\\+\lambda_{noobj}\sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{noobj}[-log(1-p_c)] λcoordi=0S2J=0B1i,jobj[(bxbx^)2+(byby^)2+(bwbw^)2+(bhbh^)2]+i=0S2J=0B1i,jobj[log(pc)+i=1nBCE(ci,ci^)]+λnoobji=0S2J=0B1i,jnoobj[log(1pc)]
S 2 S^2 S2为grid cell的总数, B B B为每一个grid cell的anchor数目。
第一行为计算正样本的坐标与真实框的坐标损失;
第二行为计算正样本的置信度和类别损失, 1 i , j o b j 1_{i,j}^{obj} 1i,jobj表示是否为正样本; − l o g ( p c ) -log(p_c) log(pc)中,若 p c p_c pc越接近于1,则 − l o g ( p c ) -log(p_c) log(pc)越接近于0;类别损失中,对于检测的80类,每一个类别进行二叉熵损失运算。
第三行为负样本的置信度损失, − l o g ( 1 − p c ) -log(1-p_c) log(1pc) p c p_c pc越接近于0,该式越小,接近于0

性能
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测之YOLOv3算法分析 的相关文章

随机推荐

  • JDK8的下载和安装,以及配置环境变量

    一 JDK的下载 https www oracle com java technologies downloads 1 进入JDK下载页面 2 进入下载页面 3 下载 二 JDK的安装 1 双击安装包 进入安装界面 直接点击下一步 2 选择
  • 综述---图像处理中的注意力机制

    重磅好文 微软亚研 对深度神经网络中空间注意力机制的经验性研究 论文 An Empirical Study of Spatial Attention Mechanisms in Deep Networks 高效Transformer层出不穷
  • Android MPAndroidChart使用,X轴标签自定义显示,坐标显示不全,换行显示

    一 自定义显示 XAxis xAxis chart getXAxis 获取设置X轴 ValueFormatter valueFormatter new ValueFormatter private final String xLableLi
  • 论文写作专题记录

    本文笔记来自20200317智源AI的分享 一 论文写作小白的成长之路 用理论支撑你 唉 你的这个研究确实是很有用 每个理论的后面可能都要有一个解释 即使别人不懂你这个理论 但是他也能理解这个事情 那么我们总结一下以往的工作是怎样的 所以我
  • react native js中调用native中的方法

    react native js中调用native中的方法 这里主要涉及到几个类 java ul li Base class for Catalyst native modules that require access to the lin
  • 【笔记】A simple yet effective baseline for 3d human pose estimation

    论文 https arxiv org abs 1705 03098v2 pytorch 本文代码参考 weigq 3d pose baseline pytorch A simple baseline for 3d human pose es
  • 外部中断EXTI

    项目场景 STM32外部中断 EXTI10 15 中断线挂起无法清除问题 问题描述 按键为PD14 输入模式 外部中断 进中断服务函数处理完后仍再次进入中断服务函数 无法退出 中断服务函数已加入清除中断线函数 检查引脚配置 输入模式 RCC
  • Javav中危险字符过滤工具类

    在进行网站开发时 为了避免网站遭到SQL语句的注入式攻击 应该考虑到过滤字符串中的危险字符 在该实例中 可以过滤 lt gt 等字符时 在处理页面中会把这些字符过滤掉 该示例主要利用String的replaceAll方法 public St
  • [spark]计算商品相似度

    一 商品相似度定义 基于物品的协同过滤算法是业界应用最多的算法 它的思想是给用户推荐那些和他们喜欢的物品相似的物品 主要分为两个步骤 一 计算物品之间的相似度 二 根据物品相似度和用户的历史行为给用户生成推荐列表 物品i和物品j的相似度可定
  • 创建工程文件(完整流程)

    创建并完成一个简单的工程的流程 添加文件 创建文件 此时 文件就添加完毕了 设置字体 设置Table的空格字数为4个 书写代码 拷贝的正点原子的例程 点击综合 生成设计后的原理图 第一种方法 进行I O引脚的分配 需要查看电路板的原理图分配
  • 【SSD-Caffe】安装使用教程

    1 下载镜像 参考我的另一篇博客 docker使用教程 我下载的是 docker pull bvlc caffe gpu 这个镜像 2 安装ssd caffe 下载之后这并不是ssd caffe 的环境 是较为原始版本的环境 所以还需要安装
  • 抓取iframe内数据(C#)

    当时企图抓取这iframe数据还费了不少劲 早就想记录下来 但是由于自身懒得让人惊叹 结果一直拖到现在 需求是要获取到一些网站上的大批数据 这些数据都是分很多页的 最初思路就是用web程序一页一页抓取 保存到Excel中 通常情况下用以下代
  • 5大指标:评估RPA项目的ROI,实现投资回报最大化

    ROI 投资回报率 通常是RPA项目中的一个关键指标 在企业步入自动化的早期阶段 关注RPA的投资回报率非常重要 这将影响到一个RPA项目是否值得去做 对企业运营者 尤其是COO 首席运营官 而言 RPA若实施得当 将为企业降本增效带来无与
  • 机器学习苹果识别——python+opencv实现物体特征提取

    以水果为例 要用机器学习来实现水果识别 无论是训练还是识别阶段都需要提取图片中水果的特征值 本篇将讲述如何提取水果的周长 面积 颜色 长度 宽度7个特征值 cv findContours cv findContours将图片中识别到的轮廓返
  • 如何用matlab去修改图像尺寸

    img imread test1 jpg 这里为原始图像 i imresize img 567 390 imwrite i 1 jpg 这里为修改后图像 imread imresize和imwrite 1 imread 读取图像信息 A i
  • 查看VSCode版本

    背景 想要查看一下visual studio code的版本 方法 在vscode菜单栏 帮助 gt 发行说明 Help gt Release Notes 版本为1 36
  • C++auto_ptr的用法

    文章目录 一 auto ptr是什么 二 auto ptr需要包含的头文件 三 auto ptr用法 一 auto ptr是什么 auto ptr 是C 标准库提供的类模板 auto ptr对象通过初始化指向由new创建的动态内存 它是这块
  • TCP 协议(四)重传与超时

    1 TCP 协议中的计时器 TCP 中有四种计时器 Timer 分别为 重传计时器 Retransmission Timer 持久计时器 Persistent Timer 保活计时器 Keeplive Timer 等待计时器 Timer W
  • gdb+gdbserver远程调试技术

    首先声明 此文是在别人的基础上添加一些自己的体会 之前做嵌入式开发的时候 弄过一段时间gdb gdbserver远程调试 最后无果而终 只好将就用printf 首先感谢这篇刘品的文章 看着整洁清楚 http www cnblogs com
  • 目标检测之YOLOv3算法分析

    基本原理 特征网络 输入输出 输入 416 416 3 416 416 3 416 416 3大小的图片 不唯一 但图片大小必为32的倍数 输出3个尺度的feature map 分别为