目标检测之YOLOv3算法分析

2023-11-02

基本原理

特征网络
在这里插入图片描述

输入输出
输入 416 ∗ 416 ∗ 3 416*416*3 416∗416∗3大小的图片（不唯一，但图片大小必为32的倍数），输出3个尺度的feature map,分别为 13 ∗ 13 ∗ 255 13*13*255 13∗13∗255， 26 ∗ 26 ∗ 255 26*26*255 26∗26∗255， 52 ∗ 52 ∗ 255 52*52*255 52∗52∗255,即分成 13 ∗ 13 13*13 13∗13, 26 ∗ 26 26*26 26∗26, 52 ∗ 52 52*52 52∗52个grid cell.
每个grid cell生成3个anchor,每个anchor对应一个预测框，每个预测框有 5 + 80 5+80 5+80个参数， { （ x , y , w , h , c ） , 80 k i n d s o f c l a s s } \{（x,y,w,h,c）,80 \space kinds \space of \space class\} {（x,y,w,h,c）,80 kinds of class}

输出分析
(该图取自知乎博主)
在这里插入图片描述

13 ∗ 13 ∗ 255 13*13*255 13∗13∗255， 26 ∗ 26 ∗ 255 26*26*255 26∗26∗255， 52 ∗ 52 ∗ 255 52*52*255 52∗52∗255分别预测大，中，小物体。
13 ∗ 13 ∗ 255 13*13*255 13∗13∗255为下采样32倍得到的特征；
26 ∗ 26 ∗ 255 26*26*255 26∗26∗255为下采样16倍与 13 ∗ 13 13*13 13∗13一次上采样结合得到的特征；
52 ∗ 52 ∗ 255 52*52*255 52∗52∗255为下采样8倍与 26 ∗ 26 26*26 26∗26一次上采样结合得到的特征；

正负样本
正样本为anchor与真实框的IOU大于指定阈值，且最大IOU的anchor；
负样本为anchor与真实框IOU小于指定阈值的anchor。

损失函数
由正样本的坐标损失、置信度损失和类别损失，负样本的置信度损失构成。
λ c o o r d ∑ i = 0 S 2 ∑ J = 0 B 1 i , j o b j [ ( b x − b x ^ ) 2 + ( b y − b y ^ ) 2 + ( b w − b w ^ ) 2 + ( b h − b h ^ ) 2 ] + ∑ i = 0 S 2 ∑ J = 0 B 1 i , j o b j [ − l o g ( p c ) + ∑ i = 1 n B C E ( c i , c i ^ ) ] + λ n o o b j ∑ i = 0 S 2 ∑ J = 0 B 1 i , j n o o b j [ − l o g ( 1 − p c ) ] \lambda_{coord} \sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{obj}[(b_x-\hat{b_x})^2+(b_y-\hat{b_y})^2+(b_w-\hat{b_w})^2+(b_h-\hat{b_h})^2]\\+\sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{obj}[-log(p_c)+\sum_{i=1}^{n}BCE(c_i,\hat{c_i})]\\+\lambda_{noobj}\sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{noobj}[-log(1-p_c)] λcoordi=0∑S2J=0∑B1i,jobj[(bx−bx^)2+(by−by^)2+(bw−bw^)2+(bh−bh^)2]+i=0∑S2J=0∑B1i,jobj[−log(pc)+i=1∑nBCE(ci,ci^)]+λnoobji=0∑S2J=0∑B1i,jnoobj[−log(1−pc)]
S 2 S^2 S2为grid cell的总数， B B B为每一个grid cell的anchor数目。
第一行为计算正样本的坐标与真实框的坐标损失；
第二行为计算正样本的置信度和类别损失， 1 i , j o b j 1_{i,j}^{obj} 1i,jobj表示是否为正样本； − l o g ( p c ) -log(p_c) −log(pc)中，若 p c p_c pc越接近于1，则 − l o g ( p c ) -log(p_c) −log(pc)越接近于0；类别损失中，对于检测的80类，每一个类别进行二叉熵损失运算。
第三行为负样本的置信度损失， − l o g ( 1 − p c ) -log(1-p_c) −log(1−pc)中 p c p_c pc越接近于0，该式越小，接近于0

性能
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测之YOLOv3算法分析的相关文章

基于粒子群算法的电动汽车充电动态优化策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
华为OD机试真题-字符串拼接-2023年OD统一考试（C卷）

题目描述给定M 0
华为OD机试真题-计算三叉搜索树的高度-2023年OD统一考试（C卷）

题目描述定义构造三叉搜索树规则如下每个节点都存有一个数当插入一个新的数时从根节点向下寻找直到找到一个合适的空节点插入查找的规则是 1 如果数小于节点的数减去500 则将数插入节点的左子树 2 如果数大于节点的数加上500 则将数
【C++入门】C++ STL中string常用函数用法总结

目录前言 1 string使用 2 string的常见构造 3 string类对象的访问及遍历迭代器遍历访问 4 string类对象的容量操作 4 1 size和length 4 2 clear empty和capacity 4 3
【具有延迟反馈的滤波器，其具有负群延迟】对于混沌系统，在可预测性高的阶段，该滤波器具有预测能力(Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【状态估计】【卡尔曼-加权最小二乘(KEWLS)和KEWLS-KF(KKF)】采用低维线性卡尔曼滤波器将单个传感器测量外推/预测到单个估计瞬间，用于WLS多点定位方法的新方法（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
矩阵基本操作

问题描述已知一个n n的矩阵方阵n lt 100 把矩阵主副对角线上的元素值加上x 然后输出这个新矩阵输入格式一行两个变量用空格隔开代表n和x 接下来的n行每行n列表示矩阵的数值用空格隔开输出格式输出新矩阵每个数字5个
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
【牛客周赛Round 27】题目讲解

题目一小红的二进制删数字小红拿到了一个二进制字符串 s 她可以删掉其中的一些字符使得最终该字符串为一个2的幂即可以表示为 2 k 形式的数小红想知道自己最少删几个字符可以达成请你编写一个函数返回这个答案具体思路看到这道题目
华为OD机试2024年最新题库（Java）

我是一名软件开发培训机构老师我的学生已经有上百人通过了华为OD机试学生们每次考完试会把题目拿出来一起交流分享重要 2024年1月 5月考的都是OD统一考试 C卷题库已经整理好了命中率95 以上这个专栏使用 Java 解法问
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
最大流-Dinic算法，原理详解，四大优化，详细代码

文章目录零前言一概念回顾可略过 1 1流网络 1 2流 1 3最大流 1 4残留网络 1 5增广路

随机推荐

JDK8的下载和安装，以及配置环境变量

一 JDK的下载 https www oracle com java technologies downloads 1 进入JDK下载页面 2 进入下载页面 3 下载二 JDK的安装 1 双击安装包进入安装界面直接点击下一步 2 选择
综述---图像处理中的注意力机制

重磅好文微软亚研对深度神经网络中空间注意力机制的经验性研究论文 An Empirical Study of Spatial Attention Mechanisms in Deep Networks 高效Transformer层出不穷
Android MPAndroidChart使用，X轴标签自定义显示，坐标显示不全，换行显示

一自定义显示 XAxis xAxis chart getXAxis 获取设置X轴 ValueFormatter valueFormatter new ValueFormatter private final String xLableLi
论文写作专题记录

本文笔记来自20200317智源AI的分享一论文写作小白的成长之路用理论支撑你唉你的这个研究确实是很有用每个理论的后面可能都要有一个解释即使别人不懂你这个理论但是他也能理解这个事情那么我们总结一下以往的工作是怎样的所以我
react native js中调用native中的方法

react native js中调用native中的方法这里主要涉及到几个类 java ul li Base class for Catalyst native modules that require access to the lin
【笔记】A simple yet effective baseline for 3d human pose estimation

论文 https arxiv org abs 1705 03098v2 pytorch 本文代码参考 weigq 3d pose baseline pytorch A simple baseline for 3d human pose es
外部中断EXTI

项目场景 STM32外部中断 EXTI10 15 中断线挂起无法清除问题问题描述按键为PD14 输入模式外部中断进中断服务函数处理完后仍再次进入中断服务函数无法退出中断服务函数已加入清除中断线函数检查引脚配置输入模式 RCC
Javav中危险字符过滤工具类

在进行网站开发时为了避免网站遭到SQL语句的注入式攻击应该考虑到过滤字符串中的危险字符在该实例中可以过滤 lt gt 等字符时在处理页面中会把这些字符过滤掉该示例主要利用String的replaceAll方法 public St
[spark]计算商品相似度

一商品相似度定义基于物品的协同过滤算法是业界应用最多的算法它的思想是给用户推荐那些和他们喜欢的物品相似的物品主要分为两个步骤一计算物品之间的相似度二根据物品相似度和用户的历史行为给用户生成推荐列表物品i和物品j的相似度可定
创建工程文件（完整流程）

创建并完成一个简单的工程的流程添加文件创建文件此时文件就添加完毕了设置字体设置Table的空格字数为4个书写代码拷贝的正点原子的例程点击综合生成设计后的原理图第一种方法进行I O引脚的分配需要查看电路板的原理图分配
【SSD-Caffe】安装使用教程

1 下载镜像参考我的另一篇博客 docker使用教程我下载的是 docker pull bvlc caffe gpu 这个镜像 2 安装ssd caffe 下载之后这并不是ssd caffe 的环境是较为原始版本的环境所以还需要安装
抓取iframe内数据(C#)

当时企图抓取这iframe数据还费了不少劲早就想记录下来但是由于自身懒得让人惊叹结果一直拖到现在需求是要获取到一些网站上的大批数据这些数据都是分很多页的最初思路就是用web程序一页一页抓取保存到Excel中通常情况下用以下代
5大指标：评估RPA项目的ROI，实现投资回报最大化

ROI 投资回报率通常是RPA项目中的一个关键指标在企业步入自动化的早期阶段关注RPA的投资回报率非常重要这将影响到一个RPA项目是否值得去做对企业运营者尤其是COO 首席运营官而言 RPA若实施得当将为企业降本增效带来无与
机器学习苹果识别——python+opencv实现物体特征提取

以水果为例要用机器学习来实现水果识别无论是训练还是识别阶段都需要提取图片中水果的特征值本篇将讲述如何提取水果的周长面积颜色长度宽度7个特征值 cv findContours cv findContours将图片中识别到的轮廓返
如何用matlab去修改图像尺寸

img imread test1 jpg 这里为原始图像 i imresize img 567 390 imwrite i 1 jpg 这里为修改后图像 imread imresize和imwrite 1 imread 读取图像信息 A i
查看VSCode版本

背景想要查看一下visual studio code的版本方法在vscode菜单栏帮助 gt 发行说明 Help gt Release Notes 版本为1 36
C++auto_ptr的用法

文章目录一 auto ptr是什么二 auto ptr需要包含的头文件三 auto ptr用法一 auto ptr是什么 auto ptr 是C 标准库提供的类模板 auto ptr对象通过初始化指向由new创建的动态内存它是这块
TCP 协议（四）重传与超时

1 TCP 协议中的计时器 TCP 中有四种计时器 Timer 分别为重传计时器 Retransmission Timer 持久计时器 Persistent Timer 保活计时器 Keeplive Timer 等待计时器 Timer W
gdb+gdbserver远程调试技术

首先声明此文是在别人的基础上添加一些自己的体会之前做嵌入式开发的时候弄过一段时间gdb gdbserver远程调试最后无果而终只好将就用printf 首先感谢这篇刘品的文章看着整洁清楚 http www cnblogs com
目标检测之YOLOv3算法分析

基本原理特征网络输入输出输入 416 416 3 416 416 3 416 416 3大小的图片不唯一但图片大小必为32的倍数输出3个尺度的feature map 分别为

目标检测之YOLOv3算法分析

基本原理

目标检测之YOLOv3算法分析 的相关文章

随机推荐

热门标签

目标检测之YOLOv3算法分析的相关文章