yolo 学习系列（三）：训练参数与网络参数

2023-05-16

yolo 学习系列（三）：训练参数与网络参数

手把手教你做目标检测（YOLO、SSD）视频链接

1 训练参数

博主在使用 yolov2-tiny-voc 训练人这一类目标物体时，训练过程中在终端输出的参数如图所示，了解这些参数的含义有助于了解训练过程中的训练效果。
这里写图片描述

1.1 训练参数解释

Region Avg IOU: 0.196824：表示在当前subdivision内的图片的平均IOU，代表预测的矩形框和真实目标的交集与并集之比，这里是19.68%，这个模型需要进一步的训练
Class: 1.000000：标注物体分类的正确率，期望该值趋近于1
Obj: 0.336143：越接近1越好
No Obj: 0.482397：期望该值越来越小，但不为零
Avg Recall: 0.00000：是在recall/count中定义的，是当前模型在所有subdivision图片中检测出的正样本与实际的正样本的比值
count: 2：count后的值是所有的当前subdivision图片（本例中为1张）中包含正样本的图片的数量

Region Avg IOU：平均的IOU，代表预测的bounding box和ground truth的交集与并集之比，期望该值趋近于1。
Class:是标注物体的概率，期望该值趋近于1.
Obj：期望该值趋近于1.
No Obj:期望该值越来越小但不为零.
Avg Recall：期望该值趋近1
avg：平均损失，期望该值趋近于0

1.2 IOU（Intersection over Union, 交并集之比)

这里写图片描述

可以看到，IOU（交集比并集）是一个衡量我们的模型检测特定的目标好坏的重要指标。100%表示我们拥有了一个完美的检测，即我们的矩形框跟目标完美重合。很明显，我们需要优化这个参数。

2 cfg文件配置参数

参考这篇
还有这篇

2.1 开头部分

[net]
# Testing
batch=1
subdivisions=1
# Training
# batch=64
# subdivisions=2
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1

learning_rate=0.001
max_batches = 40200
policy=steps
steps=-1,100,20000,30000
scales=.1,10,.1,.1

batch：每次迭代要进行训练的图片数量
subdivision：batch中的图片再产生子集，源码中的图片数量int imgs = net.batch * net.subdivisions * ngpus

本例以上两个参数均为1，也就是说每轮迭代会从所有训练集里随机抽取 batch = 1 个样本参与训练，所有这些 batch 个样本又被均分为 subdivision =1 次送入网络参与训练，以减轻内存占用的压力

width：输入图片宽度， height：输入图片高度，channels ：输入图片通道数

对于每次迭代训练，YOLOv2会基于角度(angle)，饱和度(saturation)，曝光(exposure)，色调(hue)产生新的训练图片

angle：图片角度变化，单位为度，假如 angle=5，就是生成新图片的时候随机旋转-5~5度
weight decay：权值衰减

防止过拟合，当网络逐渐过拟合时网络权值往往会变大，因此，为了避免过拟合，在每次迭代过程中以某个小因子降低每个权值，也等效于给误差函数添加一个惩罚项，常用的惩罚项是所有权重的平方乘以一个衰减常量之和。权值衰减惩罚项使得权值收敛到较小的绝对值。

angle：图片角度变化，单位为度，假如 angle=5，就是生成新图片的时候随机旋转-5~5度
saturation & exposure: 饱和度与曝光变化大小，tiny-yolo-voc.cfg中1到1.5倍，以及1/1.5~1倍
hue：色调变化范围，tiny-yolo-voc.cfg中-0.1~0.1
max_batches：最大迭代次数
learning rate：学习率

学习率决定了参数移动到最优值的速度快慢，如果学习率过大，很可能会越过最优值导致函数无法收敛，甚至发散；反之，如果学习率过小，优化的效率可能过低，算法长时间无法收敛，也易使算法陷入局部最优（非凸函数不能保证达到全局最优）。合适的学习率应该是在保证收敛的前提下，能尽快收敛。
设置较好的learning rate，需要不断尝试。在一开始的时候，可以将其设大一点，这样可以使weights快一点发生改变，在迭代一定的epochs之后人工减小学习率。

policy：调整学习率的策略

调整学习率的policy，有如下policy：CONSTANT, STEP, EXP, POLY，STEPS, SIG, RANDOM

steps：学习率变化时的迭代次数

根据batch_num调整学习率，若steps=100,20000,30000，则在迭代100次，20000次，30000次时学习率发生变化，该参数与policy中的steps对应

scales：学习率变化的比率

相对于当前学习率的变化比率，累计相乘，与steps中的参数个数保持一致
#####2.2 中间部分

[convolutional]      # 卷积层
batch_normalize=1    # 是否做BN
filters=16           # 输出特征图的数量
size=3               # 卷积核的尺寸
stride=1             # 做卷积运算的步长
pad=1                # 如果pad为0,padding由 padding参数指定。
					如果pad为1，padding大小为size/2，padding应该是对输入图像左边缘拓展的像素数量
activation=leaky     # 激活函数的类型

[maxpool]            # 池化层
size=2
stride=2

2.3 结束部分

[convolutional]
size=1
stride=1
pad=1
# filters=125
filters=30         # 计算公式 = 5 × （ 类别数 + 5 ）
activation=linear

[region]
anchors = 1.08,1.19,  3.42,4.41,  6.63,11.38,  9.42,5.11,  16.62,10.52
bias_match=1      # 计算best IOU时，预测宽高强制与anchors一致 
# classes=20
classes=1         # 类别数量 
coords=4
num=5             # 每个grid预测的BoundingBox个数 
softmax=1         # 使用softmax 
jitter=.2         # 通过抖动增加噪声来抑制过拟合
rescore=1

object_scale=5
noobject_scale=1
class_scale=1
coord_scale=1

absolute=1
thresh = .6
random=1

anchors

预测框的初始宽高，第一个是w，第二个是h，总数量是num*2，YOLOv2作者说anchors是使用K-MEANS获得，其实就是计算出哪种类型的框比较多，可以增加收敛速度，如果不设置anchors，默认是0.5，还有就是anchors读入参数中名字是biases

bias_match

如果为1，计算best iou时，预测宽高强制与anchors一致

coords：BoundingBox的tx,ty,tw,th

tx与ty是相对于左上角的gird，同时是当前grid的比例，tw与th是宽度与高度取对数

jitter：通过抖动增加噪声来抑制过拟合

YOLOv2中使用的是crop，filp，以及net层的angle，flip是随机的，crop就是jitter的参数，tiny-yolo-voc.cfg中jitter=.2，就是在0~0.2中进行crop

rescore：决定使用哪种方式计算IOU的误差

为1时，使用当前best iou计算，为0时，使用1计算

object_scale & noobject_scale & class_scale & coord_scale

YOLOv1论文中cost function的权重，哪一个更大，每一次更新权重的时候，对应方面的权重更新相对比重更大

thresh：决定是否需要计算IOU误差的参数

大于thresh，IOU误差不会夹在cost function中

random

random为1时会启用Multi-Scale Training，随机使用不同尺寸的图片进行训练,如果为0，每次训练大小与输入大小一致;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

yolo 学习系列（三）：训练参数与网络参数的相关文章

机器人手眼标定快速精度验证方法

一原理及流程机器人的手眼标定原理在本文中不再过多描述 xff0c 基本流程都是先标定相机的内外参数 xff0c 然后标定两台相机之间的位置关系 xff0c 如果相机是可以转动的话 xff0c 还要标定转台与机械臂之间的关系在手眼标定完
【转载】写给电子信息工程专业的毕业生(一)

一继续深造 VS 找工作在就业竞争异常激烈的今天 xff0c 也许大家大三起就开始忧心自己毕业后该何去何从了摆在大家面前最为清晰的 xff0c 是两条路 xff1a 继续深造 xff08 考研留学 xff09 和找工作现在研究生扩
通过python的百度云客户端可以把linux数据备份到百度云

引言网站备份真的很重要 xff0c 前段时间已经被坑过一次了 xff0c 幸好数据没有完全丢 xff0c 勉强恢复了 xff0c 虽然丢失了几篇文章之前一直是每隔几天手动备份一下重要的数据 xff0c 然后下载到本地但是有时候会忘记备
XCOM2.0接收数据为0

新装系统后 xff0c 串口助手Xcom2 0版本 xff0c 使用FT232接受到的数据全是0 xff0c FT232已经有驱动 xff0c 经过多出测试 xff0c 需要更新FTDI的官网驱动 xff0c 并重启 xff0c 问题解决
PyQt(Python+Qt)学习随笔：Action功能详解及Designer中的操作方法

老猿Python博文目录老猿Python博客地址一引言 Qt Designer中的部件栏并没Action相关的部件 xff0c Action可以在右侧的Action Editor中编辑 xff0c 如图 xff1a 如果没有出现Acti
鸿蒙最新功能及承载设备详解：HarmonyOS 2及华为全场景新品发布会全纪录

6月2日 xff0c 华为联手CSDN直播了 HarmonyOS 2及华为全场景新品发布会 xff0c 老猿全程观看直播 xff0c 并进行了回看 xff0c 力争将发布会的核心内容在本文中概要性地呈现一一生万物万物归一首先是华为消
构建VisualStudio2019+OpenCV4.3的C++ windows编译环境

一引言最近在读源代码研究CLAHE的算法 xff0c 但好久没学习C 43 43 了 xff0c 发现部分代码难以理解 xff0c 因此最后下决心装一个C 43 43 编译器下载OpenCV源码 xff0c 这样碰到疑难问题就可以实际
关于C++集合操作赋值和集合间操作的结果集合的疑问

一关于集合的疑问最近对C 43 43 语言的集合操作比较感兴趣 xff0c 看了好友博主CP猫介绍的 C 43 43 中集合set的常用操作 xff0c 在使用时有3个疑问 xff1a 集合的变量赋值能否直接将一个集合实例赋值个另一个集
如何使用Docker暴露多个端口？

本文翻译自 xff1a How can I expose more than 1 port with Docker So I have 3 ports that should be exposed to the machine 39 s i
人工智能基础概念1：模型、拟合、最大似然估计、似然函数、线性回归、sigmoid函数、逻辑回归

一模型拟合 xff08 fitting xff09 和过拟合 xff08 overfitting xff09 人工智能中的模型 xff08 Artificial Intelligence Model xff09 指的是一些算法和数学模型
中国移动提出的ABCDNETS和DSSN数联网技术介绍

一引言在2023年4月14日 xff0c 中国移动召开数据要素流通与治理产业高峰论坛上 xff0c 中国移动发布了数联网 xff08 DSSN xff09 白皮书 xff0c 同时发布了全球首创的数联网 DSSN 服务平台等产品 x
Python循环语句（while循环、for循环）

Python循环语句一 while循环二 for语句三 range 函数四 break 和 continue 语句五 pass语句 Python循环语句主要有while循环和for循环 xff0c Python 循环语句的控制结构图如下所
深度学习笔记一：深度学习环境的搭建

首先需要下载anaconda xff08 官方网站下载 xff09 一路选择next即可这里我没有选择添加环境变量 xff0c 如果有需要 xff0c 后期可以手动添加 xff0c 这里可以根据自己情况选择安装完成后 xff0c 从wi
HAN论文模型代码复现与重构

论文简介本文主要介绍CMU在2016年发表在ACL的一篇论文 xff1a Hierarchical Attention Networks for Document Classification及其代码复现该论文是用于文档级情感分类 xf
Http Digest认证协议

http blog csdn net htjoy1202 article details 7067287 其认证的基本框架为挑战认证的结构 xff0c 如下图所示 xff1a xfeff xfeff 1 客户端希望取到服务器上的某个资源 x
【系统分析师之路】嵌入式系统章节错题集锦

系统分析师之路嵌入式系统章节错题集锦系分章节错题集第01题 xff1a 红色 01 雷达设计人员在设计数字信号处理单元时 xff0c 其处理器普遍采用DSP芯片 xff08 比如 xff1a TI公司的TMS320C63xx xff09
【软工】程序编码

目录前言正文程序设计语言分类选择原则程序编码总原则好程序的标准结构化程序设计主要内容主要原则程序设计风格源程序文档化数据说明语句结构输入输出方法程序设计质量评价正确性结构清晰性易修改性易读性简单性程序复
TPM1.2到TPM 2.0的变化

原文地址 xff1a http www vonwei com mod 61 pad amp act 61 view amp id 61 11 TPM 1 2规范主要面向PC平台 xff0c 其103版本在2009年被接受为ISO标准 xff
关于Cmake与CmakeLists（一）--背景，须知，示例

一背景及须知 1 背景 xff1a VS2019与VS2010在编写程序时都是创建了一个工程 xff0c 然后直接打开 sln即可但是vscode仅仅是一个编辑器 xff0c 打开之后只有 c或者 cpp文件 xff0c 故需要手动编译
webgl(three.js)实现室内定位,楼宇bim、实时定位三维可视化解决方案——第五课

webgl three js 实现室内定位楼宇bim 实时定位三维可视化解决方案第五课参考文章 xff1a xff08 1 xff09 webgl three js 实现室内定位楼宇bim 实时定位三维可视化解决方案第五课 xff

随机推荐

Linux虚拟机在线扩容lvm类型root分区

目录 Linux虚拟机在线扩容lvm类型root分区写在前面正文写在后面 Linux虚拟机在线扩容lvm类型root分区写在前面这是我在CSDN上的第一篇文章作为一个半江湖的IT人 xff0c 这些年来也在CSDN受益很多今天是20
无vCenter创建vSAN集群

无vCenter创建vSAN集群最近仍有朋友在问题 xff0c vCenter如果挂了 xff0c vSAN还能正常运行吗 xff1f 这个小文通过手动创建vSAN集群的方式来解答下这个问题吧 xff08 生产环境慎用 xff01 xf
记一次mdadm软raid1升级容量

MDRaid 2块4TB做了软RAID1 xff0c 需要升级成2块8TB盘查看磁盘信息 xff0c SerialNumber等会儿会用到 xff0c 防止换错盘 span class token function sudo span h
[简洁版]youtube-dl下载命令

简介 YouTube dl是python上的pip模块 xff08 开源 xff09 xff0c 可以用来下载YouTube Bilibili等多个平台的视频音频文件 xff0c 可谓是居家旅行必备小工具本文主要介绍一些常用的youtu
[简版]VMware强大的管理工具-PowerCLI

一 PowerCLI介绍什么是 PowerCLI PowerCLI 是一个命令行工具 xff0c 可以用于自动化vSphere管理 xff0c 包括网络存储虚拟机以及其他很多功能 PowerCLI包含超过700个命令要安装Power
[简版]使用PowerCLI自定义vSphere ISO安装镜像

一什么情况下要自定义ISO镜像一般来说 xff0c 对于DELL Lenovo HPE这类主流的服务器厂商 xff0c VMware官方vSphere ISO镜像或者官网的第三方客制镜像 xff08 由服务器厂商提供的封装镜像 xff0
[简版] 关于vSphere漏洞-OpenSLP

一前言近期vSphere OpenSLP漏洞在野利用的新闻频频被爆出来 xff0c 大伙儿非常关注由于vSphere虚拟化客户之广泛 xff0c 很多朋友都表达了自己的焦虑 xff0c 同时也会担心自己管理的vSphere虚拟化平台是
[简版] Linux搭建SAMBA文件共享服务

SMB服务搭建更多参数含义参考链接常用配置安装samba span class token comment Ubuntu span span class token function sudo span span class toke
STM32 HAL库详解

STM32 HAL库整体总结 STM32 之二 HAL库详解及手动移植本篇博客是对以上参考资源的一个二次总结与整理 1 HAL库文件结构对于开发人员而言 xff0c 首先要清楚 HAL 库的文件结构根据文件类型可认为以下两大类 x
STM32 HAL库学习（四）：DMA之串口空闲中断

STM32CubeMX 配置实现参考这里 1 串口空闲中断 1 1 UART DMA方式接收数据 STM32串口使用DMA方式接收数据可以减小CPU的开销对于接收定长数据 xff0c 可以将DMA接收缓冲区的长度设定为待接收数据的长度 x
Android Studio 启动模拟器出现“Timed out after 300seconds waiting for emulator to come online“解决方案

Android Studio 启动模拟器出现 34 Timed out after 300seconds waiting for emulator to come online 34 解决方案参考文章 xff1a xff08 1 xff0
结构体中的位定义

1 结构体位定义在工作中 xff0c 经常遇到按位 xff08 bit xff09 定义结构体的情况由于一个字节有8个位 xff0c 这时 xff0c 程序员往往对bit的位置产生困惑现在给出2个例子 xff0c 来说明位的定义次序
蓝牙基础（三）：蓝牙协议栈总体认知

蓝牙基础 xff08 三 xff09 xff1a 蓝牙协议栈总体认知 0 前言初入门经典蓝牙学习 xff0c 网上资料参差不齐 xff0c 本博客旨在整理自己的一些总结内容 xff0c 建立整体功能认识 xff0c 以便后续深入学习 1
FreeRTOS学习（四）任务调度与切换

文章目录 1 任务调度2 任务切换2 1 SVC 和 PendSV2 2 上下文2 3 切换场景2 4 PendSV Handler 3 总结 1 任务调度在建立完任务后紧接着调用任务调度函数 xff0c 便会使系统运行起来 span c
FreeRTOS学习（五）队列与信号量

文章目录 1 队列1 1 队列特性1 2 队列创建1 2 1 接口函数1 2 2 内存占用1 2 3 创建过程分析 1 3 入队与出队1 3 1 队列项入队1 3 1 队列项出队 2 信号量2 1 二值信号量2 2 计数型信号量2 3 互斥
FreeRTOS学习（六）时间管理

文章目录 1 延时函数1 1 vTaskDelay 1 2 vTaskDelayUntil 1 3 系统时钟节拍 2 软件定时器2 1 定时器概述2 2 定时器 API 3 总结 1 延时函数当任务需要调用延时函数延时时 xff0c 任务
C语言 sscanf库函数

目录 1 函数描述2 函数应用2 1 基础应用2 2 高级应用 1 函数描述 xff08 1 xff09 函数功能 xff1a 通常被用来解析并转换字符串 xff0c 从str指定的字符串读取数据 xff0c 并根据参数format字符串来
C语言文件读写

目录 1 文件打开与关闭1 1 打开文件 fopen 1 2 关闭文件 fclose 2 读取文件2 1 fgetc 2 2 fgets 2 3 fscanf 3 写入文件3 1 fputc 3 2 fputs 3 3 fprintf 1
C语言条件编译

目录 1 if elif else endif 2 ifdef else endif 3 ifndef else endif 4 三者区别根据不同情况编译不同代码产生不同目标文件的机制 xff0c 称为条件编译条件编译是预处理程序的功
yolo 学习系列（三）：训练参数与网络参数

yolo 学习系列 xff08 三 xff09 xff1a 训练参数与网络参数手把手教你做目标检测 xff08 YOLO SSD xff09 视频链接 1 训练参数博主在使用 yolov2 tiny voc 训练人这一类目标物体时

yolo 学习系列（三）：训练参数与网络参数

yolo 学习系列（三）：训练参数与网络参数

1 训练参数

1.1 训练参数解释

1.2 IOU（Intersection over Union, 交并集之比)

2 cfg文件配置参数

2.1 开头部分

2.3 结束部分

yolo 学习系列（三）：训练参数与网络参数 的相关文章

随机推荐

热门标签

yolo 学习系列（三）：训练参数与网络参数的相关文章