YOLOv5总结--持续更新

2023-05-16

1、Data Augmentation:

数据增强操作可以看做是一种正则化方法，防止过拟合。

v4数据增强创新使用了图像遮挡–Random Erase随机删除一个矩形区域通过均值填充。

Cutout随机删除一个矩形区域通过0填充。

Mixup两张图像每个位置像素按照一定比例进行叠加，label根据像素叠加比例进行分配。

cutmix随机删除一个矩形区域，并通过另一张图像同一位置像素值填充，label根据像素所占比例分配。

Mosaic 使用四张训练图像按一定比例组合成一张图像，使模型学会在更小的范围内识别对象。能有效解决模型训练中小目标的检测问题。

label smoothing 因为训练时标签可能存在错误，不过分相信标签，正则化方法。v5没使用。

2、自适应锚定框(Auto Learning Bounding Box Anchors)

对于COCO数据集，v5在配置文件中预设了640x640的锚框尺寸，对于自己的数据集，我们放大到了3000的size，并且数据集中目标对象海星的大小和COCO数据集的不同因此要重新学习锚框尺寸。使用autoanchor.py。v5自带了autoanchor 会判断当前anchor契合度，如果低于0.98就会重新聚类，但是感觉不是很好用。明明并没有特别匹配，但还是符合了，我就在用不同数据集的时候重新autoanchor，让它重新进行聚类得到新的框。v4没有这个。

3.Backbone-跨阶段局部网络(CSP)

v5和v4均使用CSPDarknet作为Backbone，其解决了其他大型Backbone中网络优化的梯度信息重复问题。将梯度的变化从头到尾地集成到特征图中，因此减少了模型参数量和FLOPS数值，既保证了推理速度和准确率也减少了模型尺寸。

基于Densnet思想，复制基础层的特征映射图，通过dense block 发送副本到下一个阶段，从而将基础层的特征映射图分离出来，总金额样可以有效缓解梯度消失(通过非常深的网络很难去反推丢失信号)，支持特征传播，鼓励网络重用特征，从而减少网络参数量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

yolov5

持续更新

YOLOv5总结--持续更新的相关文章

Redis博客、教程学习资料汇总(持续更新)

在这篇博客中 xff0c 总结一下写过的博客和一些好的学习资料博客 xff1a Redis基础 xff0c Linux下安装Redis和hredis xff0c C 43 43 调用Redis xff0c Redis中字符串设计 Redi
串口输出乱码问题的解决方法汇总（持续更新）：

平时工作中程序员在调试时总会用到串口打印数据以及一些标志位查看程序是否出现问题但是在使用时总会遇到各种各样的问题 xff0c 最常见的就是输出乱码问题 xff08 指的是有收到数据但数据显示的是一堆不认识的汉字或字符 xff09 xff0
yolov5关闭wandb

yolov5训练过程中wandb总是提示登入账号 xff0c 不登入还不能继续训练 xff0c 想要关闭wandb xff0c 直接不使用即可在 yolov5 utils loggers wandb wandb utils py中 imp
ROS报错处理(持续更新)

1 运行节点时报错 xff1a rospack Error package 39 test 39 not found 没有找到ros功能包 xff0c 原因是没有为功能包配置系统环境 xff0c 可以利用source运行工作空间中devel
RoboCom机器人大赛使用yolov5抽取20个随机图片进行人群识别

目录 1 原理 2 思维流程 2 1 进行yolov5的环境搭建 2 1 1 在Linux的ubuntu环境anaconda的安装 2 1 2 Vscode的安装和配置 2 1 3 Github上面yolov5文件的下载 2 1 4 使用A
Yolov5 更改识别窗口大小

启动yolov5时 xff0c 会因为像素太大导致占据整个桌面 xff0c 这样非常影响使用和操作 xff0c 我们可以通过opencv中的resize函数来修改识别窗口的像素大小 xff0c 这样操作就方便多了原代码中通过修改cv2
YOLOv5训练自己的数据集实现视频的识别

写在前面我本来是使用这个模型进行手写签名的定位 xff0c 但是因为比赛的主办方原因 xff0c 数据不允许公开 xff0c 所以我使用动物世界的一段开头视屏来制作我的数据集这整个模型跑通的过程中 xff0c 我参考了很多不错的博客 x
unbuntu18.04 install pytorch1.8-cpu+yolov5

1 install pytorch 1 change pip source reference link 2 install all pip3 install torchvision 61 61 0 9 0 pip3 install tor
yolov5/v7/v8自动检测多个文件夹及截取锚框

目前yolo仅支持检测图片或单个文件夹 xff0c 但在很多时候需要对成百上千个文件夹中图片进行检测 xff0c 再根据得到的位置信息txt文件来截取图片 xff0c 如何一步完成呢 xff0c 详情见下文在detect py中将save
YOLOv5识别目标的实时坐标打印

引言这个功能看似鸡肋 xff0c 但对于无人机目标识别与追踪有重要意义 xff0c 通过目标在摄像头视野的坐标位置 xff0c 可以推算出无人机相对与目标的位置 xff0c 从而对无人机进行位置矫正因此 xff0c 添加代码打印坐标并不
Jetson Xavier NX使用yolov5+deepsort实现CSI摄像头的目标跟踪

文章目录安装过程运行效果用python代码来打开CSI摄像头实现CSI摄像头目标跟踪报错 AttributeError 39 NoneType 39 object has no attribute 39 shape 39 运行效果参考文
STL中那些好用的东西！（持续更新）

一数据结构部分 1 set amp map xff08 后续持续更新 xff09 2 queue xff08 priority queue xff09 queue lt int gt a 定义 a push i 压入 a pop 弹出 a
C语言字符串常用函数总结（持续更新）

最近在重温C语言的一些基础知识 xff0c 感觉C语言字符串操作还是比较难的 xff0c 在学习的过程中总结了一些常用的字符串相关函数 xff0c 包括C语言字符串输入字符串输入计算字符串长度字符串赋值字符串分割字符串拼接字符串
【YOLOv5问题记录】thop库的安装

最近开始学习YOLOv5 踩了不少坑总结一下问题配置环境按照这篇教程来的 Yolov5的配置训练超级详细小学生玩编程的博客 CSDN博客训练数据集跟着炮哥的这篇目标检测教你利用yolov5训练自己的目标检测模型 yolov5
yolov5运行报错之RuntimeError: The size of tensor a (80) must match the size of tensor b (56) at.....

错误 RuntimeError The size of tensor a 80 must match the size of tensor b 56 at non singleton dimension 3 如图解决方法 https gi
YOLOv5训练目标检测数据集（小白）

一提前准备工作 1 利用labelimg软件给收集到的图片打标签具体步骤网上都有 2 下载好yolov5 v6 1 源码下载地址 https github com ultralytics yolov5 用pycharm打开在项目目录
通过Vitis Ai 3.0平台量化yolov5模型并部署到ZCU102板卡上相关问题求解！

通过Vitis Ai 3 0平台量化yolov5模型并部署到ZCU102板卡上相关问题求解这些天再通过Vitis Ai 3 0平台来量化yolov5模型的并且部署到zcu102板子上的时候一直遇到检测结果比较离谱的问题因此想要发个贴请教
小白YOLOv5全流程-训练+实现数字识别

目录一配置二准备相关文件进行训练三使用labelImg标注图片 1 安装labellmg 2 使用 labellmg 四划分数据集以及配置文件的修改 1 在VOCData目录下创建程序 split train val py 并
YOLOv5(PyTorch)目标检测：原理与源码解析

PyTorch版YOLOv5目标检测原理与源码解析课程链接 https edu csdn net course detail 31428 Linux创始人Linus Torvalds有一句名言 Talk is cheap Show me
还是得从代码角度看yolov5（1）

train 参考文章又是经典写到一半发现别人写的更好基础函数 1 setattr setattr opt k v 将给定对象上的命名属性设置为指定值等价于opt k v 2 getattr callback getattr logge

随机推荐

C/C++调用Rust编写的动态库

目录 C C 43 43 调用Rust编写的动态库一背景二解决方案三测试3 1 正确性检验3 2 内存安全检验 C C 43 43 调用Rust编写的动态库一背景 Rust通过大量的编译期检查能够有效避免程序运行时出现的各种内存问
计蒜客习题-班长竞选最小割 “二选一方案不同有额外开销”模型

设源点S xff0c 汇点T 对于所有赞成的人从S连一条边到他们对应的点上容量设为1 对于所有反对的人从他们对应的点上连一条边到T 容量为1 对于所有有朋友关系的a和b 在他们之间连一条无向边容量为1 最小割可以用dinic跑出来
百度之星2020 初赛第三场

Discount Accepts 1432 Submissions 2728 Time Limit 2000 1000 MS Java Others Memory Limit 65536 65536 K Java Others Proble
快速幂取模_C++

一题目背景已知底数a xff0c 指数b和模数mo xff0c 求ans 61 ab mo 二朴素算法就是暴力啦 1 void power int a int b int mo 2 long long ans 61 1 3 for
python抓取Windows系统内存和CPU占用率

python抓取Windows系统内存和CPU占用率主要参考来源 xff1a https www jianshu com p 23c2a518019a 1 源代码 cpuget py from time import sleep strf
汇编语言（十）——条件判断指令

首先了解按位指令 xff0c 这里使用的技术也可以用于操作硬件设备控制位 xff0c 实现通信协议以及加密数据 xff0c 操作说明AND源操作数和目的操作数进行逻辑与操作OR源操作数和目的操作数进行逻辑或操作XOR源操作数和目的操作数进行
[Altium Designer] AD PCB中相同模块的布局布线方法（Room Copy方法）

最近画的一个板子 xff0c 有12路4 20mA采集电路 xff0c 每一路的元件都是一样的 xff0c 恰好板子空间也够 xff0c 就想着能不能画好一个之后其他的可以照抄 xff0c 网上查了一圈还真有 xff0c 那就是 Room
【实用教程】VSPD虚拟串口工具——从此告别硬件串口调试

modbus测试工具链接 xff1a https blog csdn net byxdaz article details 77979114 1 下载VSPD工具 VSPD下载链接 xff0c 点击这里直接下载 2 安装解压后的安装包是这
PageHelper自定义count

使用场景 web页面的查询功能太复杂 xff0c pageHelper自动生成的count语句相当于在查询语句外包一层count xff0c 查询速度比较慢需要优化count语句 xff0c 所以才想起来自定义count语句版本要求 5
angular 报错Can't bind to 'nzData' since it isn't a known property of 'nz-table'.

在angular里添加了一个新的module后 xff0c 点击会报错 xff0c 无法加载模块的路由 xff0c 并展示以下错误解决办法 xff1a 检查是否有 import NgZorroAntdModule from 39 ng
python爬取b站数据

爬取B站弹幕数据的API xff1a 96 https api bilibili com x v1 dm list so oid 61 XXX 96 我们要想知道这个oid是什么 xff0c 首先要获取到cid 弹幕数据的接口我们虽然找不到
深度学习_NMS代码详解YOLOv3及Fast R-CNN例子

先放Fast R CNN的NMS代码这部分是关于 nms 实现的代码后续再加下其他的版本流程 xff1a 首先对检测结果的 score 取出最大的元素 xff0c 然后将置信度最高的框与其他框取交集 xff0c 计算 iou xff0
动手学深度学习系列笔记02预备知识-02数据预处理pandas

读取数据集 64 save是一个特殊的标记 xff0c 该标记下方的函数类或语句将保存在d2l软件包中 xff0c 以便以后可以直接调用它们 xff08 例如d2l mkdir if not exist path xff09 而无需重新定
windows环境从0到1安装vs-＞nvidia driver-＞anaconda-＞cuda/cudnn-＞pytorch/paddlepaddle(内附网盘链接)

简介本项目旨在帮助大家在Windows10环境中安装GPU环境内附文件网盘链接包括 vs环境 N卡显卡驱动 Anaconda CUDA CUDNN Pytorch PaddlePaddle GPU 0前言 torch1 10 2对应t
mmsegmentation之tools/train.py文件解析(部分，持续更新)

span class token comment Copyright c OpenMMLab All rights reserved span span class token keyword import span argparse sp
mmsegmentation之mmseg/models/backbones/resnet.文件解析(部分，持续更新)

span class token comment Copyright c OpenMMLab All rights reserved span span class token keyword import span warnings sp
jupyter notebook打开后import torch提示没有。

jupyter notebook打开后import torch提示没有如图所示 1 检查是否为安装torch的对应环境 2 打开的虚拟环境中没有安装torch xff0c 可以在jupyter 中输入 pip list 查看是否有torc
阿里的在线评测题：多线程打印数据

我答的不好 xff0c 那个伯乐在线评测系统不会用 xff0c 本地写代码跑不成功挂了 xff0c 总结下供后人参考题目 xff1a 顺序递增打印正整数 xff0c 从1开始打印到100 xff0c 中间换行分隔不允许重复打印出相同的数
WSL2使用检测不到GPU

WSL2使用检测不到GPU 输入nvidia smi出现以下错误 Failed to initialize NVML GPU access blocked by the operating system Failed to properly
YOLOv5总结--持续更新

1 Data Augmentation 数据增强操作可以看做是一种正则化方法 xff0c 防止过拟合 v4数据增强创新使用了图像遮挡 Random Erase随机删除一个矩形区域通过均值填充 Cutout随机删除一个矩形区域通过0填充 M

热门标签