[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN（更新添加小目标检测层yaml）

2023-11-19

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是在处理一些复杂背景问题的时候，还是容易出现错漏检的问题。此后的系列文章，将重点对YOLOv5的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。

解决问题：加入BIFPN加权双向金字塔结构，提升不同尺度的检测效果。

2023.1.8更新

有朋友问在添加小目标检测层，四个检测层的基础上如何改进特征融合网络，改进方法其他不变，需要修改yaml文件，有需要可关注私信我。部分yaml内容如下所示：完整见百度网盘链接：链接：https://pan.baidu.com/s/1Qnn6QtGbZ7H3_h89QYA2vQ
提取码：关注私信后获取

# parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple

# anchors
anchors:
  - [ 19,27,  44,40,  38,94 ]  # P3/8
  - [ 96,68,  86,152,  180,137 ]  # P4/16
  - [ 140,301,  303,264,  238,542 ]  # P5/32
  - [ 436,615,  739,380,  925,792 ]  # P6/64

# YOLOv5 backbone
backbone:
  # [from, number, module, args]
  [ [-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
    [ -1, 1, Conv, [ 128, 3, 2 ] ],  # 1-P2/4
    [ -1, 3, C3, [ 128 ] ],
    [ -1, 1, Conv, [ 256, 3, 2 ] ],  # 3-P3/8
    [ -1, 6, C3, [ 256 ] ],  #4
    [ -1, 1, Conv, [ 512, 3, 2 ] ],  # 5-P4/16
    [ -1, 9, C3, [ 512 ] ], #6
    [ -1, 1, Conv, [ 768, 3, 2 ] ],  # 7-P5/32
    [ -1, 3, C3, [ 768 ] ], #8
    [ -1, 1, Conv, [ 1024, 3, 2 ] ],  # 9-P6/64
    [ -1, 3, C3, [ 1024 ] ],
    [ -1, 1, SPPF, [ 1024, 5 ] ], # 11
  ]
# BIFPN garph
#                        
# p6     ----------------- --------Concat_bifpn----> P6(out)
#      /                  \                         \       \
#      /-------------------------------------------->  
#     /                Upsample              Concat_bifpn   Concat_bifpn
#    /                    |                          \      | 
# p5 ---Concat_bifpn---> head 5 ---Concat_bifpn----> P5(out)
#                        \                                  \
#                      Upsample                              Concat_bifpn
#       ----------------  | ----------------------->        /
#     /                   \                         \       \
#    /                    |                  Concat_bifpn   |
#   /                     \                          \     |
# p4 ---Concat_bifpn---> head 4 ---Concat_bifpn--->  P4(out)
#                        \                                 \
#                         ----Upsample---->                Concat_bifpn   
#                                          \               /
# p3 ---Concat_bifpn------------------------------>  P3(out)
  
# YOLOv5 head                                                                       
head:                                                                       
  [ [ -1, 1, Conv, [ 768, 1, 1 ] ],    # 12 head                                  
    [ -1, 1, nn.Upsample, [ None, 2, 'nearest' ] ],                           
    [ [ -1, 8 ], 1, Concat_bifpn, [ 384,384] ],  # cat backbone P5                
    [ -1, 3, C3, [ 768, False ] ],  # 15

    [ -1, 1, Conv, [ 512, 1, 1 ] ],
    [ -1, 1, nn.Upsample, [ None, 2, 'nearest' ] ],
    [ [ -1, 6 ], 1, Concat_bifpn, [ 256,256] ],  # cat backbone P4
    [ -1, 3, C3, [ 512, False ] ],  # 19

添加方法（以下改进步骤方法为在三个检测层的基础上）：

第一步：common.py构建Concat_BIFPN模块

class Concat_bifpn(nn.Module):
    # Concatenate a list of tensors along dimension
    def __init__(self, c1, c2):
        super(Concat_bifpn, self).__init__()
        self.w1 = nn.Parameter(torch.ones(2, dtype=torch.float32), requires_grad=True)
        self.w2 = nn.Parameter(torch.ones(3, dtype=torch.float32), requires_grad=True)
       # self.w3 = nn.Parameter(torch.ones(3, dtype=torch.float32), requires_grad=True)
        self.epsilon = 0.0001
        self.conv = Conv(c1, c2, 1 ,1 ,0 )
        self.act= nn.ReLU()

    def forward(self, x): # mutil-layer 1-3 layers #ADD or Concat 
        #print("bifpn:",x.shape)
        if len(x) == 2:
            w = self.w1
            weight = w / (torch.sum(w, dim=0) + self.epsilon)
            x = self.conv(self.act(weight[0] * x[0] + weight[1] * x[1]))
        elif len(x) == 3: 
            w = self.w2
            weight = w / (torch.sum(w, dim=0) + self.epsilon)
            x = self.conv(self.act (weight[0] * x[0] + weight[1] * x[1] + weight[2] * x[2]))
        # elif len(x) == 4:    
        #     w = self.w3
        #     weight = w / (torch.sum(w, dim=0) + self.epsilon)
        #     x = self.conv(self.act(weight[0] * x[0] + weight[1] * x[1] + weight[2] *x[2] + weight[3]*x[3] ))
        return x

第二步：yolo.py中注册Concat_BIFPNt模块

        elif m is Concat_bifpn:
            c2 = max([ch[x] for x in f])

第三步：修改yaml文件（以修改官方YOLOv5s.yaml为例），需要修改head（特征融合网络）

# parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple

# anchors
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],   # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],
  ]

# YOLOv5 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1,6], 1, Concat_bifpn, [256,256]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat_bifpn, [128,128]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)


   [-1, 1, Conv, [512, 3, 2]],   # 320, 640 # 
   [[-1, 6, 13], 1, Concat_bifpn, [256,256]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [1024, 3, 2]], # 640, 1280 # 
   [[-1, 9], 1, Concat_bifpn, [512, 512]],  # cat head P5  cat 20,20 #22
   [-1, 3, C3, [1024, False]],  # 25 (P5/32-large) # 1280, 1280  #23


   [[17, 20, 23], 1, Detect, [nc, anchors]] # Detect(P3, P4, P5)
  ]

Model Summary: 290 layers, 8114651 parameters, 8114651 gradients, 17.4 GFLOPs

2023.2.19补充：如果需要在YOLOv5l.yaml等网络结构进行修改的话，不可直接用以上的yaml文件或者就简单修改depth_multiple为1.0，而是需要修改Concat_bifpn, [256,256]中的通道数为对应网络实际通道数。具体如下所示：

# parameters
nc: 80  # number of classes
depth_multiple: 1.0  # model depth multiple
width_multiple: 1.0  # layer channel multiple

# anchors
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],   # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],
  ]

# YOLOv5 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1,6], 1, Concat_bifpn, [512,512]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat_bifpn, [256,256]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)


   [-1, 1, Conv, [512, 3, 2]],   # 320, 640 # 
   [[-1, 6, 13], 1, Concat_bifpn, [512,512]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [1024, 3, 2]], # 640, 1280 # 
   [[-1, 9], 1, Concat_bifpn, [1024, 1024]],  # cat head P5  cat 20,20 #22
   [-1, 3, C3, [1024, False]],  # 25 (P5/32-large) # 1280, 1280  #23


   [[17, 20, 23], 1, Detect, [nc, anchors]] # Detect(P3, P4, P5)
  ]

第四步：将train.py中改为本文的yaml文件即可，开始训练

结果：本人在多个数据集上做了大量实验，针对不同的数据集效果不同，同一个数据集的不同添加位置方法也是有差异，需要大家进行实验。有效果有提升的情况占大多数。

预告一下：下一篇内容分享增加小目标检测层。有兴趣的朋友可以关注一下我，有问题可以留言或者私聊我哦

PS：，不仅仅是可以添加进YOLOv5，也可以添加进任何其他的深度学习网络，不管是分类还是检测还是分割，主要是计算机视觉领域，都可能会有不同程度的提升效果。

最后，四个检测层的基础上改进特征融合网络为BIFPN的话，需要修改yaml文件，有需要可关注私信我。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN（更新添加小目标检测层yaml）的相关文章

MySQL经典50道练习题及全网最详细解析

MySQL练习文章目录 MySQL练习 50道经典SQL练习题全网最详细解析数据表介绍建表语句插入数据练习题目 1 查询 01 课程比 02 课程成绩高的学生的信息及课程分数 2 查询同时存在 01 课程和 02 课程的情况 3
TypeError: 'float' object is not callable

今天在做一道Python练习题时遇到的问题记录一下请输入三个整数a b c 判断能否以它们为三个边长构成三角形若能输出YES和面积否则输出NO 刚开始写的代码如下 a int input 请输入一个整数 b int input 请
Java实现图片上传返回上传地址

关于在实际开发中最常用也是用的最多的Java实现文档图片上传一准备阶段文档图片上传有几种方式包括传统的ajax上传云上传这里给大家实现通过代码将图片上传至七牛云服务器并返回图片地址 1 需申请一台七牛云服务器地址可免费试用
js删除数组里的某个元素

删除数组中的某个元素首先需要确定需要删除元素的索引值 var arr 1 5 6 12 453 324 function indexOf val for var i 0 i lt arr length i if arr i val ret
请修改考试服务器名称,考试服务器ip数据库地址

考试服务器ip数据库地址内容精选换一换安全组是一个逻辑上的分组为同一个虚拟私有云内具有相同安全保护需求并相互信任的弹性云服务器和云数据库RDS实例提供访问策略为了保障数据库的安全性和稳定性在使用云数据库RDS实例之前您需要设
Flink on Zeppelin-2

Flink Interpreter类型首先介绍下Zeppelin中的Flink Interpreter类型 Zeppelin的Flink Interpreter支持Flink的所有API DataSet DataStream Table

随机推荐

SQL plus简单使用

查看Oracle数据库全部数据库数据库名称 SELECT name FROM v database 这将返回所有数据库的名称视图通过SQL查询dba registry视图另一个查看数据库的方法是查询dba registry视图该视
软件工程毕业设计题目100例

文章目录 0 简介 1 如何选题 2 最新软件工程毕设选题 3 最后 0 简介学长搜集分享最新的软件工程业专业毕设选题难度适中适合作为毕业设计大家参考学长整理的题目标准相对容易工作量达标题目新颖 1 如何选题最近非常多的学
练手Demo（一）

配置文件 spring redis host localhost username root password port 6379 datasource url jdbc mysql localhost 3306 base admin Un
泛微OA项目引入jar包说明

项目引入的jar包说明 WEB INF lib 依赖存在dom4j 以及httpclient jar包 Resin lib 存在的是resin组件本身自带的依赖 ecology classbean 开发java类编译存放目录系统目前已有
Java基础——strictfp关键字

关键字strictfp是strict float point的缩写指的是精确浮点它是用来确保浮点数运算的准确性 JVM在执行浮点数运算时如果没有指定strictfp关键字此时计算结果可能会不精确而且计算结果在不同平台或厂商的虚拟机
Windows 开机启动脚本（不询问自动以管理员权限运行bat）

方式一系统级开机自启不用登陆获取开机启动文件夹使用环境变量 ProgramData 或者 SYSTEMDRIVE echo SYSTEMDRIVE ProgramData Microsoft Windows Start Menu P
对象的知识点补充

认识对象对象 object 是键值对的集合表示属性和值的映射关系 JS中大括号表示对象 var xiaoming 属性名键名 key name 小明 age 12 sex 男 hobbies 足球编程对象的语法 k和v之间用
进程间通信的方式总结（特点，以及code demo）

进程间通信 IPC InterProcess Communication 是指在不同进程之间传播或交换信息一简单的进程间通信命令行父进程通过exec函数创建子进程时可以附加一些数据环境变量父进程通过exec函数创建子进程顺便传递
MOS管之增强型和耗尽型

Depletion and enhancement modes In field effect transistors FETs depletion mode and enhancement mode are two major trans
通过路由器端口映射实现外网IP访问内网服务器

1 确认路由器的公网IP是不是真的公网IP 特别重要如果不是可以不用看后面的了通过www ip138 com网站可以查询当前网络的公网IP 再进入路由器控制界面查看wan口IP和公网IP是否相同如果不同大概率是私网IP 服务商在公网
cookie格式化

字符串转成字典使用场景 selenium尝试试用cookie登陆时 Network中cookie是一段字符串需要转成字典使用使用split和列表解析式 str thor 8954F43 Id d32def3ffSNw pn adsad
数据结构---二叉查找树（二叉搜索树）

二叉查找树特性插入删除待删除节点没有子节点待删除节点有一个子节点待删除节点有两个子节点 JAVA实现缺陷二叉查找树二叉排序树在二叉树的基础上增加了如果左子树不为空则左子树上所有节点的值都小于根节点的值如果右子树不
B站粉丝数显示器，播放数、获赞数失效解决。

之前在B站看见很多人做B站粉丝数显示器于是便在网上买了一块ESP8266的开发版回来尝试着折腾一个出来便在网上搜索适合买回来的开发板和0 96 oled显示器的代码显示部分的主要代码是在果果小师弟的博客上找到的然后自己又找了个可以
WORD中字号没有中文编号的解决办法

今天一同事反映说 WORD中没有像五号四号之类的字号只有数字字号如 8 72 解决过程如下一删除office中normal dot模版文件不行二开始 gt 程序 gt Microsoft Office 工具 gt Mics
参数与超参数

写在前面关于训练深度学习模型最难的事情之一是你要处理的参数的数量无论是从网络本身的层宽宽度层数深度连接方式还是损失函数的超参数设计和调试亦或者是学习率批样本数量优化器参数等等这些大量的参数都会有网络模型最终的有效容限直
ftp的主动模式active mode和被动模式 passive mode的配置和区别

共同点客户端先发起命令连接不同点主动模式服务端发起数据连接客户端生成随机数据端口被动模式客户端发起数据连接客户端和服务端都是随机数据端口客户端与服务器的命令连接服务器返回命令 PORT 2024 告诉客户端服务器用哪
SpringData使用ES报错 org.elasticsearch.index.mapper.MapperParsingException: No type specified for field

原因就像mysql的字段要跟Java基本类型对应一样 ES的字段也要与Java的基本类型相对应一而且这个最好新建一个ES索引库否则可能会有问题我用Restful操作初始化了一个ES索引库并增加数据再用Java操作的时候 Spri
父组件传来的值和子组件自己定义的data的值有什么区别？

props和data的区别 1 data中的数据是组件内自己的数据状态可以随意修改data中的值 2 props的数据是父组件传递过来的数据是只读的只能供子组件使用不能随意修改下面进行演示 1 首先创建一个父组件HomeView
Windows Server 2019下搭建FTP服务器

在服务器管理器中选择添加角色和功能连续点击下一步跳过开始之前和安装类型界面在服务器选择界面中选择从服务器池中选择服务器默认选中一台服务器选中web服务复选框点击下一步选中FTP服务器复选框点击安装安装完毕后可以在Wi
[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN（更新添加小目标检测层yaml）

前言作为当前先进的深度学习目标检测算法YOLOv5 已经集合了大量的trick 但是在处理一些复杂背景问题的时候还是容易出现错漏检的问题此后的系列文章将重点对YOLOv5的如何改进进行详细的介绍目的是为了给那些搞科研的同学需要创

[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN（更新添加小目标检测层yaml）

[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN（更新添加小目标检测层yaml） 的相关文章

随机推荐

热门标签

[YOLOv8/YOLOv7/YOLOv5系列算法改进NO.5]改进特征融合网络PANET为BIFPN（更新添加小目标检测层yaml）的相关文章