PicoDet的学习笔记

2023-11-20

学习资源

Paddle官方教程: 《AI快车道PaddleDetection – 课节4: 闪电版目标检测算法PP-PicoDet》
PicoDet增强版官方介绍: 超强目标检测算法矩阵(PicoDet-XS)
PicoDet论文: PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices
关键点视频也需要学习一下;

1 模型介绍

论文阅读笔记:《PicoDet论文译读笔记》
模型类型: Anchor-Free
关于PicoDet的整体描述,我觉得可以参照VFNet论文对这类模型的介绍:

[VFNet Paper]: Another type of anchor-free detectors are similar to anchor-based one-stage methods, but they remove the usage of anchor boxes. Instead, they classify each point on the feature pyramids [25_FPN] into foreground classes or background, and directly predict the distances from the foreground point to the four sides of the ground-truth bounding box, to produce the detection. Popular methods include DenseBox [26_DenseBox], FASF [27_FASF], FoveaBox [15_FoveaBox], FCOS [9_FCOS], and SPAD [28_SPAD].

技术一览表:

名称 cfg
参数初始化 KaimingNormal
Loss l o s s v f l + 2 ⋅ l o s s g i o u + 0.25 ⋅ l o s s d f l loss_{vfl}+2\cdot loss_{giou} + 0.25\cdot loss_{dfl} lossvfl+2lossgiou+0.25lossdfl

2 损失函数

首先,来看看loss函数的整体公式:
l o s s = l o s s v f l + 2 ⋅ l o s s g i o u + 0.25 ⋅ l o s s d f l loss = loss_{vfl}+2\cdot loss_{giou} + 0.25\cdot loss_{dfl} loss=lossvfl+2lossgiou+0.25lossdfl
其中,
l o s s v f l loss_{vfl} lossvfl:Varifocal Loss。
l o s s g i o u loss_{giou} lossgiou:GIoU Loss。
l o s s d f l loss_{dfl} lossdfl:Distribution Focal Loss。

2.1 Varifocal Loss —— 分类损失

Varifocal Loss是在VarifocalNet[paper]中提出的;
(关于VarifocalNet论文,请参见《【CVPR 2021】VarifocalNet: An IoU-aware Dense Object Detector的译读笔记》
请参考《mmdetection最小复刻版(十六):iou感知VarifocalNet深入分析》

2.2 GIoU Loss —— 回归损失

用来回归边界框的坐标值;

2.3 Distribution Focal Loss —— 分类损失

Distribution Focal Loss出自论文《Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection》
参考资料:

DFLoss代码实现:

我看了一下PaddleDetection的实现跟MMDetection的实现几乎是一样的;

3 训练自定义数据

训练命令:

python tools/train.py -c configs/model/model_coco.yml
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PicoDet的学习笔记 的相关文章

随机推荐

  • Python入门—— MySQL-python模块

    MySQL python模块 MySQLdb Python 标准数据库接口为 Python DB API Python DB API为开发人员提供了数据库应用编程接口 可以访问Python数据库接口及API查看详细的支持数据库列表 不同的数
  • Hadoop3 启动服务,提示:Attempting to operate on hdfs namenode as root

    在刚刚安装Hadoop3 环境上 启动Hadoop3 给出如下提示信息 Attempting to operate on hdfs namenode as root 翻译 尝试使用root 账户去操作hdfs namenode 造成原因 缺
  • IEEE 1588-PTP简介

    1 PTP简介 网络测控系统精确时钟同步协议PTP Precision Time Protocol 是一种对标准以太网终端设备进行时间和频率同步的协议 也称为IEEE 1588 简称为1588 1588分为1588v1和1588v2两个版本
  • 树莓派4B安装详细教程,从零开始!

    树莓派4B安装详细教程 从零开始 前言 一 准备材料 1 硬件材料 2 软件材料 二 安装步骤 1 格式化SD卡 2 安装系统 三 安装完成 前言 提示 本文详细介绍树莓派4B的安装流程 适合刚入手树莓派的同学 认为我写的好的同学希望点赞关
  • xxx-0.0.1-SNAPSHOT.jar中没有主清单属性

    添加如下配置即可
  • 算法通关村——二分查找在寻找数组峰顶中的应用

    题目 在数组i的某个位置i 开始 从 0 到 i 都是递增的 从 i 1 都是递减的 请你找到这个最高点 方法一 使用线性遍历实现 分析 最高点如果存在 需要满足arr i 1 lt arr i gt arr i 1 又因为题目说了0到i就
  • 史上最全的Android面试题集锦

    前言 很多人面试之前 可能没有在互联网公司工作过或者说工作过但年头较短 不知道互联网公司技术面试都会问哪些问题 再加上可能自己准备也不充分 去面试没几个回合就被面试官几个问题打蒙了 最后以惨败收场 下述是我收录整理的Android面试题汇总
  • 解决Photoshop无法完成请求,因为找到不知名的或无效的JPEG标识符类型问题

    在我将用微信Alt A截的图到Photoshop的时候出现无法完成请求 因为找到不知名的或无效的JPEG标识符类型问题 如下图 解决办法是 右击图片 用画图打开图片 将图片另存为jpg格式或者png格式即可 再次导入即可成功 具体原因不详
  • 2021年10月中旬—字节AI LAB NLP算法面试题(一)

    问题一 bert的架构是什么 目标是什么 输入包括了什么 三个embedding输入是怎么综合的 Bert的结构主要是Transformer的encoder部分 其中Bert base有12层 输出维度为768 参数量为110M Bert
  • 人工智能-10种机器学习常见算法

    机器学习是目前行业的一个创新且重要的领域 今天 给大家介绍机器学习中的10种常见的算法 希望可以帮助大家适应机器学习的世界 1 线性回归 线性回归 Linear Regression 是目前机器学习算法中最流行的一种 线性回归算法就是要找一
  • 因果推断:因果表征学习的CV落地

    作者 Ostrich 单位 阿里巴巴算法工程师 研究方向 自然语言处理 搜索算法 本文主要梳理因果推断与机器学习相结合的一些比较新的工作思路 也是尝试回答自己在学习因果推断基础知识时的一些疑问 突然 被广泛谈及的因果可以以什么样的方式落地
  • 【BS】compilation debug=true targetFramework=4.0 无法识别的属性“targetFramework”

    一 背景 今天在发布网站的时候遇到这个问题 compilation debug true targetFramework 4 0 无法识别的属性 targetFramework 系统是师哥新做的windows server 2008 图一
  • 【vue】前端下载文件自定义文件名称

    下载文件自定义文件名称 文件下载名称不想和后端提供的URL一样怎么办呢 1 首先给按钮去绑定一个事件 2 正常我们的下载处理方式 3 自定义下载的文件名字 文件下载名称不想和后端提供的URL一样怎么办呢 1 首先给按钮去绑定一个事件 按钮的
  • 微信小程序第六篇:元素吸顶效果实现

    系列文章传送门 微信小程序第一篇 自定义组件详解 微信小程序第二篇 七种主流通信方法详解 微信小程序第三篇 获取页面节点信息 微信小程序第四篇 生成图片并保存到手机相册 微信小程序第五篇 页面弹出效果及共享元素动画 话不多说 先看效果 这种
  • ElasticSearch ected map for property [fields] on field [subject_id] but got a class java.lang

    ElasticSearch的聚类时出现fielddata true Expected map for property fields on field subject id but got a class java lang String
  • 前端导出多级表头

    前端导出多级表头 今天在技术交流群里面看到有人问到了这一块 我之前看过一些关于这样的代码 我就直接给他上了代码 自己又重新练习里一遍 这是结合elementUI来写的一个表格 先看一下练习的是这样的效果 首先还是要安装依赖 npm inst
  • Howto Upgrade Debian

    Howto Upgrade Debian 4 Etch to Debian 5 0 Lenny HowTo Upgrade Debian 5 0 Lenny To Debian 6 0 Squeeze HowTo Upgrade Debia
  • Centos7虚拟机创建并设置静态IP(桥接模式)

    一 准备工作 1 Centos7镜像文件下载 下载地址 Centos7下载地址 2 VMware安装 下载地址 VMware下载地址 二 创建虚拟机 1 新建虚拟机 新建虚拟机 选择典型即可 选择刚才下载的ISO镜像 虚拟机命名 可以修改虚
  • Flask项目部署到Ubuntu上

    前期准备 将在本地开发好的Flask项目打包 发送到云主机上 可以使用xftp等传输工具放到远程主机上 安装python虚拟环境 为python3安装pip sudo apt install python3 pip 为python安装pip
  • PicoDet的学习笔记

    学习资源 Paddle官方教程 AI快车道PaddleDetection 课节4 闪电版目标检测算法PP PicoDet PicoDet增强版官方介绍 超强目标检测算法矩阵 PicoDet XS PicoDet论文 PP PicoDet A