EfficientDet阅读笔记

2023-10-28

EfficientDet: Scalable and Efficient Object Detection

2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)


论文地址：	https://arxiv.org/abs/1911.09070
作者：	Mingxing Tan, Ruoming Pang, Quoc V. Le
代码地址1：	https://github.com/zylo117/Yet-Another-EfficientDet-Pytorch
代码地址2：	https://github.com/bubbliiiing/efficientdet-pytorch

1、创新点

提出了一种加权的双向特征金字塔网络(BiFPN)；
提出了一种复合尺度方法，同时统一尺度所有主干网络、特征网络和边界框/类别预测网络的分辨率、深度和宽度。
EfficientDet-D7用52M的参数和325B FLOPs在coco测试数据集上取得52.2AP，较以前的检测器小4-9倍，少使用13-42倍的FLOPs。

2、BiFPN

2.1 结构

在这里插入图片描述
传统的FPN结构受限于单一方向的信息流；PANet在FPN基础上增加了一个自下而上的路径聚合网络(path aggregation network)；NAS-FPN使用神经网络搜索更好的多尺度特征网络拓扑，但这需要成千张GPU，发现的网络也不规则，并且非常难解释和修改。
本文就多尺度连接提出几项改进：

删除只有单输入的节点。没有特征融合意味着对特征网络贡献小。
在同级的输入和输出端增加shortcut。不增加计算成本的情况下融合更多特征。
相较于PANet只有一个Top-Down和Down-Top，BiFPN将双向路径作为一个特征网络层，可重复使用，以便融合跟多特征。

2.2 加权特征融合数学表达式

Unbounded fusion

w是个可学习的参数，缺点是权重没有约束，将导致训练不稳定。
Softmax-base fusion

听过softmax将权重缩放至(0, 1)之间，但softmax增加了运算时间。
Fast normalized fusion

每个wi后使用Relu激活，ε = 0.0001防止分母为0。

由Table 6知方法3比2快了不少，但AP并没有损失多少。

3、复合缩放方法

在这里插入图片描述
使用一个超参数φ就可以缩放主干网络、BiFPN、class/box network和分辨率。

主干网络
EfficientDet-B0 到B6使用相同的宽度\深度缩放系数，这样就可以使用预训练权重。
BiFPN

BiFPN的宽度和深度缩放表达式如上图所示，1.35是一组参数中选出最好的。
Box/class prediction network
宽度和BiFPN的宽度一样，深度增加公式如下图，[]中表达式向下取整。
Resolution

4、实验

训练未使用数据集放大方法。
EfficientDet在COCO数据集上的表现
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测

深度学习

Pytorch

计算机视觉

EfficientDet阅读笔记的相关文章

pytorch index_put_给出运行时错误：“索引”的导数未实现

这是后续问题这个问题 https stackoverflow com q 65584330 3337089 我尝试使用index put 如建议的答案 https stackoverflow com a 65584479 3337089 但
.data 在 pytorch 中还有用吗？

我是 pytorch 的新手我读了很多大量使用张量的 pytorch 代码 data成员但我搜索 data在官方文档和Google中发现很少我猜 data包含张量中的数据但我不知道什么时候需要它什么时候不需要 data是一个属性
如何在 PyTorch 数据加载器中将 RGB 图像转换为灰度图像？

我已经从 MNIST 数据集中下载了一些示例图像 jpg格式现在我正在加载这些图像来测试我的预训练模型 transforms to apply to the data trans transforms Compose transforms
Pytorch 说 CUDA 不可用（在 Ubuntu 上）

我正在尝试在我拥有的笔记本电脑上运行 Pytorch 这是一个较旧的型号但它确实有 Nvidia 显卡我意识到这可能不足以实现真正的机器学习但我正在尝试这样做以便我可以了解安装 CUDA 的过程我已按照上面的步骤操作安装指南 ht
在 Pytorch 中执行优化时如何对变量应用界限？

我正在尝试使用 Pytorch 进行非凸优化试图最大化我的目标因此在 SGD 中最小化我想限制因变量 x gt 0 并且 x 值的总和小于 1000 我认为我已经以斜坡惩罚的形式正确实施了惩罚但我正在努力解决 x 变量的边界问题在
PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
在 C++ API 中将一个张量的一大块复制到另一个张量中

我需要复制一行一个张量在c API 转换为另一个张量的某些部分其中开始和结束索引可用在 C 中我们可以使用类似的东西 int myints 10 20 30 40 50 60 70 std vector
在pytorch中使用tensorboard，但得到空白页面？

我在pytorch 1 3 1中使用tensorboard 并且我在张量板的 pytorch 文档 https pytorch org docs stable tensorboard html 运行后tensorboard logdir r
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
pytorch grad 在 .backward() 之后为 None

我刚刚安装火炬 1 0 0 on Python 3 7 2 macOS 并尝试tutorial https pytorch org tutorials beginner blitz autograd tutorial html sphx g
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维

随机推荐

QT : 屏蔽qDebug调试信息

DEFINES QT NO WARNING OUTPUT DEFINES QT NO DEBUG OUTPUT C Qt Qt5 7 0 5 7 msvc2013 include QtCore qlogging h cpp view pla
(转)[Unity3D]关于Assets资源目录结构管理

转 Unity3D 关于Assets资源目录结构管理分享个我们项目常用的目录结构微调过很多次最终到了这个版本个人认为这种管理资源方式是不错的欢迎探讨各个细节更新于2013 5 30 Asserts Editor 自写的灵活方便插
Hbase导入、导出数据到本地文件

注意导入导出操作是在控制台中运行而不是Hbase Shell中导出命令格式是 hbase org apache hadoop hbase mapreduce Export 表名文件路径 hbase org apache hadoo
VS2017出现C4996 'fopen': This function or variable may be unsafe. Consider using fopen_s instead.错误

VS2017利用fopen和fscanf读取文件时出现以下错误信息 C4996 fopen This function or variable may be unsafe Consider using fopen s instead To
Layout state should be one of 100 but it is 10的问题

目前的解决方法是把View inflate方法换成LayoutInflater inflate方法不过目前发生问题的原因还不明白和最后的解决方法还没摸清楚先占个坑然后解决它 2018 12 29 目前发现的问题就是在adapter里设置
TCP报文段（segment）首部格式

TCP传给IP的数据单元称作TCP报文段或简称为TCP段 TCP segment IP传给链路层的数据单元称作IP数据报 IP datagram 通过以太网传输的比特流称作帧 Frame 逐层封装源端口号发送端端口号字段长16位 2字
minidom 模块写入和解析 XML

一写 XML 文件 from xml dom import minidom 1 创建DOM树对象 dom minidom Document 2 创建根节点每次都要用DOM对象来创建任何节点 root node dom createEle
springboot+k8s+抛弃springcloud.eureka

springboot开发微服务框架一般使用springcloud全家桶而整个项目都是容器化的通过k8s进行编排而k8s自己也有服务发现机制所以我们也可以抛弃springcloud里的eureka 而直接使用k8s自己的服务添加组件
【pygame】event模块

pygame event模块主要函数另一位博主的event模块详细中文翻译 pygame event pump 让 Pygame 内部自动处理事件 pygame event get 从队列中获取事件 pygame event poll
Vue3.x+ElementUI+Axios+阿里云对象存储实现图片or文件上传

文章目录 1 文件md5加密验证 2 请求接口得到身份凭证 3 通过后台返回的身份凭证去阿里云校验 4 校验通过上传文件 1 文件md5加密验证 import file2md5 from file2md5 const md5 await f
erc20,trc20创建地址(分层确定性钱包),入账，归集（java版本）

erc20 trc20创建地址分层确定性钱包入账归集 java版本 1 erc20实现 2 trc20实现 3 HD Wallet分层确定性钱包实现 4 chia钱包对接归集流程图写在最后如果有啥问题可以评论留言哦不喜勿喷
2011-2021年北京大学数字普惠金融指数（全国省、地级市、县域均有）

数据名称数字普惠金融指数第四期包括省市县数据年份 2011 2021年数据范围全国31个省 337个地级以上城市以及2800个县数据说明这套指数包括数字普惠金融指数以及数字金融覆盖广度数字金融使用深度以及普惠金融数字化程
【SQL】血缘解析 SQL parser 工具介绍

1 概述 2 git 大数据解析 https github com 0xqq bigdata sql parser 基于hook机制实现数据血缘系统 Flink 第三十二篇 Flink SQL 字段血缘中树的构建与遍历 Flink 第二十七
从输入任意个整型数，统计其中的负数个数并求所有非负数的平均值，结果保留一位小数，如果没有非负数，则平均值为0 本题有多组输入数据，输入到文件末尾，请使用while(cin＞＞)读入数据范围小于1e6

从输入任意个整型数统计其中的负数个数并求所有非负数的平均值结果保留一位小数如果没有非负数则平均值为0 本题有多组输入数据输入到文件末尾请使用while cin gt gt 读入数据范围小于1e6 import java uti
6.1、Flink数据写入到文件

1 前言 Flink API 提供了FileSink连接器来帮助我们将数据写出到文件系统中去版本说明 java1 8 flink1 17 官网链接官网 2 Format Types 指定文件格式 FileSink 支持 Row enc
LastPass即将收费，是时候更换一款先得密码管理工具了！

作者弗拉德来源弗拉德公众号 fulade me 前几天收到了LastPass的邮件自2021年3月16日起不再提供全平台的免费服务用户只能选择一个平台享受免费 iOS Android 或者 PC端邮件里还提到购买会员享受2
Java--The absolute uri: [http://java.sun.com/jsp/jstl/core] cannot be resolved in either web.xml

The absolute uri http java sun com jsp jstl core cannot be resolved in either web xml or the jar files deployed with thi
task10 python 类和对象

类与实例 class Car price 100000 定义类属性 def init self c self color c 定义实例属性 car1 Car Red 实例化对象 car2 Car Blue 查看实例属性和类属性的值 prin
【送面试题】如何高效实现MyBatis批量更新MySQL数据：List入参的完美解决方案

AI绘画关于SD MJ GPT SDXL百科全书面试题分享点我直达 2023Python面试题 2023最新面试合集链接 2023大厂面试题PDF 面试题PDF版本 java python面试题项目实战 AI文本 OCR识别最佳实践 A
EfficientDet阅读笔记

EfficientDet Scalable and Efficient Object Detection 2020 IEEE CVF Conference on Computer Vision and Pattern Recognition