目标检测之EfficientNet

2023-11-08

本文参考以下链接,如有侵权,联系删除
参考链接
论文:EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks-ICML 2019

概要

这篇ICML2019的论文对目前分类网络的优化提出更加泛化的思想,认为目前常用的加宽网络、加深网络和增加分辨率这3种常用的提升网络指标的方式之间不应该是相互独立的。因此提出了compound model scaling算法,通过综合优化网络宽度、网络深度和分辨率达到指标提升的目的,能够达到准确率指标和现有分类网络相似的情况下,大大减少模型参数量和计算量

model scaling

作者将目前分类网络的model scaling大致分为:加宽网络、加深网络和增大分辨率,也就是分别对应Figure2中的(b)、(c)、(d),这3个分别从不同的维度来做model scaling,举个例子,对ResNet网络做深度方面的model scaling可以得到ResNet50、ResNet101等不同深度的网络结构。而这篇论文要做的是将这3者结合起来一起优化,也就是(e)。
在这里插入图片描述

单个维度做scaling存在什么问题吗?

针对这个问题,作者做了Figure3这个实验,也就是针对某个分类网络的3个维度(宽度、深度和分辨率)分别做model scaling的结果对比。显然,单独优化这3个维度都能提升模型效果,但上限也比较明显,基本上在Acc达到80后提升就很小了。
在这里插入图片描述

多个维度结合做scaling效果如何?

针对这个问题,作者做了Figure4这个实验,相当于手动设置3个维度的model scaling参数。蓝色线表示的是只对宽度做model scaling的实验结果,上面的每个点表示不同宽度的网络,因此不同线条上相同顺序的点表示的网络宽度设置是一样的。可以看到,通过手动设置3个维度的model scaling参数就能有效提升模型的效果(突破80),这就说明多维度融合是有效的
在这里插入图片描述

怎么找到最优的3个维度的scaling参数?

这就是这篇文章提出的compound model scaling算法要解决的问题。
首先看看一些符号定义,在公式1中, N N N 表示分类网络, X X X 表示输入, F i F_i Fi 表示基础网络层, i i i 表示stage, L i L_i Li 表示 F i F_i Fi 结构在第 i i i 个stage中的重复数量。公式1这样的定义方式对应的最直观例子就是ResNet系列网络,我们知道ResNet系列网络有多个stage,每个stage包含不同数量的block结构。
在这里插入图片描述
那么model scaling的目标就是在模型参数和计算量满足限制条件的情况下最大化网络的准确率,也就是公式2所表达的内容,待优化的参数就是网络深度(d)、网络宽度(w)和分辨率(r)
在这里插入图片描述
为了找到满足公式2的3个维度参数,这篇论文引入Φ参数,并将3个待优化参数都用Φ指数表示,如公式3所示,同时对底做了数值限制,做限制可以减少网格搜索时的计算量,而具体的限制公式确定是为了方便计算FLOPS。这里需要说明一下d、w和r参数对FLOPS计算的影响,以卷积层为例,假如d变成原来的2倍,那么FLOPS也会变成原来的2倍;假如w变成原来的2倍,那么FLOPS就变成原来的4倍,因为输入输出通道都变成原来的2倍了,所以在计算量方面相当于4倍;r和w同理
在这里插入图片描述

baseline网络-EfficientNet-B0

准备好优化公式后,作者还通过网络结构搜索设计了一个baseline网络,也就是EfficientNet-B0,如Table1所示,网络结构比较简单,方便后续测试compound model scaling算法的效果。

在这里插入图片描述

网络优化求解

在优化求解方面,作者提出2步优化,

  • 第一步是固定Φ=1,然后通过网格搜索找到满足公式3的最优α、β、γ,比如对于EfficientNet-B0网络而言,最佳的参数分别是α=1.2、β=1.1、γ=1.15(此时得到的也就是EfficientNet-B1)。
  • 第二步是固定第一步求得的α、β、γ参数,然后用不同的Φ参数得到EfficientNet-B1到EfficientNet-B7网络,最后的实验结果如Table2所示,可以看到EfficientNet系列网络在取得和其他分类网络差不多的准确率时,参数量和计算量都很减少很多。

理论上,假如EfficientNet-B0网络是全卷积且做scale操作过程中没有小数的取整操作,那么从EfficientNet-B0到EfficientNet-B7网络的FLOPS应该是严格的2^Φ关系,但从Table2来看显然没有,主要是因为scale过程中的取整操作以及EfficientNet-B0网络并非全卷积结构
在这里插入图片描述
在最后的实验中,作者将compound model scaling算法应用在其他现有的分类模型中,发现同样有效,说明泛化效果还不错,如Table3所示。
在这里插入图片描述
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测之EfficientNet 的相关文章

随机推荐

  • “那不勒斯”服务器芯片,那不勒斯定名 AMD发布全新CPU品牌EPYC

    在今天举行的2017年AMD财务分析师日活动上 AMD正式公布了旗下的全新一代服务器处理器品牌 EPYC EPYC系列产品此前代号为大家熟悉的 那不勒斯 Naples 最大核心数量为32核 支持超线程技术 可提供128条PCI E 3 0通
  • 用python实现西绪福斯黑洞(即123数字黑洞)的演示

    目录 一 123数字黑洞描述 二 问题解决 1 内容描述 2 实现思路 3 代码功能实现 1 分解输入的数字字符串 生成数字列表 2 由数字列表生成新的数字字符串 3 主程序实现输入和输出 三 完整代码 四 结果输出 1 验证前文的数据 2
  • sql server 2000:不能打开到主机的连接,在端口1433:连接失败

    来源 http topic csdn net u 20081104 20 fd1f1e2b 9350 43a4 9892 34a98a709216 html http hi baidu com sinber blog item a12e8d
  • Pycharm编程题——判断输入数字的奇偶

    输入一个数字 判断它是奇数还是偶数 num int input 请输入一个整数 if num 2 0 print num 是偶数 else print num 是奇数
  • 垃圾收集机制原理

    目录标题 1 可回收对象 1 引用计数算法 2 可达性分析算法 2 垃圾收集算法 1 标记 清除算法 2 复制算法 3 标记 整理算法 4 分代收集算法 3 新生代 老年代 4 什么时候GC回收对象 Java堆 Java Heap 是Jav
  • pandas 数据类型之 Series

    Python 官网 https www python org 这里 才 python 前沿 可惜是英文原版 所以 我要练习英文阅读 我的CSDN主页 My Python 学习个人备忘录 我的HOT博 老齐教室 自学并不是什么神秘的东西 一个
  • Scala 正则表达式

    Scala 正则表达式 Scala 通过 scala util matching 包中的 Regex 类来支持正则表达式 以下实例演示了使用正则表达式查找单词 Scala import scala util matching Regex o
  • chatglm docker镜像,一键部署chatglm本地知识库

    好久没有写文章了 今天有空 记录一下chatglm本地知识库的docker镜像制作过程 核心程序是基于 闻达 开源项目 稍作改动 镜像可以直接启动运行 大家感兴趣可以进入镜像内部查看 代码位于 app 目录下 一 制作镜像 docker t
  • ISTQB认证工程师学习笔记(5)——测试管理

    测试管理的学习目标 测试组织 测试计划和估算 测试监督与控制 配置管理 风险和测试 缺陷管理 测试组织 独立测试 测试任务可以由具体指定的测试人员完成 也可以由其他角色人员完成 比如客户 由于作者和测试员的认知取向不同 一定程度的独立性可以
  • SpringCloud Alibaba Nacos作为配置中心不生效问题

    在使用Springcloud Alibaba 的Nacos作为配置中心时 遇到了在配置中心中提交相关配置后但配置还是从本地获取 没有从nacos中获取的情况 可能是如下原因导致 1 需要自行新建bootstrap properties并配置
  • 人工稚能之sklearn分类

    分类算法和聚类比较类似 都是将输入数据赋予一个标签类别 区别是分类算法的分类是预先确定的 有明确含义的 而聚类的标签是从输入数据本身的分布中提取出来的一种抽象的类别 聚类是无监督算法 而分类是有监督的 除了输入数据x外 还有标签y 分类算法
  • WSL 更新NVIDIA 驱动 安装CUDA

    WSL 一定要使用WSL2 我选择的linux系统是ubuntu22 04 在微软应用商店安装的 安装完成之后可以通过 wsl l v查看 NVIDIA 驱动 WSL 中不要直接安装linux版的显卡驱动 而是需要在windows中安装驱动
  • 动态知识图补全问题

    4 19 4 23 动态信息 1 Dual Quaternion Knowledge Graph Embeddings 本文应该是静态方法 距离公式和旋转公式的一个统一框架 提出一个新的映射空间 Dual Quaternion space
  • 民数记研读1——于宏洁

    民数记研读 于宏洁 1 西乃山下 一 第一次数点百姓 二 各支派安营 三 前行 四 银号 2 几种重要的人 一 利未人 二 拿细耳人的条例 三 首领 3 管与教 一 从荣耀角度来看神的管教 二 在神的管教中 要注意的几个点 三 民数记中十次
  • Apple 的 plist 编辑器入门指南:基础操作与高级功能详解

    PlistEdit Pro是一款专为macOS编写的最高级属性列表Plist编辑器 对于Mac和IOS开发人员来说 编写应用程序时必须编辑各种列表文件 PlistEdit Pro通过提供直观且功能强大的界面 使编辑这些文件更加容易 它不仅能
  • 深度学习机器学习目标检测

    一 目标检测 1 深度学习开发流程 2 应用案例 3 目标检测算法基本流程 二 机器学习 1 机器学习算法能解决那些问题 分类问题 图像识别 垃圾邮件识别 回归问题 各种预测 房价 天气 股价等等 排序问题 推荐 点击率排序 生成问题 图像
  • 完全卸载Android Studio(卸载得干干净净)

    步骤其实很简单 一共三步 但是每一步都需要完成 步骤如下 打开控制面板或腾讯软件管家等执行常规的卸载操作 找到SDK的安装目录手动删除SDK 进入 C Users lt 你的用户名下 gt 目录下 手动删除 android AndroidS
  • github 创建分支,本地代码上传github 服务器上

    git分布式版本控制系统 我第一个接触的版本控制系统是svn 当时觉得版本控制就是这样 直到我遇到了git git是分布式版本控制系统 合适分布式开发 强调个体 速度快 灵活 代码冲突了也比较好解决 最让我喜欢的还是git的分支切换 在gi
  • Python学习.第五天.列表

    Python学习 第五天 列表 前言 一 列表的创建与删除 二 列表的查询操作 1 index 如果查询时列表中存在n个相同元素 只返回元素中的第一个元素的索引 2 获取列表中的单个元素 3 获取列表中的多个元素 4 判断指定元素在列表中是
  • 目标检测之EfficientNet

    本文参考以下链接 如有侵权 联系删除 参考链接 论文 EfficientNet Rethinking Model Scaling for Convolutional Neural Networks EfficientNet Rethinki