inception 论文阅读笔记

2023-05-16

inception V1

  1. 提出inception unit,采用多个size的卷积核对输入进行卷积。

  2. 采用1x1 3x3 5x5的卷积核不是必须的,而是为了方便

  3. 可以理解为不同大小的卷积核可以提取到图像中不同大小的特征

  4. 带来的问题:需要训练的参数太多   -------------解决方法:在使用3x3 5x5的卷积核之前使用一次1x1的卷积核进行降维,1x1的卷积核可以实现通道间的连接和信息互通。

疑问:

决定3x3、5x5的卷积输出维度的依据是什么?

 Batch Normalization

  1. 采用了批规范化Batch Normalization,使得训练时可以采用更大的学习率、更少的关注参数初始化。
  2. 论文中指出在最先进的图像分类模型中采用批规范化可以减少14倍的训练次数,却能达到相同的准确率。
  3. 为了减少训练时梯度下降法带来的nternal covariate shift,文章通过fixing the distribution of the layer inputs来提高训练的速度。
  4. We presented an algorithm for constructing, training, and performing inference with batch-normalized networks. The
    resulting networks can be trained with saturating nonlinearities, are more tolerant to increased training rates, and
    often do not require Dropout for regularization.

inception V3

 

  1. 文章思考如何有效率的提升模型的规模而尽可能的减少计算代价。In this paper, we start with describing a few general principles and optimization ideas that that proved to be useful for scaling up convolution networks in efficient ways.
  2. 提出了一些general principle:

  3. 5x5的卷积核 可以通过两个3x3的卷积核进行代替,同时减少了需要学习的参数数量,(18:25)

  4. 同理,理论上来说 可以采用更加小的卷积核来代替3x3的卷积核,例如使用不对称的卷积核组合 3x1 和 1x3

  5. 网络结构中采用了Auxiliary Classifiers,文中指出通过测试发现Auxiliary Classifiers结构出现在网络深层效果比较好,在浅层网络时,有无Auxiliary Classifiers对测试结果没有影响。we argue that the auxiliary classifiers act as regularizer
     

  6. 然而作者发现在使用这种不对称的卷积核时,在浅层网络的效果并不好,在中层的特征图大小时得到较好的效果。——In practice, we have found that employing this factorization does not work well on early layers, but it gives very good results on medium grid-sizes (On m×m feature maps, where m ranges between 12 and 20). On that level, very good results can be achieved by using 1 × 7 convolutions followed by 7 × 1 convolutions..

Inception v4

  1. 实验结果表明 结合将residual结构结合到inception网络中可以大大的加快inception网络的训练速度。
  2. 在计算代价相当的情况下,residual inception网络的表现稍好。
  3. 文中提出了改进的inception结构称之为V4,同时也将inception和residual结构进行结合。

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

inception 论文阅读笔记 的相关文章

随机推荐

  • JAVA-- 在Java8 Parallel Stream中如何自定义线程池?

    使用Parallel Stream时 xff0c 在适当的环境中 xff0c 通过适当地使用并行度级别 xff0c 可以在某些情况下获得性能提升 如果程序创建一个自定义ThreadPool xff0c 必须记住调用它的shutdown 方法
  • 关于C++11静态成员变量的类内初始化

    关于C 43 43 11静态成员变量的类内初始化 先放测试后得到的结论 xff0c 如下表所示 静态成员变量类型是否可以类内初始化static int不可以static const int可以static const float不可以sta
  • 对象存储之SeaweedFS简介及与MinIO的对比

    什么是SeaweedFS xff1f SeaweedFS架构 xff1a master service 主服务 和Volume service 卷服务 一起提供分布式对象存储服务 xff0c 支持用户配置数据的复制和冗余策略 可选的File
  • Paimon: Streaming data lake 数据湖项目的后起之秀

    什么是Paimon Paimon的官网介绍是 Streaming data lake platform with high speed data ingestion changelog tracking and efficient real
  • 数据湖Data Lakehouse支持行级更改的策略:COW、MOR、Delete+Insert

    COW 写时复制 MOR 读时合并 Delete Insert 保证同一个主键下仅存在一条记录 将更新操作转换为Delete操作和Insert操作 COW和MOR的对比如下图 而Delete Insert在StarRocks主键模型中用到
  • JAVA-- 带你重温JAVA NIO中的ZERO COPY 零拷贝

    java zero copy介绍 Java零拷贝是一种技术 在不经过应用程序的情况下 直接将数据从文件或内存映射到套接字 从而减少数据拷贝和上下文切换的次数 提高数据传输的效率 Java中支持零拷贝的方法 java nio channels
  • JUnit 5 使用教程 及 JUnit 4/5的差异

    1 JUnit 5产生的原因 JDK 8在java中带来了迷人的功能 最值得注意的是lambda表达式 为了适应 Java 8 风格的编码和新的功能特性 JUnit 提供了JUnit 5 2 JUnit 5 架构 与 JUnit 4 相比
  • JAVA-- 带你重温函数式接口、使用Functional Interface最佳实践

    1 概念及分类 函数式接口 Functional Interface 就是一个有且仅有一个抽象方法 但是可以有多个非抽象方法的接口 并且这类接口使用了 FunctionalInterface进行注解 在jdk8中 引入了一个新的包java
  • 如何基于LLMs使用LangChain构建强大的差异化应用--LangChain之初体验

    近年来 语言模型 LMs 特别是LLMs已经成为最令人兴奋和最有影响力的技术之一 它们可以为各种目的生成自然语言文本 例如回答问题 撰写摘要 创建故事等等 然而 仅使用LMs还不足以构建真正强大且与众不同的应用程序 您还需要 将LMs连接到
  • 连接局域网下centos服务器和mysql数据库慢优化方法

    连接局域网下centos服务器和mysql数据库慢优化方法 Xshell连接centos比较慢优化 通过xshell连接服务器需要服务端安装openssl xff0c openssl配置项UseDNS 默认情况是开启状态的 xff0c Us
  • 云技术概念

    云计算概念是由Google提出的 xff0c 这是一个美丽的网络应用模式 狭义云计算是指IT基础设施的交付和使用模式 xff0c 指通过网络以按需 易扩展的方式获得所需的资源 xff1b 广义云计算是指服务的交付和使用模式 xff0c 指通
  • 通过IP地址和子网掩码与运算计算相关地址

    通过IP地址和子网掩码与运算计算相关地址 知道ip地址和子网掩码后可以算出 xff1a 1 网络地址 2 广播地址 3 地址范围 4 本网有几台主机 例1 xff1a 下面例子IP地址为192 168 100 5 子网掩码是255 255
  • 关于VSCode的三个配置文件

    关于VSCode的三个配置文件 若要使用VSCode来开发C 43 43 程序 xff0c 则应该了解以下三种配置文件 xff0c 分别为 xff1a tasks json xff1a 编译器相关的配置文件 比如 xff0c 设置编译指令
  • 用Prime95来做linux下CPU压力测试

    Prime95是用来做linux下CPU压力测试的 由GIMPS Great Internet Mersenne Prime Search xff09 所提供 主要是透过运算找出梅森质数 质数 xff08 Prime number xff0
  • ubuntu修改启动项等待时间、修改启动项顺序、更改启动内核

    目录 ubuntu修改启动项等待时间 修改启动项顺序 更改系统内核版本 ubuntu修改启动项等待时间 步骤 sudo vi etc default grub找GRUB TIMEOUT 61 10 那一行 xff0c 把10改为需要的时间即
  • 好电影推荐

    今天在网上看到一篇给大家推荐电影的帖子 xff0c 里面搜集了一些欧美电影 xff0c 有悬疑片 剧情片 动作片 恐怖片 xff0c 包括经典的 以及一些流传不是很广的 xff0c 在这里收藏一下与大家一起分享 xff1a 1 不请自来 典
  • CodeBlock无编辑器问题解决

    对于新手小白来说 xff0c 在使用CodeBlock做C语言或者C 43 43 方面的编写时 xff0c CodeBlock会出现如下情况 xff1a Can 39 t find compiler executable in your c
  • argparse—使用命令行输入,给变量赋值

    import argparse if name 61 61 39 main 39 parser 61 argparse ArgumentParser parser add argument 39 bbb 39 type 61 int def
  • 树莓派keras、TensorFlow环境安装记录

    1 安装arm版的TensorFlow xff0c 方法参考 xff1a https github com samjabrahams tensorflow on raspberry pi 2 安装keras sudo apt get ins
  • inception 论文阅读笔记

    inception V1 提出inception unit xff0c 采用多个size的卷积核对输入进行卷积 采用1x1 3x3 5x5的卷积核不是必须的 xff0c 而是为了方便 可以理解为不同大小的卷积核可以提取到图像中不同大小的特征