inception 论文阅读笔记

2023-05-16

inception V1

提出inception unit，采用多个size的卷积核对输入进行卷积。

采用1x1 3x3 5x5的卷积核不是必须的，而是为了方便

可以理解为不同大小的卷积核可以提取到图像中不同大小的特征

带来的问题：需要训练的参数太多 -------------解决方法：在使用3x3 5x5的卷积核之前使用一次1x1的卷积核进行降维，1x1的卷积核可以实现通道间的连接和信息互通。

疑问：

决定3x3、5x5的卷积输出维度的依据是什么？

Batch Normalization

采用了批规范化Batch Normalization，使得训练时可以采用更大的学习率、更少的关注参数初始化。
论文中指出在最先进的图像分类模型中采用批规范化可以减少14倍的训练次数，却能达到相同的准确率。
为了减少训练时梯度下降法带来的nternal covariate shift，文章通过fixing the distribution of the layer inputs来提高训练的速度。
We presented an algorithm for constructing, training, and performing inference with batch-normalized networks. The
resulting networks can be trained with saturating nonlinearities, are more tolerant to increased training rates, and
often do not require Dropout for regularization.

inception V3

文章思考如何有效率的提升模型的规模而尽可能的减少计算代价。In this paper, we start with describing a few general principles and optimization ideas that that proved to be useful for scaling up convolution networks in efficient ways.

提出了一些general principle:

5x5的卷积核可以通过两个3x3的卷积核进行代替，同时减少了需要学习的参数数量，（18:25）

同理，理论上来说可以采用更加小的卷积核来代替3x3的卷积核，例如使用不对称的卷积核组合 3x1 和 1x3

网络结构中采用了Auxiliary Classifiers，文中指出通过测试发现Auxiliary Classifiers结构出现在网络深层效果比较好，在浅层网络时，有无Auxiliary Classifiers对测试结果没有影响。we argue that the auxiliary classifiers act as regularizer

然而作者发现在使用这种不对称的卷积核时，在浅层网络的效果并不好，在中层的特征图大小时得到较好的效果。——In practice, we have found that employing this factorization does not work well on early layers, but it gives very good results on medium grid-sizes (On m×m feature maps, where m ranges between 12 and 20). On that level, very good results can be achieved by using 1 × 7 convolutions followed by 7 × 1 convolutions..

Inception v4

实验结果表明结合将residual结构结合到inception网络中可以大大的加快inception网络的训练速度。
在计算代价相当的情况下，residual inception网络的表现稍好。
文中提出了改进的inception结构称之为V4，同时也将inception和residual结构进行结合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

inception

论文阅读笔记

inception 论文阅读笔记的相关文章

ego-planner论文阅读笔记

ESDF Euclidean Signed Distance Field EGO ESDF free Gradient based lOcal planning framework 摘要通过比较碰撞轨迹与无碰撞引导路径 xff0c 得到惩
【论文阅读笔记】GAN Memory with No Forgetting

Hello大家好 xff0c 今天带大家来看Nips2020的最新文章 GAN Memory with No Forgetting 关于Nips2020所有关于终生学习的文章可见传送门总览本文是杜克大学 xff08 Duke Unive
GVINS论文阅读笔记

Code Pseudorange Measurement c o d e p s e
Pytorch源码学习之六：torchvision.models.inception_v3

0 参考和简介 torchvision models inception v3源码实现的论文地址部分网络结构 xff1a InceptionA InceptionC InceptionE 一源码 span class token co
torchvision中inception v3的实现

一 torchvision中inception v3的网络结构论文中给的结构如下图所示但是torchvision中的inception v3结构中并不是这么实现的下面解释一下torchvision中的inception v3结构 xf
【pytorch torchvision源码解读系列—3】Inception V3

框架中有一个非常重要且好用的包 xff1a torchvision xff0c 顾名思义这个包主要是关于计算机视觉cv的这个包主要由3个子包组成 xff0c 分别是 xff1a torchvision datasets torchvisi
论文阅读笔记：Learning from Task Descriptions

0 简介论文名字 Learning from Task Descriptions 下载地址 https www aclweb org anthology 2020 emnlp main 105 会议 ACL 2020 1 论文的motiv
LBP算法及其改进算法

LBP LBP指局部二值模式英文全称 Local Binary Pattern 是一种用来描述图像局部特征的算子 LBP特征具有灰度不变性和旋转不变性等显著优点它是由T Ojala M Pietik inen 和 D Harwood在1
【arxiv】Few-Shot Text Generation with Pattern-Exploiting Training

原文链接 https arxiv org pdf 2012 11926 pdf Abstract 为预先训练好的语言模型提供简单的任务描述或自然语言提示可以在文本分类任务产生令人印象深刻的few shot结果在本文中我们表明了这个潜在
安装Yearning SQL审核平台和Inception（基于已闭源方式）

这是我安装Yearning SQL审核平台和Inception 已闭源总结的文档 1 安装centos7并配置网络为桥接模式命令 vi etc sysconfig network scripts ifcfg ens33 内部配置如下 2
OCR文本检测模型：FCENet论文阅读笔记

文章目录前言摘要 Abstract 1 介绍 Introduction 2 相关工作 Related Work 3 方法 Approach 3 1 傅里叶轮廓嵌入 Fourier Contour Embedding 3 2 FCENet
【图像去模糊】Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring论文笔记

一论文概述一般因动态场景造成的非均匀模糊是图像去模糊中一个具有挑战性的问题这类模糊由相机抖动场景深度以及多个对象运动造成消除这类复杂运动模糊传统的基于简单假设的方法不在适用在本文中作者提出了一种多尺度卷积神经网络以端到端的
将GAN用于语义分割

深度学习已经在图像分类检测分割高分辨率图像生成等诸多领域取得了突破性的成绩但是它也存在一些问题首先它与传统的机器学习方法一样通常假设训练数据与测试数据服从同样的分布或者是在训练数据上的预测结果与在测试数据上的预测结果服从同样
基于深度学习的三维人体姿态估计

目录一技术背景 1 1 人体姿态估计 1 2 三维人体重建 1 4 构建多人场景研究情况二技术方法 2 1 基础架构 2 2 重叠loss 2 3 深度顺序感知loss 四存在的问题与未来研究热点 4 1 本实验方法存在的问题 4
CLIP：Contrastive Language-Image Pre-Training

参考博客 CLIP论文阅读 Learning Transferable Visual Models From Natural Language Supervision CLIP Connecting Text and Images 引言在
使用tf-slim的ResNet V1 152和ResNet V2 152预训练模型进行图像分类

本文使用tf slim的ResNet V1 152和ResNet V2 152预训练模型进行图像分类并研究slim网络的scope命名等 tf slim文档不太多实现过程中多参考官网的源码 https github com tensor
深度神经网络中的Inception模块介绍

深度神经网络 Deep Neural Networks DNN 或深度卷积网络中的Inception模块是由Google的Christian Szegedy等人提出包括Inception v1 Inception v2 Inception
SimSiam：Exploring Simple Siamese Representation Learning

Siamese网络最大化了一个图像的两个增强之间的相似性服从于避免崩溃解的某些条件在本文中 SimSiam即使不使用以下任何一项也可以学习有意义的表示 i 负样本对 ii 大批量 iii 动量编码器我们的实验表明停止梯度stop
CROSSFORMER: A VERSATILE VISION TRANSFORMER BASED ON CROSS-SCALE ATTENTION 论文阅读笔记

CROSSFORMER A VERSATILE VISION TRANSFORMER BASED ON CROSS SCALE ATTENTION 论文阅读笔记这是浙大腾讯哥伦比亚大学一起发表在ICCV的一篇文章文章有三个贡献一是
【论文阅读】learning with noisy correspondence for cross-modal matching ------ 跨模态匹配，噪声对应

注意本博客非逐字逐句翻译论文是作者阅读论文后根据自己的理解所写预知论文详情请参阅论文原文论文标题 Learning with Noisy Correspondence for Cross modal Matching 作者 Zhe

随机推荐

JAVA-- 在Java8 Parallel Stream中如何自定义线程池？

使用Parallel Stream时 xff0c 在适当的环境中 xff0c 通过适当地使用并行度级别 xff0c 可以在某些情况下获得性能提升如果程序创建一个自定义ThreadPool xff0c 必须记住调用它的shutdown 方法
关于C++11静态成员变量的类内初始化

关于C 43 43 11静态成员变量的类内初始化先放测试后得到的结论 xff0c 如下表所示静态成员变量类型是否可以类内初始化static int不可以static const int可以static const float不可以sta
对象存储之SeaweedFS简介及与MinIO的对比

什么是SeaweedFS xff1f SeaweedFS架构 xff1a master service 主服务和Volume service 卷服务一起提供分布式对象存储服务 xff0c 支持用户配置数据的复制和冗余策略可选的File
Paimon: Streaming data lake 数据湖项目的后起之秀

什么是Paimon Paimon的官网介绍是 Streaming data lake platform with high speed data ingestion changelog tracking and efficient real
数据湖Data Lakehouse支持行级更改的策略:COW、MOR、Delete+Insert

COW 写时复制 MOR 读时合并 Delete Insert 保证同一个主键下仅存在一条记录将更新操作转换为Delete操作和Insert操作 COW和MOR的对比如下图而Delete Insert在StarRocks主键模型中用到
JAVA-- 带你重温JAVA NIO中的ZERO COPY 零拷贝

java zero copy介绍 Java零拷贝是一种技术在不经过应用程序的情况下直接将数据从文件或内存映射到套接字从而减少数据拷贝和上下文切换的次数提高数据传输的效率 Java中支持零拷贝的方法 java nio channels
JUnit 5 使用教程及 JUnit 4/5的差异

1 JUnit 5产生的原因 JDK 8在java中带来了迷人的功能最值得注意的是lambda表达式为了适应 Java 8 风格的编码和新的功能特性 JUnit 提供了JUnit 5 2 JUnit 5 架构与 JUnit 4 相比
JAVA-- 带你重温函数式接口、使用Functional Interface最佳实践

1 概念及分类函数式接口 Functional Interface 就是一个有且仅有一个抽象方法但是可以有多个非抽象方法的接口并且这类接口使用了 FunctionalInterface进行注解在jdk8中引入了一个新的包java
如何基于LLMs使用LangChain构建强大的差异化应用--LangChain之初体验

近年来语言模型 LMs 特别是LLMs已经成为最令人兴奋和最有影响力的技术之一它们可以为各种目的生成自然语言文本例如回答问题撰写摘要创建故事等等然而仅使用LMs还不足以构建真正强大且与众不同的应用程序您还需要将LMs连接到
连接局域网下centos服务器和mysql数据库慢优化方法

连接局域网下centos服务器和mysql数据库慢优化方法 Xshell连接centos比较慢优化通过xshell连接服务器需要服务端安装openssl xff0c openssl配置项UseDNS 默认情况是开启状态的 xff0c Us
云技术概念

云计算概念是由Google提出的 xff0c 这是一个美丽的网络应用模式狭义云计算是指IT基础设施的交付和使用模式 xff0c 指通过网络以按需易扩展的方式获得所需的资源 xff1b 广义云计算是指服务的交付和使用模式 xff0c 指通
通过IP地址和子网掩码与运算计算相关地址

通过IP地址和子网掩码与运算计算相关地址知道ip地址和子网掩码后可以算出 xff1a 1 网络地址 2 广播地址 3 地址范围 4 本网有几台主机例1 xff1a 下面例子IP地址为192 168 100 5 子网掩码是255 255
关于VSCode的三个配置文件

关于VSCode的三个配置文件若要使用VSCode来开发C 43 43 程序 xff0c 则应该了解以下三种配置文件 xff0c 分别为 xff1a tasks json xff1a 编译器相关的配置文件比如 xff0c 设置编译指令
用Prime95来做linux下CPU压力测试

Prime95是用来做linux下CPU压力测试的由GIMPS Great Internet Mersenne Prime Search xff09 所提供主要是透过运算找出梅森质数质数 xff08 Prime number xff0
ubuntu修改启动项等待时间、修改启动项顺序、更改启动内核

目录 ubuntu修改启动项等待时间修改启动项顺序更改系统内核版本 ubuntu修改启动项等待时间步骤 sudo vi etc default grub找GRUB TIMEOUT 61 10 那一行 xff0c 把10改为需要的时间即
好电影推荐

今天在网上看到一篇给大家推荐电影的帖子 xff0c 里面搜集了一些欧美电影 xff0c 有悬疑片剧情片动作片恐怖片 xff0c 包括经典的以及一些流传不是很广的 xff0c 在这里收藏一下与大家一起分享 xff1a 1 不请自来典
CodeBlock无编辑器问题解决

对于新手小白来说 xff0c 在使用CodeBlock做C语言或者C 43 43 方面的编写时 xff0c CodeBlock会出现如下情况 xff1a Can 39 t find compiler executable in your c
argparse—使用命令行输入，给变量赋值

import argparse if name 61 61 39 main 39 parser 61 argparse ArgumentParser parser add argument 39 bbb 39 type 61 int def
树莓派keras、TensorFlow环境安装记录

1 安装arm版的TensorFlow xff0c 方法参考 xff1a https github com samjabrahams tensorflow on raspberry pi 2 安装keras sudo apt get ins
inception 论文阅读笔记

inception V1 提出inception unit xff0c 采用多个size的卷积核对输入进行卷积采用1x1 3x3 5x5的卷积核不是必须的 xff0c 而是为了方便可以理解为不同大小的卷积核可以提取到图像中不同大小的特征

inception 论文阅读笔记

inception V1

疑问：

Batch Normalization

inception V3

Inception v4

inception 论文阅读笔记 的相关文章

随机推荐

热门标签

inception 论文阅读笔记的相关文章