卷积神经网络中用1*1 卷积有什么作用或者好处呢?

2023-12-05

一、来源:[1312.4400] Network In Network (如果1×1卷积核接在普通的卷积层后面,配合激活函数,即可实现network in network的结构)

二、应用:GoogleNet中的Inception、ResNet中的残差模块

三、作用:

1、降维(减少参数)

例子1 : GoogleNet中的3a模块

输入的feature map是28×28×192

1×1卷积通道为64

3×3卷积通道为128

5×5卷积通道为32

左图卷积核参数:192 × (1×1×64) +192 × (3×3×128) + 192 × (5×5×32) = 387072

右图对3×3和5×5卷积层前分别加入了通道数为96和16的1×1卷积层,这样卷积核参数就变成了:

192 × (1×1×64) +(192×1×1×96+ 96 × 3×3×128)+(192×1×1×16+16×5×5×32)= 157184

同时在并行pooling层后面加入1×1卷积层后也可以降低输出的feature map数量 (feature map尺寸指W、H是共享权值的sliding window,feature map 的数量就是channels)

左图feature map数量:64 + 128 + 32 + 192(pooling后feature map不变) = 416 (如果每个模块都这样,网络的输出会越来越大)

右图feature map数量:64 + 128 + 32 + 32(pooling后面加了通道为32的1×1卷积) = 256

GoogLeNet利用1×1的卷积降维后,得到了更为紧凑的网络结构,虽然总共有22层,但是参数数量却只是8层的AlexNet的十二分之一(当然也有很大一部分原因是去掉了全连接层)

例子2:ResNet中的残差模块

假设上一层的feature map是w*h*256,并且最后要输出的是256个feature map

左侧操作数:w*h*256*3*3*256 =589824*w*h

右侧操作数:w*h*256*1*1*64 + w*h*64*3*3*64 +w*h*64*1*1*256 = 69632*w*h,,左侧参数大概是右侧的8.5倍。(实现降维,减少参数)

2、升维(用最少的参数拓宽网络channal)

例子: 上一个例子中,不仅在输入处有一个1*1卷积核,在输出处也有一个卷积核,3*3,64的卷积核的channel是64,只需添加一个1*1,256的卷积核,只用64*256个参数就能把网络channel从64拓宽四倍到256。

3、跨通道信息交互(channal 的变换)

例子: 使用1*1卷积核,实现降维和升维的操作其实就是channel间信息的线性组合变化,3*3,64channels的卷积核后面添加一个1*1,28channels的卷积核,就变成了3*3,28channels的卷积核,原来的64个channels就可以理解为跨通道线性组合变成了28channels,这就是通道间的信息交互。

注意:只是在channel维度上做线性组合,W和H上是共享权值的sliding window

4、增加非线性特性

1*1卷积核,可以在保持feature map尺度不变的(即不损失分辨率)的前提下大幅增加非线性特性(利用后接的非线性激活函数),把网络做的很deep。

备注: 一个filter对应卷积后得到一个feature map,不同的filter(不同的weight和bias),卷积以后得到不同的feature map,提取不同的特征,得到对应的specialized neuro。

四、从fully-connected layers的角度来理解1*1卷积核

将其看成全连接层

左边6个神经元,分别是a1—a6,通过全连接之后变成5个,分别是b1—b5

左边6个神经元相当于输入特征里面的channels:6

右边5个神经元相当于1*1卷积之后的新的特征channels:5

左边 W*H*6 经过 1*1*5的卷积核就能实现全连接。

In Convolutional Nets, there is no such thing as “fully-connected layers”. There are only convolution layers with 1x1 convolution kernels and a full connection table– Yann LeCun

参考:https://iamaaditya.github.io/2016/03/one-by-one-convolution/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

卷积神经网络中用1*1 卷积有什么作用或者好处呢? 的相关文章

  • 【更新公告】Airtest更新至1.3.2版本

    本次更新为Airtest库更新 版本提升至1 3 2版本 主要是 ADB版本升级到41版本 以及其它的一些小功能更新 更新详情如下 功能更新及bug修复 1 ADB升级至41版本 在Airtest1 3 2版本之前 我们库里面的ADB一直都
  • 【电子学会】2023年09月Python三级试卷

    青少年软件编程 Python 等级考试试卷 三级 分数 100 题数 38 一 单选题 共25题 每题2分 共50分 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15
  • MQ - KAFKA 高级篇

    kafak是一个分布式流处理平台 提供消息持久化 基于发布 订阅的方式的消息中间件 同时通过消费端配置相同的groupId支持点对点通信 适用场景 构造实时流数据管道 用于系统或应用之间可靠的消息传输 数据采集及处理 例如连接到一个数据库系
  • 基于SSM+VUE实现毕业设计流程管理系统

    作者简介 Java领域优质创作者 CSDN博客专家 CSDN内容合伙人 掘金特邀作者 阿里云博客专家 51CTO特邀作者 多年架构师设计经验 腾讯课堂常驻讲师 主要内容 Java项目 Python项目 前端项目 人工智能与大数据 简历模板
  • 初识哈夫曼编码

    1 什么是哈夫曼编码 1 什么是编码 编码就是把一些信息比如文字文件 视频文件转成0101的一堆数字存储起来 这些数字就是编码 它们需要满足数字与字符的一一对应关系 当然还必须满足可以由这一堆数字转回到文件信息 这样的编码才是有意义的 2

随机推荐

  • FFmpeg在Centos服务器上离线安装(包含所需依赖)并实现拉取rtsp流与推送至rtmp服务器

    场景 Windows上使用FFmpeg实现rtsp视频流推流到RTMP流媒体服务器 EasyCVR流媒体服务器 Windows上使用FFmpeg实现rtsp视频流推流到RTMP流媒体服务器 EasyCVR流媒体服务器 rtsp 转流 CSD
  • Vue框架学习笔记——列表渲染:v-for

    文章目录 前文提要 代码正文 前文提要 本人仅做个人学习记录 如有错误 请多包涵 主要学习链接 尚硅谷Vue2 0 Vue3 0全套教程丨vuejs从入门到精通 代码正文 div ul li p name p age li ul div
  • 【MyBatisPlus】MyBatisPlus之id生成策略的方法

    MyBatisPlus之id生成策略的方法 在使用MyBatisPlus框架进行开发时 我们通常需要为实体类设计主键的生成策略 MyBatisPlus提供了多种主键生成策略 本文将介绍这些策略的用法 雪花算法策略 雪花算法是Twitter公
  • Qt designer中使用QSplitter创建推拉窗口,类似 Cobalt Strike 中主界面上下推拉的窗口

    参考链接 Qt designer中使用QSplitter创建推拉窗口 qt designer splitter CSDN博客 Qt Designer中如何添加QSplitter qtdesigner splitter CSDN博客 QSpl
  • 陶瓷材料硬度怎么测量?-科学指南针

    硬度是衡量材料力学性能的一 项重要指标 它是指物体抵抗外力进入其中的能力 即由于其他物体给与的外力与物体的形变尺寸之间的关系 陶瓷材料作为无机非金属材料的一个重要 类 取得了很大的发展 结构陶瓷以其高机械强度 高硬度 耐腐蚀性等忧点被广泛用
  • 基于java中SSM框架实现图书管理系统的设计演示【附项目源码+论文说明】

    基于java中SSM框架实现图书管理系统的设计演示 摘要 随着科学技术的飞速发展 社会的方方面面 各行各业都在努力与现代的先进技术接轨 通过科技手段来提高自身的优势 羽毛球馆场地管理当然也不能排除在外 基于web的图书管理系统是以实际运用为
  • SQL语句大全—解决方案

    1 用order by select top 30 recid from A order by ricid 如果该字段不是自增长 就会出现问题 2 在那个子查询中也加条件 select top 30 recid from A where r
  • 陶瓷材料检测项目及标准-科学指南针

    陶瓷原材料是用纯天然或生成化学物质历经成型和高溫煅烧做成的一类无机非金属原材料 它具备高溶点 高韧性 高耐磨性能 耐空气氧化等优势 可作为构造原材料 刀具材质 因为陶瓷还具备一些独特的性能 又可做为新型功能材料 各检测组织针对陶瓷检测的新项
  • 8年测试老鸟从业心得:软件测试员最核心的竞争力究竟是什么?

    无论从事哪一个行业 核心竞争力都是绕不开的一个话题 提高核心竞争力是我们一生中的重要课题 它保障了我们不会被替代 即在竞争中别人都争不过你 只有你才做得到的某种能力 对于测试员而言 究竟何为这个岗位的核心竞争力 对于初入职场的我而言 着实困
  • 测试管理岗位的技能提升及管理应用有哪些?

    是否需要选择管理岗 建议 如果个人有机会成为管理岗 那就抓紧了 原因很简单 我认为市场的行业发展是这个样子的 专业化的技术人员一定是市场缺失的人才 但是相比较而言 管理者会更加被公司需要 同时 管理岗会让你在这个行业持续更长时间 薪资也相对
  • Docker 一些设置

    一 时间设置 如果容器已经运行了 docker exec it 容器名或id bash mkdir p usr share zoneinfo Asia exit docker cp usr share zoneinfo Asia Shang
  • APP测试设计要点

    app的安装与升级 升级中用户数据 设置 状态的保留 特别注意新版本已去掉的状态或设置 是否可以隔开版本覆盖安装 是否可以覆盖安装更低版本 卸载安装 安装目录清理 SD卡存储数据不被清理 在没有更新或网络时 需要给予用户正确的信息表达 如果
  • 你会使用图片格式转换工具免费方法吗?教你转换格式吧

    前两天在网上看见一个聊天记录 是一个博主小A发的和老板的对话 小A 老板 这是你让我制作的我们产品的动图 你看看可以吗 发送了一张GIF 老板 不错不错 这次做的很好看 下周一我们开会的时候要用到这个图片 你记得把它打印出来 到时候给我一份
  • 高效整理文件的技巧和方法

    在日常生活和工作中 我们经常需要处理大量的文件 包括文档 图片 视频等 如果不能有效地整理这些文件 不仅会浪费大量的时间和精力 还可能导致重要文件的丢失或难以找到 因此 掌握一些整理文件的技巧方法是非常必要的 本文将介绍一些高效整理文件的技
  • 《VirtualLab Fusion物理光学实验教程》好书分享

    目录 第一章 物理光学概念介绍 6 1 1 几何光学和光线追迹 6 1 2 物理光学和光场追迹 6 1 3 电场 磁场以及坡印廷矢量 8 1 4 振幅 相位及实部和虚部 9 1 5 振幅 相位与偏振 10 1 6菲涅尔公式 11 1 7 全
  • Nginx配置文件全解析【深度剖析细节】

    简介 Nginx就是一个高性能的Web服务器和反向代理服务器 它可以处理大量的并发连接 支持高速缓存 负载均衡 SSL TLS终止 HTTP 2协议等功能 本篇主要讲述nginx的核心配置以及配置分析和优化 能够应用到你企业生产中为目的 基
  • 被确诊为“不适合保研”了……

    写在前面 伴随着 读研热 同辈压力 内卷 焦虑也成为了我们这一代人中的热词 作为同年级里的佼佼者 大多数保研er们无时无刻都不紧绷着心里的那根弦 可能在那些为了大创辗转反侧 为了绩点不停刷夜 为了论文焦头烂额的时候 保研er也许会犹豫 自己
  • MQ - 消息系统

    消息系统 1 消息系统的演变 在大型系统中 会需要和很多子系统做交互 也需要消息传递 在诸如此类系统中 你会找到源系统 消息发送方 和 目的系统 消息接收方 为了在这样的消息系统中传输数据 你需要有合适的数据管道 如下 这种数据的交互看起来
  • Mover Creator 用户界面

    1 开始 对话框 首次打开 Mover Creator 时 出现的第一个页面是 开始 对话框 如下所示 从这里开始 用户可以选择开始设计飞机 武器或发动机 在上述每种情况下 用户都可以创建新模型或编辑现有模型 1 1 新建模型 如果用户选择
  • 卷积神经网络中用1*1 卷积有什么作用或者好处呢?

    一 来源 1312 4400 Network In Network 如果1 1卷积核接在普通的卷积层后面 配合激活函数 即可实现network in network的结构 二 应用 GoogleNet中的Inception ResNet中的