【计算机视觉

2023-11-12

一、MnasNet

MnasNet 是一种针对移动设备优化的卷积神经网络,是通过移动神经架构搜索发现的,它明确地将模型延迟纳入主要目标,以便搜索可以识别在准确性和延迟之间实现良好权衡的模型。 主要构建块是反转残差块(来自 MobileNetV2)。

在这里插入图片描述

二、GhostNet

GhostNet 是一种使用 Ghost 模块构建的卷积神经网络,旨在通过使用更少的参数生成更多的特征(从而提高效率)。

GhostNet主要由一堆Ghost瓶颈组成,以Ghost模块为构建块。 第一层是具有 16 个滤波器的标准卷积层,然后是一系列通道逐渐增加的 Ghost 瓶颈。 这些 Ghost 瓶颈根据其输入特征图的大小分为不同的阶段。 所有 Ghost 瓶颈均采用 stride=1,但每个阶段的最后一个瓶颈均采用 stride=2。 最后利用全局平均池化和卷积层将特征图转换为1280维特征向量以进行最终分类。 挤压和激励(SE)模块也应用于一些幽灵瓶颈中的残留层。

与 MobileNetV3 相比,GhostNet 由于延迟较大而没有使用 Hard-swish 非线性函数。

在这里插入图片描述

三、Compact Convolutional Transformers(CCT)

紧凑卷积变压器利用序列池并用卷积嵌入替换补丁嵌入,从而实现更好的归纳偏差并使位置嵌入成为可选。 CCT 比 ViT-Lite(较小的 ViT)实现了更好的精度,并增加了输入参数的灵活性。

在这里插入图片描述

四、NesT

NesT 堆叠规范的 Transformer 层,对每个图像块独立进行局部自注意力,然后分层“嵌套”它们。 空间相邻块之间的处理信息的耦合是通过每两个层次结构之间所提出的块聚合来实现的。 整体的层次结构可以由两个关键的超参数决定:补丁大小和块层次结构的数量。 每个层次结构内的所有块共享一组参数。 给定图像输入,每个图像都线性投影到嵌入。 所有嵌入都被划分为块并展平以生成最终输入。 每个 Transformer 层均由多头自关注 (MSA) 层组成,后跟具有跳跃连接和层归一化功能的前馈全连接网络 (FFN)。 添加位置嵌入以在馈入块之前对空间信息进行编码。 最后,构建了一个具有块聚合的嵌套层次结构——每四个空间连接的块合并为一个。

在这里插入图片描述

五、Res2Net

Res2Net 是一种采用瓶颈残差块变体的图像模型。 动机是能够表示多个尺度的特征。 这是通过一种新颖的 CNN 构建块实现的,该构建块在单个残差块内构建分层的类残差连接。 这代表了粒度级别的多尺度特征,并增加了每个网络层的感受野范围。

在这里插入图片描述

六、EfficientNetV2

EfficientNetV2是一类卷积神经网络,与之前的模型相比,具有更快的训练速度和更好的参数效率。 为了开发这些模型,作者结合了训练感知神经架构搜索和缩放,以共同优化训练速度。 这些模型是从富含新操作(例如 Fused-MBConv)的搜索空间中搜索的。

从架构上来说,主要区别是:

EfficientNetV2 在早期层中广泛使用 MBConv 和新添加的 fused-MBConv。
EfficientNetV2 更喜欢 MBConv 的较小扩展比,因为较小的扩展比往往具有较少的内存访问开销。
EfficientNetV2 更喜欢较小的 3x3 内核尺寸,但它增加了更多层来补偿较小内核尺寸导致的感受野减小。
EfficientNetV2 完全删除了原始 EfficientNet 中的最后一个 stride-1 阶段,这可能是由于其较大的参数大小和内存访问开销。

在这里插入图片描述

七、Capsule Network

胶囊网络是一种机器学习系统,是一种人工神经网络,可用于更好地建模层次关系。 该方法试图更接近地模仿生物神经组织。

在这里插入图片描述

八、Pyramid Vision Transformer

PVT(金字塔视觉变压器)是一种视觉变压器,利用金字塔结构使其成为密集预测任务的有效骨干。 具体来说,它允许使用更细粒度的输入(每个补丁 4 x 4 像素),同时随着 Transformer 的加深而缩小其序列长度,从而降低计算成本。 此外,空间减少注意(SRA)层用于进一步减少学习高分辨率特征时的资源消耗。

整个模型分为四个阶段,每个阶段由一个补丁嵌入层和一个层 Transformer 编码器。 按照金字塔结构,四个阶段的输出分辨率从高(4 步幅)逐渐缩小到低(32 步幅)。

在这里插入图片描述

九、Dual Path Network(DPN)

双路径网络(DPN)是一种卷积神经网络,它在内部呈现出一种新的连接路径拓扑。 直觉是 ResNets 支持特征重用,而 DenseNet 支持新特征探索,两者对于学习良好的表示都很重要。 为了享受两种路径拓扑的优势,双路径网络共享通用功能,同时保持通过双路径架构探索新功能的灵活性。

我们制定这样的双路径架构如下:

在这里插入图片描述
在这里插入图片描述

十、Dense Prediction Transformer(DPT)

密集预测变压器(DPT)是一种用于密集预测任务的视觉变压器。

通过提取非重叠斑块,然后对其展平表示(DPT-Base 和 DPT-Large)进行线性投影,或者通过应用 ResNet-50 特征提取器(DPT-Hybrid),将输入图像转换为标记(橙色)。 图像嵌入通过位置嵌入得到增强,并添加了与补丁无关的读出标记(红色)。 令牌通过多个变压器阶段。 令牌从不同阶段重新组装成多种分辨率的类似图像的表示(绿色)。 融合模块(紫色)逐步融合和上采样表示以生成细粒度的预测。

在这里插入图片描述

十一、Inception v2

Inception v2 是第二代 Inception 卷积神经网络架构,特别使用批量归一化。 由于批量标准化的好处,其他更改包括删除 dropout 和删除本地响应标准化。

在这里插入图片描述

十二、Inception-ResNet-v2

Inception-ResNet-v2 是一种卷积神经架构,它建立在 Inception 系列架构的基础上,但合并了残差连接(取代了 Inception 架构的滤波器级联阶段)。

在这里插入图片描述

十三、RegNetY

在这里插入图片描述
对于 RegNetY,我们做了一项更改,即包含挤压和激励模块。

在这里插入图片描述

十四、CheXNet

CheXNet 是一个在 ChestX-ray14 上训练的 121 层 DenseNet,用于肺炎检测。

在这里插入图片描述

十五、R(2+1)D

R(2+1)D 卷积神经网络是一种用于动作识别的网络,它在 ResNet 启发的架构中采用 R(2+1)D 卷积。 与常规 3D 卷积相比,使用这些卷积可以降低计算复杂性,防止过度拟合,并引入更多非线性,从而可以对更好的函数关系进行建模。

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉 的相关文章

随机推荐

  • 网络带宽单位转换 — MB/s、Mb/s、Mbps、Mbit/s、Kbps

    1 bit s 和 bps 的区别 bit s 和 bps 都是一样的意思 bit per second 2 KB s 和 Kb s 的区别 大写 B 和小写 b KB s 和 Kb s 的意思不一样 KB s 中的 大 B 表示 Byte
  • 通配符的应用

    我们使用通配符描述切入点 主要的目的就是简化之前的配置 具体都有哪些通配符可以使用 单个独立的任意符号 可以独立出现 也可以作为前缀或者后缀的匹配符出现 execution public com itheima UserService fi
  • Wireshark 解密https 数据

    默认情况下 wireshark 抓到的https 数据包都是加密后的 无法展示明文内容 方式一 SSLKEYLOGFILE 变量方式 推荐 适用各种情况 配置环境变量 浏览器在访问https 站点的时候会检测这个SSLKEYLOGFILE
  • java反射field.setAccessible()方法作用

    Accessable属性是继承自AccessibleObject 类 功能是启用或禁用安全检查 JDK API中的解释 引用AccessibleObject 类是 Field Method 和 Constructor 对象的基类 它提供了将
  • CSAPP习题思考(位操作)

    CSAPP习题思考 位操作 现在发现写技术方面的文章真是不容易 不像写随感文 随便热血一下两三个小时就出来了 这篇文章至少用了5 6个小时 但依然感觉没写到位 很多想说的却写不出来 想和说 写 是两种境界 所以每次看pongba洋洋散散五六
  • 开发人员的绝佳生产力工具

    介绍 从长远来看 每天工作 8 小时对您没有帮助 但利用这些来最大化产出肯定会让您受益 这就是为什么生产力是最重要的事情之一 今天 我们将学习一些很棒的工具 它们可以提高您的工作效率 除非并且直到您将这些工具集成到您的工作流程中 否则了解这
  • 宋浩线性代数笔记(七)线性空间

    完结撒花 致此该系列数一的内容也全部更完 本帖为宋浩老师基础课笔记的最后一期 后期会出一些课本经典例题 知识串联 抑或宋浩老师考研强化的重点 敬请期待下一些列
  • Java21天打卡Day6-switch

    import java util Scanner public class Day6 switch case语句 题目 输入一个号码 判断该号码 是1就是一等奖 2是二等奖 3是三等奖 其他的阳光普照奖 public static void
  • vue中使用swiper-slide时,循环轮播失效?

    前言 vue 项目中使用时 组件swiper slide 如果用v for循环的话 loop true 就不能无缝轮播 每次轮播到最后一张就停止了 正文 代码如下
  • java 判断用户是否关注了公众号

    1 获取token public String getToken try HttpClient client HttpClients createDefault String tokenUrl MessageFormat format ht
  • 有关NodeBB从低版本1.7.x升级到最新的1.16.x版本

    有关NodeBB升级历险记 公司线上的论坛网站一直都是1 7 4版本 而且有不少地方感觉用起来不是很顺手 就想着应该给它升升级了 从1 7 4升级到最新的1 16 x版本 注 不要直接跨版本升级到最高版本 会有数据错乱的问题 升级实操 备份
  • js中对象数组根据对象id分组并转map

    js中对象数组根据对象id分组并转map 如果要将具有相同 id 属性的对象元素 分成不同的数组 可以先从对象数组中提取相同的 id 属性 再使用 Array reduce 和 Map 来进行对象数组的分类 具体实现 对象数组根据id分组并
  • 计算机停电自行启动,电脑自动断电,详细教您电脑开机自动断电怎么解决

    有时候电脑玩着玩着 突然断电关机了 正玩的很激情 突然电脑断电关机了 都恨不得把电脑砸了 一旦出现电脑开机后断电的情况 让我们习惯从软件下手的同学们来说 有点无从下手 下面 小编跟大伙一同探讨一下电脑开机自动断电的解决方法 说到电脑启动过程
  • 请用C语言写一个15*15的扫雷小游戏

    扫雷是一个非常有趣的游戏 可以使用 C 语言编写 下面是一个简单的扫雷代码示例 include
  • C++ 排序函数 sort(),qsort()的用法

    C库函数qsort C 库函数sort 其中qsort相对较慢 sort实现非常高效 qsort 功 能 使用 快速排序例程进行排序 头文件 include
  • 锐浪报表-实现导入导出

    锐浪报表 实现导入导出 实现思路 代码实现 实现思路 导入导出实现思路 我们使用锐浪报表自带的导出功能导出 XX grf 后 鼠标右键是可以像编辑文本一样编辑内容的 由此联想到 用记事本手写一个模板改一下后缀名是不是也可以当作报表模板 答案
  • 好消息:vue3.3发布了,来看看更新那些功能

    前言 vue3 3发布了 来看看更新那些功能 原英文地址 Announcing Vue 3 3 The Vue PointThe offical blog for the Vue js projecthttps blog vuejs org
  • 2023年完整版Java学习路线图

    目录 第一阶段 Java核心基础 第二阶段 数据库核心技术 第三阶段 Java Web内容 第四阶段 企业级框架讲解 第五阶段 分布式微服务架构 第六阶段 技能深入提升 第七阶段 企业级项目实战 Java学习路线图 以下是我为您提供的原创J
  • NOIP学习之顺序查找:145.找最大数序列

    测试链接 总时间限制 1000ms 内存限制 65536kB 描述 输入n行 每行不超过100个无符号整数 无符号数不超过4位 请输出最大整数以及最大整数所在的行号 行号从1开始 如果该数据在多个行中出现 则按从小到大输出相应行号 行号之间
  • 【计算机视觉

    文章目录 一 MnasNet 二 GhostNet 三 Compact Convolutional Transformers CCT 四 NesT 五 Res2Net 六 EfficientNetV2 七 Capsule Network 八