【计算机视觉

2023-11-15

一、GreedyNAS-C

GreedyNAS-C 是使用 GreedyNAS 神经架构搜索方法发现的卷积神经网络。 使用的基本构建块是反向残差块(来自 MobileNetV2)和挤压和激励块。

在这里插入图片描述

二、RegionViT

RegionViT 由两个标记化过程组成,将图像转换为区域标记(上方路径)和本地标记(下方路径)。 每个标记化都是具有不同补丁大小的卷积,区域标记的补丁大小为 2 8 2 28^2 282尽管 4 2 4^2 42用于尺寸投影为的本地标记 C C C,这意味着一个区域代币涵盖 7 2 7^2 72基于空间局部性的局部标记,导致局部区域的窗口大小 7 2 7^2 72。 在第 1 阶段,两组令牌通过建议的区域到本地转换器编码器传递。 然而,在后期,为了平衡计算负载并获得不同分辨率的特征图,该方法使用下采样过程将空间分辨率减半,同时在区域和局部标记上将通道尺寸加倍,然后再进入下一个阶段 阶段。 最后,在网络的末端,它简单地平均剩余的区域标记作为分类的最终嵌入,而检测在每个阶段使用所有本地标记,因为它提供了更细粒度的位置信息。 通过金字塔结构,ViT 可以生成多尺度特征,因此可以轻松扩展到更多视觉应用,例如对象检测,而不仅仅是图像分类。

在这里插入图片描述

三、DenseNAS-B

DenseNAS-B 是通过 DenseNAS 神经架构搜索方法发现的移动卷积神经网络。 基本构建块是 MobileNet 架构中的 MBConvs(或反向瓶颈残差)。

在这里插入图片描述

四、DenseNAS-C

DenseNAS-C 是通过 DenseNAS 神经架构搜索方法发现的移动卷积神经网络。 基本构建块是 MobileNet 架构中的 MBConvs(或反向瓶颈残差)。

在这里插入图片描述

五、DiCENet

DiCENet 是一种利用维度卷积(和维度融合)的卷积神经网络架构。 维度卷积在输入张量的每个维度上应用轻量级卷积滤波,而维度融合有效地组合了这些维度表示; 允许网络中的 DiCE 单元有效地编码输入张量中包含的空间和通道信息。

在这里插入图片描述

六、uNetXST

uNet 神经网络架构,采用多个 (X) 张量作为输入并包含空间变换单元 (ST)

在这里插入图片描述

七、CSPPeleeNet

CSPPeleeNet 是一个卷积神经网络和对象检测主干,我们将跨阶段部分网络 (CSPNet) 方法应用于 PeleeNet。 CSPNet 将基础层的特征图划分为两部分,然后通过跨阶段层次结构将它们合并。 使用拆分和合并策略允许更多的梯度流通过网络。

在这里插入图片描述

八、PocketNet

PocketNet 是通过神经架构搜索发现的人脸识别模型系列。 培训基于多步骤知识蒸馏。

在这里插入图片描述

九、OODformer

OODformer 是一种基于 Transformer 的 OOD 检测架构,它利用 Transformer 的上下文化功能。 将转换器作为主要特征提取器可以通过视觉注意来利用对象概念及其区分属性以及它们的共现。

OODformer 采用 ViT 及其数据高效变体 DeiT。 每个编码器层由多头自注意力和多层感知块组成。 编码器中的 MSA 和 MLP 层的组合对属性的重要性、关联相关性和共现进行联合编码。 [class] 标记(图像的代表)通过全局上下文整合多个属性及其相关特征。 最后一层的 [class] 标记以两种方式用于 OOD 检测; 首先,它被传递给用于softmax置信度得分,其次用于潜在空间距离计算。

在这里插入图片描述

十、DeepSIM

DeepSIM 是一种基于单张图像的条件图像处理的生成模型。 网络学习将图像的原始表示映射到图像本身。 在操作时,生成器允许通过修改原始输入表示并通过网络映射它来进行复杂的图像更改。 原始表示的选择会影响操作的简便性和表现力,并且可以是自动的(例如边缘)、手动的或混合的,例如分割顶部的边缘。

在这里插入图片描述

十一、Conditional Position Encoding Vision Transformer(CPVT)

CPVT(条件位置编码视觉变换器)是一种利用条件位置编码的视觉变换器。 除了新的编码之外,它遵循 ViT 和 DeiT 相同的架构。

在这里插入图片描述

十二、ESPNetv2

ESPNetv2 是一种卷积神经网络,它利用组点式和深度式扩张可分离卷积,以更少的 FLOP 和参数从大的有效感受野中学习表示。

在这里插入图片描述

十三、Shuffle Transformer

Shuffle Transformer 模块由 Shuffle Multi-Head Self-Attention 模块 (ShuffleMHSA)、Neighbor-Window Connection 模块 (NWC) 和 MLP 模块组成。 为了引入跨窗口连接,同时保持非重叠窗口的高效计算,提出了一种在连续的 Shuffle Transformer 块中交替使用 WMSA 和 Shuffle-WMSA 的策略。 第一个基于窗口的 Transformer 块使用常规窗口分区策略,第二个基于窗口的 Transformer 块使用基于窗口的自注意力和空间混洗。 此外,每个块中还添加了邻居窗口连接模块(NWC),以增强邻居窗口之间的连接。 因此,所提出的洗牌变压器块可以构建丰富的跨窗口连接并增强表示。 最后,连续的 Shuffle Transformer 块计算如下:

在这里插入图片描述
在这里插入图片描述

十四、ECA-Net

ECA-Net 是一种利用高效通道注意力模块的卷积神经网络。

在这里插入图片描述

十五、CSPDenseNet

CSPDenseNet 是一个卷积神经网络和对象检测主干,我们将跨阶段部分网络 (CSPNet) 方法应用于 DenseNet。 CSPNet 将基础层的特征图划分为两部分,然后通过跨阶段层次结构将它们合并。 使用拆分和合并策略允许更多的梯度流通过网络。

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉 的相关文章

随机推荐

  • Java实现国密算法SM2,SM3,SM4,并且实现ECB和CBC模式

    代码中实现了电码本ECB模式和密文分组连接CBC模式 SM3 java和SM4 java为算法实现类 utils的都是根据实现类写的工具 可以根据需要调用杂凑算法SM3的杂凑功能获得杂凑值 SM4 java中 sm4 crypt ecb S
  • iOS objc_msgSend iOS too many arguments in function call 报错解决方案

    Build Settings gt 搜索 objc gt 设置 Enable Strict Checking of objc msgSend Calls 为 NO
  • [django项目] 利用elasticsearch实现搜索功能

    新闻搜索 I 搜索功能分析 本节我们来完成新闻搜索功能 首先让我们来思考一下 要做一个通过关键词搜索文章的功能 需要搜索哪些字段 以及使用什么技术方案呢 既然我们是准备做新闻博客网站 那我们就可以拿同类型网站的做一下对比 例如CSDN 简书
  • docker系列-搭建本地私有仓库-registry容器的各种坑

    总结的坑 a 关注daemon json的书写格式 一句话可以错好几个点 b tag要清楚的表示registry服务器的信息 才能push上传成功 不是可有可无的信息 c tag中有版本号要清楚的写上 系统自动补全的是用latest 搭建过
  • RPC

    RPC 远程过程调用 是什么 简单的说 RPC就是从一台机器 客户端 上通过参数传递的方式调用另一台机器 服务器 上的一个函数或方法 可以统称为服务 并得到返回的结果 RPC 会隐藏底层的通讯细节 不需要直接处理Socket通讯或Http通
  • 安卓pwn - De1taCTF(BroadcastTest)

    BroadcastTest 背景 逆向APK可知程序中仅有MainActivity Message和三个Receiver类 前者实现了一个Parcelable类 后三个则是广播 其中Receiver1是exported的 接收并向Recei
  • jsts 学习

    性能问题一直困扰了我很长的时间 今天听同事介绍了一个网站 感觉视角开阔了许多 一直做GIS开发 原来不只是java有jts包 原来javascript也有这样的一个包 叫做jsts 这个包的功能跟java里面的jts包差不多 前段提供空间关
  • Linux--信号

    文章目录 信号入门 生活角度的信号 技术应用角度的信号 注意 信号概念 使用kill l命令可以查看系统定义的信号列表 信号处理常见的方式 产生信号 1 通过终端按键产生信号 Core Dump 使用core dump进行事后调试 2 系统
  • How far away ? 【HDU - 2586】【在线LCA算法讲解】

    题目链接 做些LCA的算法 还是很提高代码能力的 这道题就是典型的LCA模板 所以用它来练一下我的LCA算法还是很好的 我们要求的是在一棵树上的任意两点的相互距离 既然在一棵树上 就可以直接调用LCA来解了 我们先任取一根节点 我取的是1
  • Tensorflow高级API

    本文个人博客地址 点击查看 一 Estimator 1 介绍 编程堆栈 Estimator 代表一个完整的模型 Estimator API 提供一些方法来训练模型 判断模型的准确率并生成预测 数据集 构建数据输入管道 Dataset API
  • ORA-01861错误

    ORA 01861 错误一般是日期 字符 数字类型互换时产生的错误 日期型数据有误或者安装Oracle时设置NLS DATE LANGUAGE为美国 或其他国家 也有可能导致ORA 01861错误 因为的日期写法有些不一样 亚洲是 RR M
  • Oracle数据库sql语句处理业务表重复数据取其一

    背景 在日常的工作中 我们会遇见一张表中存在重复的数据 这个重复的数据是指几个字段组成一个唯一索引的 但是因为在加工数据的过程中 会去掉这个唯一索引 但是在迁移到业务表中需要这个唯一索引 或者是业务要求等条件的 如下就演示了如何取其一 如下
  • css滚动条不占用宽度_CSS隐藏滚动条并可以滚动内容的几种方式

    前言 当我们的内容超出了我们的 div 往往会出现滚动条 影响美观 尤其是当我们在做一些导航菜单的时候 滚动条一出现就破坏了 UI 效果 我们不希望出现滚动条 也不希望超出去的内容溢出 就要保留鼠标滚动的效果 我们经常在前端开发中遇到这种情
  • 【华为OD统一考试B卷

    在线OJ 已购买本专栏用户 请私信博主开通账号 在线刷题 运行出现 Runtime Error 0Aborted 请忽略 华为OD统一考试A卷 B卷 新题库说明 2023年5月份 华为官方已经将的 2022 0223Q 1 2 3 4 统一
  • 有关python 输出彩色字符,不按颜色显示的问题

    因工作需要 做了一些小程序 python有助于工作效率 能处理WORD excel等常用办公文件 在小程序中 往往为了提示 做一些提示 但提示一多 个别重要信息就无法起到作用 对于些重要的提示 想加一些颜色显示 找了N多的网站和帖子 大多数
  • 位运算n & (n-1)的妙用

    本文转自 http blog csdn net zheng0518 article details 8882394 按位与的知识 n n 1 作用 将n的二进制表示中的最低位为1的改为0 先看一个简单的例子 n 10100 二进制 则 n
  • 行指针(对二维数组,多维数组的深层理解)

    行指针 定义 对二维数组的理解 多维数组的理解 二维数组 多维数组向函数传递参数 二维数组 三维数组 定义 声明行指针的语法 数据类型 行指针名 行的大小 行的大小即数组长度 int p1 3 p1是行指针 用于指向数组长度为3的int型数
  • 【周末闲谈】文心一言,模仿还是超越?

    个人主页 个人主页 系列专栏 周末闲谈 周末闲谈 第一周 二进制VS三进制 文章目录 周末闲谈 前言 一 背景环境 二 文心一言 三 文心一言的优势 四 文心一言能否为百度止颓 五 总结 前言 经过了一周的忙碌 周末如期而至 今天我们来聊聊
  • 如何写简历,Web前端简历

    面试官到底想看什么样的简历 面试一直是程序员跳槽时期非常热门的话题 虽然现在已经过了跳槽的旺季 下一轮跳槽需要年底才会出现 但是当跳槽季的时候你再看这篇文章可能已经晚了 过冬的粮食永远不是冬天准备的 而是秋收的时候 点个关注 点个收藏 需要
  • 【计算机视觉

    文章目录 一 GreedyNAS C 二 RegionViT 三 DenseNAS B 四 DenseNAS C 五 DiCENet 六 uNetXST 七 CSPPeleeNet 八 PocketNet 九 OODformer 十 Dee