计算机视觉论文精度大纲

2023-10-31

念念不忘,必有回响! 

目录

一、图像分类

1. AlexNet

2. VGGNet

3. GoogleNet_v1

4. GoogleNet_v2_B

5. GoogleNet_v3 

6. ResNet

二、目标检测

1. YOLOv1

2. YOLOv2

三、Transformer(变形金刚)

1.《Attention Is All You Need》

2.《Version Transformer》

3. DETR

 4. Deformable-DETR

5. DINO

6. DN-DETR

7. ACmix

8. Swin Transformer

9. DAB DETR

10. Efficient DETR

11. Sparse R-CNN

四、综述论文

1. Transformers in Vision: A Survey


一、图像分类

1. AlexNet

AlexNet 论文精度,以及解析网络模型结构_Flying Bulldog的博客-CSDN博客《ImageNet Classification with Deep Convolutional Neural Networks》网络模型的名称由来:第一作者的名字 Alex Krizhevsky我们训练了一个大型的深度卷积神经网络,将ImageNet LSVRC - 2010竞赛中120万幅高分辨率图像分类到1000个不同的类中。在测试数据上,我们分别取得了37.5 %和17.0 %的前1位和前5位错误率,明显优于以往的先进水平。该神经网络包含6000万个参数和65万个神经元,由5个卷积层组成,其中部分卷https://blog.csdn.net/qq_54185421/article/details/125356469

2. VGGNet

VGGNet 论文精度,并解析 VGG-16 网络模型结构_Flying Bulldog的博客-CSDN博客_vgg16论文《VERY DEEP CONVOLUTIONAL NETWORKSFOR LARGE-SCALE IMAGE RECOGNITION》所以我们用3个3×3的卷积叠层代替单个7×7的卷积叠层得到了什么?(1)首先,我们用三个非线性校正层(ReLus)代替一个非线性校正层(ReLU),使得决策函数更具区分度。(2)其次,我们减少了参数个数:假设三层3 × 3卷积堆的输入和输出都有C通道,堆栈参数为个权重(3)最后,多个卷积堆叠在一起可以使得模型的深度增加,证明了本文章的结论:深度在视觉表征中的重要性。.https://blog.csdn.net/qq_54185421/article/details/125372642

3. GoogleNet_v1

《Going deeper with convolutions》论文精度,并解析GoogLeNet 网络模型结构_Flying Bulldog的博客-CSDN博客在2014年的ImageNet图像识别挑战赛中,⼀个名叫GoogLeNet 的网络架构⼤放异彩。GoogLeNet吸收了NiN《Network In Network》中串联网络的思想,并在此基础上做了改进。这篇论文的⼀个重点是解决了什么样大小的卷积核最合适的问题。毕竟,以前流⾏的网络使用小到1 × 1,⼤到11 × 11的卷积核。本文的⼀个观点是,有时使用不同大小的卷积核组合是有利的。(全都要!)目录一、引言(1)SOTA(state of the art)(2)Hebbian Principe:neurohttps://blog.csdn.net/qq_54185421/article/details/125386728

4. GoogleNet_v2_B

经典BN很NB,精读论文《Batch Normalization》_Flying Bulldog的博客-CSDN博客首先看摘要和结论,然后分析核心思想,最后总结表格内容和实验细节。训练深度神经网络是一个复杂的事实,在训练过程中每一层的输入分布随着前一层的参数变化而变化。这就需要较低的学习速率和仔细的参数初始化来减缓训练速度,并且使得具有饱和非线性的模型的训练变得非常困难。我们将这一现象称为内部协变量偏移(internal covariateshift),并通过归一化层输入来解决这个问题。我们的方法从将规范化作为模型架构的一部分和对每个训练小批量执行规范化来吸取其优点。Batch Normalization允许我们使用更高https://blog.csdn.net/qq_54185421/article/details/125429533

5. GoogleNet_v3 

论文精读之 Google_v3,以及其相对于 Google_v1 和 Google_v2_BN 的模型比较_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125578079?spm=1001.2014.3001.5502

6. ResNet

ResNet 论文精读 & 残差块的恒等映射 & 网络结构的解析_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125603544?spm=1001.2014.3001.5501

二、目标检测

1. YOLOv1

YOLO系列论文精度 & YOLOv1_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125702679?spm=1001.2014.3001.5502

2. YOLOv2

YOLO系列论文精度 & YOLOv2 and YOLO9000_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125706810

三、Transformer(变形金刚)

1.《Attention Is All You Need》

《Attention Is All You Need》论文精读,并解析Transformer模型结构_Flying Bulldog的博客-CSDN博客建议:结合《Attention Is All You Need》论文观看此文章。Transformer的模型结构如下图所示,通过把“My money don't jiggle jiggle”翻译成“我的钱不摇晃摇晃”来分析Transformer的工作过程。训练过程中,每一次解码器的输出与数据集中的翻译值通过交叉熵计算错误率(一次送入batch_size大小个token,计算错误率),从而对权重进行更新。预测过程,同训练过程相似,即输入英文句子,一个词一个词的翻译成汉语句子。...https://blog.csdn.net/qq_54185421/article/details/125315630

2.《Version Transformer》

《Vision Transformer (ViT)》论文精度,并解析ViT模型结构以及代码实现_Flying Bulldog的博客-CSDN博客论文共有22页,表格和图像很多,网络模型结构解释的很清楚,并且用四个公式展示了模型的计算过程;本文章对其进行精度,并对源码进行剖析,希望读者可以耐心读下去。https://blog.csdn.net/qq_54185421/article/details/125345852

3. DETR

DETR 论文精读,并解析模型结构_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125895528

通过公式和源码解析 DETR 中的损失函数 & 匈牙利算法(二分图匹配)_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125992305?spm=1001.2014.3001.5501

 4. Deformable-DETR

DEFORMABLE DETR 论文精度,并解析网络模型结构_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125902884

5. DINO

DINO 论文精度,并解析其模型结构 & DETR 的变体_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/125949343

6. DN-DETR

DN-DETR 论文精度,并解析其模型结构 & 2022年CVPR论文_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/126011577?spm=1001.2014.3001.5501

7. ACmix

ACmix 论文精读,并解析其模型结构_Flying Bulldog的博客-CSDN博客https://blog.csdn.net/qq_54185421/article/details/126054251?spm=1001.2014.3001.5501

8. Swin Transformer

Swin Transformer 论文精读,并解析其模型结构_Flying Bulldog的博客-CSDN博客icon-default.png?t=M666https://blog.csdn.net/qq_54185421/article/details/126109521

9. DAB DETR

DAB DETR 论文精度,并解析其模型结构_Flying Bulldog的博客-CSDN博客icon-default.png?t=M666https://blog.csdn.net/qq_54185421/article/details/126253547

10. Efficient DETR

Efficient DETR 论文精读_Flying Bulldog的博客-CSDN博客icon-default.png?t=M666https://blog.csdn.net/qq_54185421/article/details/126310445

11. Sparse R-CNN

Sparse R-CNN 论文精读_Flying Bulldog的博客-CSDN博客icon-default.png?t=M666https://blog.csdn.net/qq_54185421/article/details/126324631

四、综述论文

1. Transformers in Vision: A Survey

Transformer 综述 & Transformers in Vision: A Survey_Flying Bulldog的博客-CSDN博客icon-default.png?t=M666https://blog.csdn.net/qq_54185421/article/details/126372938


 

>>>未完待续。。。 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算机视觉论文精度大纲 的相关文章

随机推荐

  • 完美的mysql备份脚本

    转自 https www cnblogs com leffss p 7832047 html bin bash 全备方式 一般在从机上执行 适用于小中型mysql数据库 删除15天以前备份 作者 fafu li 时间 2015 08 10
  • 【全栈开发指南】OAuth2授权获取token调试接口的方式

    在我们实际应用接口的调用调试过程中 需要用到token或者刷新token GitEgg支持OAuth2 0协议进行认证授权 这里介绍说明如何通过Postman获取token和refresh token并进行接口调试 1 使用密码模式获取to
  • win10禁用windows更新

    Windows 10系统中有一项Update Orchestrator Service 更新协调器办事 在当地办事窗口中 我们发现 Update Orchestrator Service 状态的启动类型为灰色 无法进行点击修改 2 禁用Wi
  • ESB产品Oracle数据库升级说明

    ESB企业服务总线平台作为支撑企业综合集成的产品 在应用集成 数据集成 数据治理等解决方案都发挥着非常重要的作用 随着产品和解决方案的不断优化和升级 ESB企业服务总线平台功能需要逐步进行完善 不断提升产品功能的完备性 易用性和全面性 为了
  • 类和对象

    面向对象 类和对象 数据存储方面 变量 只能存储一个 如果内容多了 存储起来需要定义n个变量 麻烦 数组 可以存储一组相同数据类型的数据 数据类型相同 如果用数组存储一个人的信息 比较丰富的信息的话 不太方便 例如 吃货联盟中存储订单和菜品
  • Flowable-ui-modeler和MybatisPlus冲突问题

    启动出现报错 file F code test flowable boot target classes com example flowableboot flowable mapper ProcessModelMapper class r
  • 目录功能详解

    bin usr bin usr local bin 是Binary的缩写 这个目录存放着最经常使用的命令 sbin usr sbin usr local sbin s就是Super User的意思 这里存放的是系统管理员使用的系统管理程序
  • SpringBoot配置多个Redis集群数据源+自定义缓存注解实例

    今天找了半天没找到线程的 网上都是多个Redis示例 最还还是自己想办法实现了 两个Redis集群作为数据源 自定义缓存注解 不会做的是否发现好tm难 都不知道怎么动手 做完之后 发现原理其实特别简单 很容易就能实现 分两部分原理和示例代码
  • 使用pycharm传入初始化环境配置参数(Run configuration)

    在run gt edit configurations 选择项目并填写参数
  • td 字典表_字典表设计

    为什么字典表 存在问题 某些变量在多个地方使用 而且一般是固定的 但是随着系统升级和后期变化 可能需要改变 如果这些变量写死在代码里面将会变得难以维护 所以要将其从代码中抽离出来 一般的业务系统客户端与用户交互的时候都会使用下拉框组件 对于
  • day2作业

    1 列举出3种常见的操作系统 答 操作系统 windows ubuntu MacOS 其内核 windowsNT Linux uniux 2 简述Ubuntu和Linux的关系 答 Ubuntu 乌班图 是一个以桌面应用为主的Linux操作
  • 数据结构C语言版——初始化一个线性表

    问题描述 初始化一个线性表 程序代码 include stdio h include stdlib h define OVERFLOW 0 define OK 1 define LIST INIT SIZE 100 define LISTI
  • bomblab实验-bomb1~6and隐藏关

    bomb1 08048ae0
  • Spring之Bean的生命周期

    文章目录 BeanFactory 中 Bean的生命周期 测试代码 结论 ApplicationContext中 Bean的生命周期 BeanFactory 中 Bean的生命周期 带 的表示为容需要实现的接口 不带星号的表示是bean要实
  • Python 第10章课后习题参考答案

    第10章课后习题参考答案 一 单项选择题 以下关于Python内置库 标准库和第三方库的描述 正确的是 A 第三方库需要单独安装才能使用 B 内置库里的函数不需要 import 就可以调用 C 第三方库有三种安装方式 最常用的是 pip 工
  • 【IntellJ IDEA】idea上所有代码都报错了

    可能会碰到蓝屏 内存溢出重启idea等特殊情况 重新打开idea后发现原本的代码全都报错了 正确的解决方法 方法很简单 执行idea工具栏上下面的菜单 File gt Invalidate Caches Restart 重置下缓存就可解决该
  • Samba服务的介绍,安装和使用

    一 samba概述 Samba是在Linux和UNIX系统上实现SMB协议的一个免费软件 由服务器及客户端程序构成 SMB Server Messages Block 信息服务块 是一种在局域网上共享文件和打印机的一种通信协议 SMB协议是
  • (二)Qt实现自定义控件的两种方式---插件法

    系列文章目录 一 Qt实现自定义控件的两种方式 提升法 二 Qt实现自定义控件的两种方式 插件法 文章目录 系列文章目录 前言 一 Qt自定义控件的制作 完整代码 二 QtCreator使用DLL文件 问题解决 总结 前言 上一篇文章提到了
  • Cordic角度旋转算法高位宽输入实现DDS的一些思考

    Cordic角度旋转算法简介 在DDS内 Cordic算法相当于替代Rom的一种相幅映射算法 算法通过计算单位圆上点的X坐标和Y坐标 得到角度 的正弦和余弦值 从一个正弦和余弦已知的初始角度开始 通过多次旋转一系列固定角度来获得所需点的坐标
  • 计算机视觉论文精度大纲

    念念不忘 必有回响 目录 一 图像分类 1 AlexNet 2 VGGNet 3 GoogleNet v1 4 GoogleNet v2 B 5 GoogleNet v3 6 ResNet 二 目标检测 1 YOLOv1 2 YOLOv2