从注意力机制到Vison Transformer

2023-11-18

原视频链接：

https://www.bilibili.com/video/BV1Jh411Y7WQ/?spm_id_from=333.788&vd_source=f04f16dd6fd058b8328c67a3e064abd5

https://www.bilibili.com/video/BV1264y1i7R1/?spm_id_from=333.999.0.0&vd_source=f04f16dd6fd058b8328c67a3e064abd5

注意力机制 Attention

*此处query是一个值

非参注意力池化层

核回归 kernel regression

K()是衡量x与xi之间距离的函数

怎么说呢，可能有点像k近邻

引入可学习的w

总结

注意力分数

此处query是一个向量

高维度

x和xi变成了q和ki

加性attention

key和value可以是任意长度，可以长得不一样

点积attention

key和value长度一样，直接进行一个内积

对长度没那么敏感

结果：对每个key（n个）都能得到一个长度为1的向量，得到n*1矩阵

总结

seq2seq

key和value是在编码中对每一个编码rnn的输出

Vision Transformer

Embedding层

Linear Projection of Flattened Patches（嵌入层）

默认使用1d的embedding↓

每一个位置的位置编码与其他位置上的位置编码求一个余弦相似度↓

Encoder

作用：将图片格式[H, W, C]转化为Transformer输入格式[num_token, token_dim]。

Transformer Encoder 就是把encoder堆叠L次

Encoder Block↓

MLPhead 层

最终用于分类的层结构

一些参数

hybrid混合模型

用传统卷积网络提取特征，最后用vit模型获得最后的结果

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

1500深度学习笔记

深度学习

Powered by 金山文档

从注意力机制到Vison Transformer 的相关文章

基于内容的视频信息检索系统

基于内容的视频信息检索系统汪志强江西财经大学信息管理学院 09信息管理与信息系统2班摘要本文从基于内容的视频信息检索技术的发展历史出发对基于内容的视频检索系统的技术要点及主要的功能模块进行了讨论和分析并说明了当今技术存在的缺陷
MFC Windows 程序设计(一)-程序员的解放

MFC Windows 程序设计一程序员的解放程序之美很久很久以前程序员是一个很辛苦的工作因为那时候大多数的软件都是用C语言编写的 Microsoft Visual Basic还没有出现更不要说现在的Java Android

随机推荐

Tomcat修改默认端口号

1 背景在默认情况下 tomcat的端口是8080 使用了两个tomcat 那么就需要修改其中的一个的端口号才能使得两个同时工作 2 方法 2 1改动一那么如何修改tomcat的端口号呢首先到安装目录或者解压目录下找到conf文
VUE之Echarts图表x轴y轴提示文字过长处理为省略号

只需对显示文字格式修改即可 yAxis type category axisLine show false 轴线 axisTick show false 去除刻度 axisLabel formatter function params co
silk lobe资源公众号_资源合集

11 月十一月 iOS内置韩文字体 Apple SD Gothic Neo 锤子黑 Smartisan 与方正合作定制的UI黑体 Emoji 鸽了好久的可爱 Emoji 字体移植到安卓手机沙扬娜拉岩田仿宋复古聚珍仿宋风格返璞归
chatgpt赋能python：Python如何优化中文SEO

Python如何优化中文SEO Python 作为一种流行的编程语言可以用来开发各种不同的应用程序当涉及到网络营销和搜索引擎优化 SEO 时 Python的功能也非常有用在本篇文章中我们将介绍如何使用Python来优化中文SEO 以
opencv显示对比

在opencv中我们一般都要展示处理前后图像的对比有时候我们会imshow两次来展示两张图片那为什么我们不放在一个图片里呢这样显然是更加优雅的模式上代码 Mat combineImage Mat before Mat after a
Go语言实现Onvif客户端：4、配置网络信息

Go语言实现Onvif客户端 4 配置网络信息文章目录 Go语言实现Onvif客户端 4 配置网络信息 1 思路 2 代码上一节获取到网络接口token后就可进行一些网络配置了这里我们暂时只实现进行ip地址的配置接口和封装 1 思路
【SpringCloud】pom.xml文件解析

本文档为本人学习交流所用参考原文档 https www cnblogs com hoyong articles 13034270 html 1 pom xml是什么 pom是Project Object Model 项目对象模型的缩写
虚表

虚表虚函数表 C 中一个类存在虚函数那么编译器就会为这个类生成一个虚函数表在虚函数表里存放的是这个类所有虚函数的地址虚表从属于类编译器会为包含虚函数的类加上一个成员变量该成员变量是一个指向虚函数表的指针因此虚表指针是一个成员
UE4安卓打包配置（大陆内网络整顿后，Android打包时AndroidWorks无法使用的解决方法）

由于国内进行了网络整顿 UE4官网上用CodeWorksforAndroid下载安卓打包工具配置的方法已经不能使用了开了VPN也链接不上这使得用UE4打包配置安卓游戏变得非常麻烦博主捣鼓了好几天才打包成功深感在中国学习UE4的艰难与
力扣-图解算法数据结构-剑指 Offer 05. 替换空格

题目要求力扣题解代码 program mydemo description 剑指 Offer 05 替换空格 author Mr zeng create 2021 03 05 11 04 public class Solution1 p
@escook/request-miniprogram基于 Promise 的小程序网路请求库

安装 npm install escook request miniprogram 导入按需导入 http 对象 import http from escook request miniprogram 将按需导入的 http 挂载到 wx
静态资源存放的位置

存放的四个位置 classpath META INF resources classpath resources classpath static classpath public 如果要访问的话是当前项目的根路径静态资源名因为这个图
C#中浮点数的比较

前几天去面试被问到怎么比较两个浮点数的大小当时只说了个大概看得出来面试官不是太满意回来特意查了一下在MSDN上发现了比较浮点数是否相等的不错的方法 Initialize two doubles with apparently id
接口测试用例设计 - 实战篇

目录一接口测试流程二分析接口文档中哪些元素三如何设计接口测试用例 3 1 为什么要设计测试用例 3 2 设计接口测试用例从哪些方面考虑四常用的接口测试用例覆盖方法五接口测试的接口优先级 5 1 优先级针对所有接口 5
MATLAB代码显示内存不足的解决方法

总结了下大家对于运行MATLAB代码显示内存不足的问题在网上进行调研总结如下一般out of memenry存在以下几种情况 1 变量需要的存储空间超过了可用的内存空间 2 数据需要的存储空间超过内存中最大的可用连续存储空间 3
最大子列和问题【简单易懂】

问题给定N个整数的序列求函数的最大值算法一例如序列为 1 2 3 4 所以子列分别为 1 1 2 1 2 3 1 2 3 4 2 2 3 2 3 4 3 3 4 4 我们要做的就是依次将这些子列的和求出并比较得出最大子列和首先将
2020算法设计与分析官方考前模拟卷参考答案

算法设计与分析样例试题算法设计与分析总结笔记注此试题仅供了解题型和期末考试试题没有任何直接关系 FBI Warning 这套题难度较大千万不要坏了心态 xj大佬说要是考试那么难他直播粪坑蝶泳 Power By 王宏志教授 5 分
matlab的tfdata函数_matlab 入门基本操作命令与函数

一 tf 函数是传递函数的意思一般学自动控制原理的时候经常用在s域中比如你要输入G s 1 s 2 2s 1 就可以在matlab中输入G tf 1 1 2 1 就OK了不懂的话你可以在command窗口输入help tf 就行了
为什么使用start方法启动Java的Thread线程？

一简介在Java代码当中当我们需要开启子线程去处理一些任务的时候往往是调用Thread对象的start方法这样Thread实例中的Runnable对象的run方法就会在一个新的线程当中执行创建一个线程 Thread thread
从注意力机制到Vison Transformer

原视频链接 https www bilibili com video BV1Jh411Y7WQ spm id from 333 788 vd source f04f16dd6fd058b8328c67a3e064abd5 https www

热门标签