Vision Transformer里的MLP Head里的Pre-Logits层

2023-11-07

# Representation layer
if representation_size and not distilled:
    self.has_logits = True
    self.num_features = representation_size
    self.pre_logits = nn.Sequential(OrderedDict([
        ("fc", nn.Linear(embed_dim, representation_size)),
        ("act", nn.Tanh())
    ]))
else:
    self.has_logits = False
    self.pre_logits = nn.Identity()

nn.Sequential:一个有序的容器,神经网络模块将按照在传入构造器的顺序依次被添加到计算图中执行,同时以神经网络模块为元素的有序字典也可以作为传入参数。

OrderedDict:python中字典dict是利用hash存储,因为各元素之间没有顺序。OrderedDict即按照有序插入顺序存储的有序字典。除此之外还可根据key,val进行排序。

nn.tanh():双曲正切的激活函数

公式:

tanh=\frac{sinhx}{coshx}=\frac{e^{x}-e^{x}}{e^{x}+e^{x}}

 函数:y = tanh x;

图像:

nn.Identity: 恒等函数,即f(x) = x,相当于分类得到分类之前的特征。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Vision Transformer里的MLP Head里的Pre-Logits层 的相关文章

随机推荐

  • mySQL超1G大数据导入解决方法

    打开php ini 找到 upload max filesize memory limit post max size 这三个参数 upload max filesize 2G 是上传最大文件的大小 可写成2G memory limit 2
  • MySQL基本使用和后端业务建表逻辑

    基本使用 下载和安装 首先到MySQL官网上下载MySQLMySQL官网 下载之前需要登录Oracle账号才能下载 下载完成之后 需要验证MySQL是否安装成功 测试MySQL是否安装成功有如下几种方法 需要再命令行中输入services
  • 【算法系列篇】分治-快排

    文章目录 前言 什么是分冶 1 颜色分类 1 1 题目要求 1 2 做题思路 1 3 Java代码实现 2 排序数组 2 1 题目要求 2 2 做题思路 2 3 Java代码实现 3 数组中的第k个最大元素 3 1 题目要求 3 2 做题思
  • Mongodb 学习笔记 (11)启动时WiredTiger 错误解决

    数据库版本 3 4 15 错误描述 无法启动 错误日志显示 initandlisten WiredTiger error 31802 1565933984 78859 31235 0x7f4ace0cad00 txn recover uns
  • vite使用vue3 v-for渲染图片时的写法

    写法一
  • (转)java代码发送JSON格式的httpPOST请求

    import Java io BufferedReader import java io DataOutputStream import java io IOException import java io InputStreamReade
  • HTTP协议、http服务器的实现-1

    1 HTTP协议简介 在Web应用中 服务器把网页传给浏览器 实际上就是把网页的HTML代码发送给浏览器 让浏览器显示出来 而浏览器和服务器之间的传输协议是HTTP 所以 HTML 超文本标记语言 HyperText Markup Lang
  • MSYS2搭建mingw32编译环境(支持cmake、make指令)

    一 下载msys2并安装 1 地址 https www msys2 org 2 安装如下图 3 启动MSYS2程序 如下图 二 PACMAN指令说明 1 更新 在 Archlinux 中 使用一条命令即可对整个系统进行更新 pacman S
  • VSCode 报错Error loading workspace: err: exit status 1: stderr: warning: ignoring symlink

    原因 vscode的一个工作区好像只能有一个Go模块 如果是有多个模块 就要区分工作区 解决方法 点击菜单栏 文件 gt 将文件夹添加到工作区 gt 选择模块所在的文件夹 这个文件夹将会是新工作区的根目录 参考 https github c
  • 转行大数据的好建议

    第一点 要有决心 先问问自己是否能够把大数据工作当做自己未来10年 20年甚至毕生都想从事的工作 如果是的话 那么 就算你在传统行业工作了5年 7年甚至10年 都30大几的年龄 现在转行也为时未晚 第二点 要有信心 你是否已经习惯于企事业单
  • 数据指标体系建设

    一 什么是数据指标体系 指标体系是从不同维度梳理业务 把指标有系统的组织起来 简而言之 指标体系 指标 体系 所以一个指标不能叫指标体系 几个毫无关系的指标也不叫指标体系 指标体系就像是一个整体 一辆车 各个零件组成一辆车 严密结合 口径一
  • 服务器系统盘如何分区,云服务器的系统盘能分区吗

    云服务器的系统盘能分区吗 内容精选 换一换 切换操作系统是为您的云服务器重新切换一个系统盘 切换完成后云服务器的系统盘ID会发生改变 并删除原有系统盘 如果云服务器当前使用的操作系统不能满足业务需求 如软件要求的操作系统版本较高 您可以选择
  • mmsegmentation自定义数据集

    目录 1 mmsegmentation之model 2 mmsegformer之datasets 2 1 data config 2 2 data class 2 3 total config 3 运行 1 mmsegmentation之m
  • 超限学习机(ELM)

    ELM Exteme learning machine 超限学习机 由新加坡南洋理工大学的Guangbin Huang 黄光斌 副教授提出的 1 算法概述 ELM算法针对的问题是单隐层的前馈神经网络 single hidden layer
  • 大数定理

    2017 12 29 我一直对这个大数定理不理解 为什么就这么重要 学了这么多年的概率论 而且 这么多年了也一直没事就看到这些东西 但是还真的没有让我感觉的这个东西的重要性 http www cnblogs com vamei p 3460
  • R语言 面试题

    什么是R语言编程 R语言是一种用于统计分析和为此目的创建图形的编程语言 不是数据类型 它具有用于计算的数据对象 它用于数据挖掘 回归分析 概率估计等领域 使用其中可用的许多软件包 R语言中的不同数据对象是什么 它们是R语言中的6个数据对象
  • mysql-5.7.27 安装

    net start mysql 发生系统错误2 系统找不到指定的文件 转自 https www jianshu com p 6d8ed7c36e6f 以管理员身份运行 在命令行输入cd mySQL的bin目录的安装路径 C Windows
  • Java 运行时发生 NoClassDefFoundError: Could not initialize class 的解决方法

    在编译时没有异常的程序 在运行时抛出异常称 NoClassDefFoundError Could not initialize class 类名 根据 Java 官方文档 NoClassDefFoundError 是由于 JVM 或 Cla
  • 3分钟学会在 ASP.NET MVC 中创建、读取和编辑 Excel 电子表格

    在本文中 您将学习如何在ASP NET MVC 应用程序中创建 读取和编辑 Excel 电子表格 为此 我们将创建一个由功能丰富的网格控件组成的电子表格应用程序 用于显示和编辑 Excel 文件 如下所示 为了在 ASP NET MVC 中
  • Vision Transformer里的MLP Head里的Pre-Logits层

    Representation layer if representation size and not distilled self has logits True self num features representation size