03 什么是预训练(Transformer 前奏)

2023-11-03


预训练有什么用

机器学习:偏数学(《统计学习方法》-李航)

深度学习(人工智能)的项目:大数据支持(主流)

我们很多项目没有大数据支持(小数据)

猫狗分类任务:100 张猫和狗的图片 --》给你一张图片,分出是猫还是狗(无法解决的一个问题,精度很低)

100000 张鹅和鸭的图片(已知,有人做过的,通过这10w 张图片做了一个模型 A)

img

有人发现,浅层通用的(横竖撇捺)

我通过10w个鹅和鸭训练了一个模型 A,100 层的 CNN

任务 B:100 张猫和狗的图片,分类 --》 训练处 100层的 CNN,不可能实现的

尝试使用 A 的前 50 层,使用 100 层去完成任务 B

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y3D9VcIQ-1688809443180)(https://imgmd.oss-cn-shanghai.aliyuncs.com/BERT_IMG/%E9%A2%84%E8%AE%AD%E7%BB%83%E7%9A%84%E5%BA%94%E7%94%A8.jpg)]

  1. 冻结:浅层参数不变
  2. 微调:浅层参数会跟着任务 B 训练而改变

预训练是什么

通过一个已经训练好的模型 A,去完成一个小数据量的任务 B(使用了模型 A 的浅层参数)

任务 A 和任务 B 极其相似

预训练怎么用

fairseq 、transformers 库

总结

一个任务 A,一个任务 B,两者极其相似,任务 A 已经训练处一个模型 A,使用模型 A 的浅层参数去训练任务 B,得到模型 B,1.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

03 什么是预训练(Transformer 前奏) 的相关文章

  • Zabbix部署详细步骤

    以下是在Ubuntu上安装Zabbix的详细步骤 1 更新系统 使用以下命令更新Ubuntu系统 sudo apt get update sudo apt get upgrade 2 安装依赖项 在安装Zabbix之前 需要先安装一些依赖项
  • 教你快速上手Flex弹性盒布局(容器属性)

    目录 简介 一 Flex布局语法 1 1 display flex 二 Flex属性 三 容器属性 3 1 flex direction 3 2 flex direction row 3 3 flex direction row rever
  • 【华为OD统一考试B卷

    在线OJ 已购买本专栏用户 请私信博主开通账号 在线刷题 运行出现 Runtime Error 0Aborted 请忽略 2023年5月份 华为官方已经将的 2022 0223Q 1 2 3 4 统一修改为 2023A卷和2023B卷 你收
  • Tachyon内存文件系统

    Tachyon内存文件系统 Tachyon是以内存为中心的分布式文件系统 拥有高性能和容错能力 能够为集群框架 如Spark MapReduce 提供可靠的内存级速度的文件共享服务 从软件栈的层次来看 Tachyon是位于现有大数据计算框架
  • 使用GitHub的一些小知识合集

    文章目录 一 FastGithub 1 稳定可靠的github加速神器 FastGithub 2 github加速神器 FastGithub 二 README md添加图片 1 怎么给README md添加图片 两种方法 图文教程 2 在R
  • OpenCV代码提取:morphologyEx函数的实现

    Morphological Operations A set of operations that process images based on shapes Morphological operations apply a struct
  • keil软件安装与破解

    目录 目录 下载 安装 破解 下载 学习51单片机必要的开发工具是 KEIL C51 下载密码dsfs 安装 按照一般安装软件顺序即可 此处随便填写 破解 注意 需以管理员身份 运行 按照如下图片步骤 弹出如下对话框 再打开软件按如下操作
  • 解决pycharm错误:Error updating package list: connect timed out解决

    方法是在 Manage Repositories 中 修改数据来源 默认的是 https pypi python org simple 我们可将其替换为如下的几个数据来源 这些都是国内的pip镜像 清华 https pypi tuna ts
  • Vue3 emits选项将Emit派发事件可以对参数进行验证。

    Vue官方建议我们在组件中所有的emit事件都能在组件的emits选项中声明 emits参数有俩种形式对象和数组 对象里面可以配置带校验emit事件 为null的时候代表不校验 校验的时候 会把emit事件的参数传到校验函数的参数里面 当校

随机推荐

  • Python第三方库之MedPy

    文章目录 1 MedPy简介 2 MedPy安装 3 MedPy常用函数 3 1 medpy io load image 3 2 medpy metric binary dc result reference 3 3 medpy metri
  • < Linux >:环境变量

    目录 环境变量 常见的环境变量 基本概念 查看环境变量内容的方法 测试环境变量PATH 与环境变量相关的命令 Linux操作系统下C C 程序代码中获取环境变量的方式 环境变量的组织方式 环境变量通常具有全局属性 环境变量 问题 注意 可执
  • JavaScript基础语言

    1 JavaScript采用Unicode字符集编写的 区分大小写 但HTML不区分大小写 与JavaScript同名的标签和属性 可以大写也可以小写 2 JavaScript存在两种形式的注释 行尾注释 和 多行注释 3 标识符就是一个名
  • 光束平差法(Bundle Adjust)

    光束平差法 代价函数 代价函数求解 Levenberg Marquardt方法 代码实现 流程图 光束平差法 采用光束平差法对射影空间下的多个相机运动矩阵及非编码元三维结构进行优化 光束平差法一般在各种重建算法的最后一步使用 这种优化方法的
  • 虚幻官方项目《CropOut》技术解析 之 程序化岛屿生成器(IslandGenerator)

    开个新坑详细分析一下虚幻官方发布的 CropOut 文章会同步发布到我在知乎 CSDN的专栏里 文章目录 概要 Create Island 几何体生成部分 随机种子 Step 1 Step 2 Step 3 Step 4 Step 5 St
  • Python—爬虫之BeautifulSoup模块(解析—提取数据)

    Python 爬虫之BeautifulSoup模块 解析 提取数据 安装BeautifulSoup模块 解析数据 提取数据 find 提取出满足条件的第一个数据 find all 提取出满足条件所有数据 Tag 对象的属性和方法 安装Bea
  • .NET混淆器 Dotfuscator保护机制——重命名

    Dotfuscator是一个 NET的Obfuscator 它提供企业级的应用程序保护 大大降低了盗版 知识产权盗窃和篡改的风险 Dotfuscator的分层混淆 加密 水印 自动失效 防调试 防篡改 报警和防御技术 为世界各地成千上万的应
  • Streamlit 讲解专栏(十二):数据可视化-图表绘制详解(下)

    文章目录 1 前言 2 使用st vega lite chart绘制Vega Lite图表 2 1 示例1 绘制散点图 2 2 示例2 自定义主题样式 3 使用st plotly chart函数创建Plotly图表 3 1 st plotl
  • WebSocket(一) -- 原理详解

    1 什么是websocket WebSocket是HTML5下一种新的协议 websocket协议本质上是一个基于tcp的协议 它实现了浏览器与服务器全双工通信 能更好的节省服务器资源和带宽并达到实时通讯的目的 Websocket是一个持久
  • 利用MMSegmentation微调Mask2Former模型

    前言 本文介绍了专用于语义分隔模型的python库mmsegmentation github项目地址 运行环境为Kaggle notebook GPU为P100 针对环境配置 预训练模型推理 在西瓜数据集上微调新sota模型mask2for
  • ubuntu下安装apache2.2+mod_wsgi+django(二)

    http blog csdn net huangxiansheng1980 article details 7207075 在上一篇博文 ubuntu下安装apache2 2 mod wsgi django 一 中已经建立了一个apache
  • 2.5 学费计算(project)

    第1关 学费计算 任务描述 本关任务 编写一个学费计算的小程序 相关知识 问题描述 大学第一学期必选课程及其学分如下 Python 高等数学 大学英语 大学体育 军事理论 哲学 3学分 4学分 4学分 2学分 2学分 2学分 表1 课程学分
  • 静态代码扫描工具 Sonar 配置及使用

    概览 Sonar 是一个用于代码质量管理的开放平台 通过插件机制 Sonar 可以集成不同的测试工具 代码分析工具 以及持续集成工具 与持续集成工具 例如 Hudson Jenkins 等 不同 Sonar 并不是简单地把不同的代码检查工具
  • 解决:虚拟机重启后docker容器无法访问

    1 情况 vm宿主机无法访问容器 虚拟机curl localhost也无法访问 虚拟机centOS8 docker版本 Version 20 10 21 2 尝试 网上搜了一堆解决办法 首先排除端口映射问题 端口映射正常 然后检查内核版本和
  • HOOK startActivity

    往期推荐 HOOK框架 动态代理 HOOK框架 静态代理 实战案列分析 Crakeme01 实战 AliCrackme 需要相关资料的朋友 可以 加入此处即可打包获取 Hook的英文含义是钩子 你可以理解为用钩子把要Hook的对象勾过来 然
  • Error:(31, 39) java: 不兼容的类型: java.lang.String无法转换为int 的处理

    异常说明 使用增强for输出元素的时候 在元素名前面加了数组名称 发生原因 未严格按照增强for的语法写代码 改正方式 按each for的语法 不要在输出元素前面加数组名 改正前 改正后 转载于 https www cnblogs com
  • State:状态模式

    某个对象有一个标准接口 同时 该对象可能处于各种状态下 当该对象处于不同状态下时 客户调用标准接口 该对象会产生不同的响应 即允许一个对象在其内部状态改变时改变它的行为 使对象看起来似乎修改了它的类 这就是状态模式 例如 电灯开关这个对象提
  • Flutter

    在 decoration 里面设置 image 即可 Container width 100 height 100 alignment Alignment center child Text 有背景图 decoration BoxDecor
  • Python玩转微信 个性签名生成词云图

    本博客代码参照http www cnblogs com jiaoyu121 p 6944398 html 运行如下代码之前 将下图的wechat jpg放入F盘下 需安装itchat jieba matplotlib numpy和wordc
  • 03 什么是预训练(Transformer 前奏)

    博客配套视频链接 https space bilibili com 383551518 spm id from 333 1007 0 0 b 站直接看 配套 github 链接 https github com nickchen121 Pr