小样本学习（FSL）：Few-shot Learning 综述【模型微调（Fine-tunning）、数据增强、迁移学习（Transfer Learning）】

2023-10-26

分类非常常见，但如果每个类只有几个标注样本，怎么办呢？

比如：我们打造了一个智能对话开发平台以赋能第三方开发者来开发各自业务场景中的任务型对话，其中一个重要功能就是对意图进行分类。大量平台用户在创建一个新对话任务时，并没有大量标注数据，每个意图往往只有几个或十几个样本。

面对这类问题，有一个专门的机器学习分支——Few-shot Learning 来进行研究和解决。

一、小样本学习方法

1、基于模型微调的小样本学习

基于模型微调的方法是小样本学习较为传统的方法,该方法通常在大规模数据上预训练模型,在目标小样
本数据集上对神经网络模型的全连接层或者顶端几层进行参数微调,得到微调后的模型.若目标数据集和源数
据集分布较类似,可采用模型微调的方法.

为了使微调后的小样本分类模型取得较好的效果,使用何种微调方法需要被考虑.Howard 等人[14]在 2018
年提出了一个通用微调语言模型(universal language model fine-tuning,简称 ULMFit).与其他模型不同的是,此方
法使用了语言模型而非深度神经网络.该模型分为3个阶段:(1) 语言模型预训练;(2) 语言模型微调;(3) 分类器
微调.该模型的创新点在于改变学习速率来微调语言模型,主要体现在两个方面.

传统方法认为,模型每一层学习速率相同;而ULMFit中,语言模型的每一层学习速率均不相同.模型底层表示普遍特征,这些特征不需要很大调整,所以学习速率较慢;而高层特征更具有独特性,更能体现
出任务和数据的独有特征,于是高层特征需要用更大的学习速率学习.总体看来,模型底层到最高层
学习速率不断加快.
对于模型中的同一层,当迭代次数变化时,自身学习率也会相应地产生变化.作者提出了斜三角学习
率的概念,当迭代次数从 0 开始增加时,学习速率逐渐变大;当迭代次数增长到某个固定

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习ML

机器学习

小样本学习

小样本学习（FSL）：Few-shot Learning 综述【模型微调（Fine-tunning）、数据增强、迁移学习（Transfer Learning）】的相关文章

Linux：WSL 下 CTS 环境搭建及无法识别设备问题

WSL Windows Subsystem for Linux 简称WSL 是一个在Windows 10上能够运行原生Linux二进制可执行文件 ELF格式的兼容层它是由微软与Canonical公司合作开发其目标是使纯正的Ubuntu
mysql [Err] 1118 - Row size too large (＞ 8126).

错误代码 1118 Row size too large gt 8126 Changing some columns to TEXT or BLOB may help In current row format BLOB prefix of
获取服务器系统,获取服务器操作系统

获取服务器操作系统内容精选换一换服务器安装上架服务器基础参数配置安装操作系统等操作请参见 Atlas 500 Pro 智能边缘服务器用户指南型号 3000 安装操作系统完成后配置业务网口IP地址请参见配置网卡IP地址 At

随机推荐

arduinows2812灯条程序_Arduino 控制WS2812 LED灯条

传统的LED限制总是很多比如需要很多的引脚所以有一种很好的解决方案是用灯条理论上这种灯条可以通过通讯用一根数据总线可以控制达到无上限个数的RGB LED灯珠并且在数量在1024以下时延迟是不可察觉的使用手册可查主要功能通过
Day 3 Mastering the Interface Definition Language (IDL)

Teach Yourself CORBA In 14 Days Day 3Mastering the Interface Definition Language IDL Overview IDL Ground Rules Case Sens
momentJS时间加减处理

计算最近在使用JavaScript计算时间差的时候发现很多问题需要处理在查看momentJS之后发现非常容易 console log moment format YYYY MM DD HH mm ss 当前时间 console log
基于nodejs的在线跑腿管理系统

末尾获取源码开发语言 nodejs 框架 Express 数据库 MySQL5 7 数据库工具 Navicat 11 开发软件 Hbuilder VS code 浏览器 edge 谷歌目录一项目简介二系统功能三系统项目截图
go语言context保存上下文

contxt保存上下文适合全局参数传递而普通的参数传递就没必要用context 因为不好维护关于context具体用法可以参考 https studygolang com articles 23247 fr sidebar packag
java函数的定义方法_java函数的定义以及使用方法介绍

java函数的定义以及使用方法介绍发布时间 2020 04 24 16 28 40 来源亿速云阅读 116 作者小新今天小编给大家分享的是java函数的定义以及使用方法介绍相信很多人都不太了解为了让大家更加了解java函数所
AJAX&&JSON

课程笔记Day46 AJAX JSON 综合案例第一章 AJAX 第01节基础理论 1 概念说明 1 什么是 AJAX AJAX是一项技术合集他是由一套技术组合得到的新技术方案异步请求技术 2 AJAX有什么作用呢使用Ajax技术
C++ 删除文本数据中第一个元素

由于项目需要删除第一个字符然后按照相同顶格显示如下 v 279 268005 37 345402 2 081520 v 280 971985 37 074699 1 353890 v 279 015991 44 888100 1 609
手把手教你搭建国产嵌入式模拟器SkyEye开发环境

SkyEye介绍 SkyEye是一个开源软件 OpenSource Software 项目中文名字是天目 SkyEye的目标是在通用的Linux和Windows平台上实现一个纯软件集成开发环境模拟常见的嵌入式计算机系统这里假定仿真
《编译原理》笔记整理

编译原理笔记整理 1 1 编译原理引论基本概念发展机器语言汇编语言高级语言工具语言基本概念翻译程序把某一种语言程序称为源语言程序等价的转换成另一种语言程序称为目标语言程序的程序如中英互译系统 DBMS语言
Java工程师成长之路

Java工程师成长之路李颜芯欢迎大家收看CSDN的视频节目今天我们的有关话题是Java工程师的成长之路今天我们请到两位老师和我们一起探讨这个问题首先请两位老师作一下自我介绍李翊大家好我是来自于东方标准人才服务有限公司原来
深度学习安装篇之二：ubuntu18.04+pycharm-2021.3安装

一软件下载 1 申请学生或教师用户可以免费使用专业版本有学校的电子邮箱edn or 社区免费版 2 官网下载软件 PyCharm the Python IDE for Professional Developers by JetBr
arduino-esp32：LVGL中文字库（通用）

导航概述系统自带中文字库使用自带中文字库制作专属字库使用专属字库 VS模拟器效果 arduino esp32 效果小结概述标题是arduino esp32只是因为平台是这个 LVGL默认的字库是英文的当然其字库文件里也有
华为OD机试 Python 【食堂供餐】

题目员工食堂现在供应盒饭我们的目标是让员工不用排队直接取餐根据过去的取餐统计我们想知道每单位时间食堂至少要制作多少盒饭才能确保每个员工都不用等待输入 3 14 10 4 5 输出 3 输入 3 这表示在一个特定的时间段内共有
YOLO综述：从YOLOV1到YOLOV8

YOLO综述从YOLOV1到YOLOV8 ABSTRACT 1 Introduction 2 YOLO Applications Across Diverse Fields 3 Object Detection Metrics and N
nginx报错nginx: [error] open() “/run/nginx.pid” failed (2: No such file or directory)

nginx error open run nginx pid failed 2 No such file or directory 日期 2018 11 03 来源 Linux公社作者醉落红尘字体大中小 CentOS 7 5下启
vue 按钮权限控制

vue 按钮权限控制前言在日常项目中会碰到需要根据后台接口返回的数据来判断当前用户的操作权限必须当有删除权限时就显示删除按钮没有这个权限时就不显示或者删除这个按钮通过查找资料通过vuex来实现这个功能步骤 1 定义b
PID算法

比例P 数值固定不会随着情况调整增幅器积分I 比例P过小增幅器补充抑制器微分D 比例P过大抑制器削减比例P 偏差量目标量传感器比例P 偏差量比例P系数执行量比例P 积分I 偏差量目标量传感器积分I 积分I
得到课程：冯雪·科学减肥16讲

发刊词减肥的动机是为了健康更是为了提高你的魅力提高你的社会竞争力减肥的实质是改变生活方式换一种新的人生只有跟一群志同道合的人一起走才能走得更远最终减肥成功基本原理 01 终点三个目标一个都不能少只要体重体脂和体型
小样本学习（FSL）：Few-shot Learning 综述【模型微调（Fine-tunning）、数据增强、迁移学习（Transfer Learning）】

分类非常常见但如果每个类只有几个标注样本怎么办呢比如我们打造了一个智能对话开发平台以赋能第三方开发者来开发各自业务场景中的任务型对话其中一个重要功能就是对意图进行分类大量平台用户在创建一个新对话任务时并没有大量标注数据每个意

热门标签