多任务学习综述

2023-12-20

参考

张钰,刘建伟,左信. 多任务学习[J]. 计算机学报, 2020.
Multi-task Learning 理论(多任务学习)
在这里插入图片描述

概述

单任务独立学习

  • 只使用单个任务的样本信息
  • 局限性
    1、忽略其它任务的经验信息,致使训练冗余重复和学习资源浪费,限制性能提升
    2、对于训练样本少且特征维数高的任务,单任务学习出现秩亏且存在过拟合风险

多任务学习(MTL)

  • Multi-task Learning,MTL
  • 属于 迁移学习 范畴
    但其并不注重源领域和未知领域的知识迁移,主要利用域之间相似的知识信息(同时学习目标任务和源任务),提升特定任务的学习效果,注重领域知识的共享性
  • 同时考虑多个相关任务
  • 目的
    利用任务间的内在关系,提高单个任务的泛化性能
  • 方法
    1、假设不同任务数据分布之间存在一定相似性
    2、基于此通过共同训练和优化建立任务之间的联系
    3、同时训练多个相关任务,并进一步挖掘训练中的特定领域信息以提高单个任务的泛化性能
  • 优势
    1、能够充分促进任务之间的信息交换
    2、达到相互学习的目的
    3、在各自任务样本容量有限的条件下,可从其它任务获得一定启发,增加单个任务样本空间大小
    4、借助于学习过程中的信息迁移,间接利用其它任务数据
    5、缓解对大量标注数据的依赖
    6、提升各自任务学习性能
    7、多任务之间平均了各自的噪声差异,得到了更一般的表示模型,可为相关特征提供额外的参考信息,有效降低单个任务过拟合和泛化能力差的风险
  • 多任务情况
    1、任务数据采集来源与分布相似,即可能存在共同的归纳偏置
    2、但由于学习目的不完全相同,不能简单地将它们合并为一个任务
    3、此时可看作是由多个相关任务组成,选择多个任务联合学习,从而获得一些潜在信息以提高各自任务的学习效果

多任务的类型

联合学习(joint learning)(对称)

  • 也称 对称多任务学习 ,不区分主任务和辅助任务
  • 试图同时执行所有任务以便提高单个任务的学习性能,通过任务之间的特征信息迁移共同地提升所有任务的学习效率
  • 联合学习多个分类任务有助于减少任务之间概率分布差异

自主学习(learning to learn)(非对称)

  • 也称 非对称多任务学习
  • 目标是利用源任务的信息来改进某些目标任务的学习性能,通常在源任务被学习后使用
  • 与迁移学习不同,自主学习建立在共同学习基础上,要求源域与目标域分布具有相似性

非对称任务中的几种典型辅助任务

将输入变输出的逆多任务学习

  • 有监督学习:输入和输出之间有明显区分,观测值为输入,待预测值为输出,也称为监督信号
  • 借鉴无监督学习模式:将特征同时作为输入和输出,利用不同无监督样本的特征信息为彼此提供监督信号
  • 方法:在有监督的多任务学习中如果存在比作为输入更有价值的特征,可以使用其它任务上的样本特征作为监督信号(因为附加辅助输出中的噪声往往小于附加辅助输入中的噪声),学习目标任务训练集上其它输入特征到这部分特征的映射关系,学习映射关系的过程可以作为辅助任务
    Caruana. Promoting poor feature to supervisors:Some inputs work better as outputs. 1997.

对抗性多任务学习

  • 受生成对抗网络启发
  • 目的:得到对主要任务有利而与次要任务对抗的表示
  • 不断利用辅助任务包含的相反信息,消除主要任务的噪声,从而学习到接近底层数据真实表示的特征
    Shinohara. Adversarial multi-task learning of deep neural networks for robust speech recognition. 2016.

辅助任务提供注意力特征的多任务学习

  • 单任务学习:
    显著特征对学习结果影响较大,
    不常用特征通常被忽略
  • 但部分不常用特征对于任务的某些功能是必要的
  • 可以通过辅助任务单独引入,在共同学习过程中将其放大,平衡显著特征带来的学习不充分问题
  • 此类在目标任务中需要单独放大的特征一般称为需要注意力集中的特征

附加预测性辅助任务的多任务学习

  • 辅助任务:离线过程中搜集与主任务相关的未知特征,也称为预测性任务
  • 在线过程中为主任务提供额外信息,帮助主任务学习更合理的归纳表示

多任务学习算法

多任务学习的定义

  • 给定 M M M 个任务 { T m } m = 1 M \{ {T_m}\}_{m=1}^M { T m } m = 1 M
  • m m m 个任务为 T m T_m T m
    其训练集为 D m D_m D m
    包含 n m n_m n m 个样本-标签对 { x m , j , y m , j } j = 1 n m \{ {x_{m,j},y_{m,j}}\}_{j=1}^{n_m} { x m , j , y m , j } j = 1 n m x m , j ∈ R D , y m , j ∈ R x_{m,j}\in{R^D},y_{m,j}\in{R} x m , j R D , y m , j R
  • W ∈ R D × M W\in{R^{D×M}} W R D × M 表示权值矩阵,即多任务模型参数矩阵
  • ε m \varepsilon_m ε m 表示任务下的噪声
  • 则有线性模型:
    y m , j = w m T x m , j + ε m y_{m,j}=w_m^T{x_{m,j}}+\varepsilon_m y m , j = w m T x m , j + ε m
  • 多数MTL算法的关键假设
    所有任务都通过某种结构相互关联,多任务中任务信息共享是通过特征的联系实现的;
    一般来说,多任务选取的特征属性都是相似的,而各个任务之间特征的重要性通过模型向量 w m w_m w m 反映;
    在模型向量中所占比重相似,才能说明任务特征之间具有迁移性。
  • MTL的目的
    通过学习 W W W 的不同结构来反映任务之间的关系

多任务算法的分类

学习模式不同

  • 传统的结构化学习
    不利用抽象后的特征,最终以结构约束的形式体现任务联系
  • 深度多任务学习
    改变特征的表现形式

学习结构不同

  • 基于任务层面
    将大部分特征视为彼此相关,且任务相关性是全局的
    注重总体特征的共享迁移,一般同时考虑多个特征
  • 基于特征层面
    单独对各个任务中的特征进行建模
    注重个体特征的共享迁移

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

多任务学习综述 的相关文章

  • 【vue】$bus 跨组件调用方法

    1 新建bus js import Vue from vue 使用 Event Bus const bus new Vue export default bus 2 main js引用 import bus from libs bus Vu
  • 什么是DLNA

    DLNA旨在解决个人PC 消费电器 移动设备在内的无线网络和有线网络的互联互通 使得数字媒体和内容服务的无限制的共享和增长成为可能 DLNA的口号是Enjoy your music photos and videos anywhere an
  • LLaVA和LLaVA-Plus视觉指令微调及工具使用构建多模态智能体

    认识和理解视觉内容 以及基于人类指令对视觉世界进行推理 长久以来一直是一个具有挑战性问题 得益于大规模预训练 OpenAI 的 GPT 4V 展示了在自然语言处理任务和复杂视觉理解中令人印象深刻的能力 智源社区邀请到了LLaVA的一作柳昊天
  • 测试开发 | 智能辅助在心理健康治疗中的革新:倾听、理解、支持的新时代

    随着科技的迅速发展 智能辅助技术正在逐渐渗透到心理健康治疗领域 为个体提供更为智能 个性化的支持 这种创新性的结合为心理健康领域带来了新的可能性 使治疗更加灵活 高效 并为患者提供了更全面的关怀 1 虚拟治疗环境 智能辅助技术通过虚拟治疗环
  • 航空港务数据大屏为航空港的可持续发展提供有力支撑!

    随着经济的发展 不断加建与扩建民用机场 空港行业规模不断扩大 在不断引进和消化发达国家先进技术的同时 中国深入开展了对新技术和新材料的研究 极大地丰富和发展了中国的机场建设技术 且各项机场建设计划均已落实推进 行业在经济发展的推动下欣欣向荣
  • 在vue3的setup语法糖中为什么无法直接使用useRouter().currentRoute

    在vue3的setup语法糖中为什么无法直接使用useRouter currentRoute 问题 在setup语法糖中 不能直接使用useRouter xx
  • 测试开发 | 创业与人工智能的密切关系

    随着科技的迅猛发展 人工智能 AI 已经逐渐渗透到各个领域 为创业者带来了前所未有的机遇与挑战 在这个数字化转型的时代 创业与人工智能的密切关系日益凸显 成为推动创新和持续发展的关键因素 1 人工智能为创业提供新的商业模式 人工智能技术的不
  • 在spring boot项目引入mybatis plus后的的案例实践

    前景提要 1 项目背景 一个spring boot mybatis的项目 分页一直是PageHelper 2 为什么要引入mybatis plus 1 简化单表的crud 2 对mybatis plus进行简单的设计 以满足现有系统的规范
  • 龙芯loongarch64服务器编译安装paddlepaddle

    前言 PaddlePaddle Parallel Distributed Deep Learning 中文名飞桨 是百度公司推出的开源 易学习 易使用的分布式深度学习平台 现阶段各行各业均追求国产化 软件行业也一样 所有需要在龙芯服务器上编
  • Python+Pytest接口自动化之测试函数、测试类/测试方法的封装

    前言 在python pytest 接口自动化系列中 我们之前的文章基本都没有将代码进行封装 但实际编写自动化测试脚本中 我们都需要将测试代码进行封装 才能被测试框架识别执行 例如单个接口的请求代码如下 import requests he
  • Amazon Toolkit — CodeWhisperer 使用

    tFragment gt 官网 https aws amazon com cn codewhisperer trk cndc detail 最近学习了亚马逊云科技的 代码工具 感慨颇多 下面是安装 和使用的分享 CodeWhisperer
  • android 13.0 USB连接模式默认设为MTP

    1 概述 在13 0android系统产品开发中 在通过otg连接设备的时候 会弹出usb连接模式这时候会让客户选择当前连接电脑是 哪种模式 在项目开发中 需要以mtp模式 就是可以在电脑查看设备的内部存储的样式来设置otg连接电脑的模式
  • 数据工作者最爱的AI功能,你知道吗~

    在工作中难以避免的一项任务就是各种数据总结和汇报 怎么分析总结 以何种形式汇报 都是具有一定的难点 所以我要推荐的就是具有AI图表解析功能的可视化工具 Easyv数字孪生低代码可视化平台 可实现对数据的可视化展示 通过丰富的图表组件 清晰展
  • CentOS7.9安装Mysql5.7-m14

    简介 本文介绍了Linux CentOS系统下Mysql5 7 m14的下载和安装方法 环境 CentOS Linux release 7 9 2009 Core mysql Ver 14 14 Distrib 5 7 4 m14 for
  • EasyV+UE创造数字孪生可视化新篇章!

    众所周知 UE是UNREAL ENGINE 虚幻引擎 的简写 由Epic开发 是世界知名授权最广的游戏引擎之一 EasyV是一款数据可视化应用平台 用户通过EasyV可以更高效的实现数据可视化项目搭建 产品内有丰富的模版 海量的组件 简单的
  • 智能辅助技术的未来前景:创新与便利的引领者

    在数字化时代 智能辅助技术正迅速崛起 成为改善生活 提升工作效率的关键因素 这些技术通过结合人工智能 机器学习和物联网等前沿技术 为用户提供更加智能 便捷的体验 未来 智能辅助技术有望在多个领域引领创新 改变人们的生活方式 1 智能助理的个

随机推荐

  • 使用 Amazon Fault Injection Service 演示多区域和多可用区应用程序弹性

    文章作者 Jeff Amazon Fault Injection Service FIS 可帮助您将混沌工程大规模付诸实践 今天 我们推出了新的 场景 这些场景可以让您演示在亚马逊云科技可用区完全断电 或从一个亚马逊云科技区域到另一个亚马逊
  • 测试开发 | 物流与供应链中的智能优化

    随着全球化的深入和商业环境的复杂化 物流与供应链管理面临着前所未有的挑战 然而 随着人工智能 AI 和物联网 IoT 等技术的不断发展 智能优化正成为推动物流与供应链行业变革的关键力量 以下是智能优化在物流与供应链领域的一些关键应用 1 实
  • 测试开发 |AI驱动的健康监测与管理:数字化时代的医疗创新

    随着人工智能 AI 技术的飞速发展 其在健康监测与管理领域的应用正日益成为医疗领域的重要变革力量 AI不仅提供了更精准 高效的医学诊断手段 还为个体化的健康管理提供了全新的可能性 以下是AI驱动的健康监测与管理在数字化时代的一些关键应用 1
  • 测试开发 | 游戏开发中的人工智能创新:探索数字娱乐的未来

    随着科技的不断进步 人工智能 AI 在游戏开发领域展现出巨大的潜力 为游戏行业带来了前所未有的创新 以下是游戏开发中人工智能创新的一些关键方面 1 智能敌对角色和游戏对抗性 传统游戏中的敌对角色往往遵循固定的模式和策略 容易被玩家预测 通过
  • 跟着野火学FreeRTOS:第一段(任务定义,切换以及临界段)

    在裸机系统中 系统的主体就是 C P U CPU CP U 按照预先设定的程序逻辑在 m a i n
  • git命令github拉取推送代码超时报错

    背景 使用魔法科学上网之后 github的页面可以正常访问 但是拉取代码和推送代码还是一直报错 报错信息内容 Failed to connect to github com port 443 Timed out 其实本质是因为代理设置的不正
  • LLama Factory 安装部署实操记录(二)

    1 项目地址 GitHub hiyouga LLaMA Factory Easy to use LLM fine tuning framework LLaMA BLOOM Mistral Baichuan Qwen ChatGLM Easy
  • 从学到考,一图带你读懂开发者技能成长秘籍

    亚马逊云科技开发者社区 为开发者们提供全球的开发技术资源 这里有技术文档 开发案例 技术专栏 培训视频 活动与竞赛等 帮助中国开发者对接世界最前沿技术 观点 和项目 并将中国优秀开发者或技术推荐给全球云社区 如果你还没有关注 收藏 看到这里
  • C++ 字符串比较------strcmp函数和strncmp函数

    strcmp 函数原型 int strcmp const char str1 const char str2 功能 strcmp函数会按照字典顺序逐个比较两个字符串的字符 直到遇到不同的字符或者遇到字符串结束符 0 返回值 该函数返回值如下
  • LLama Factory 实操记录(一)

    1 api端口参数说明 src api h help 显示帮助信息并退出 model name or path MODEL NAME OR PATH 模型权重的路径或标识符 来自 huggingface co models 或 models
  • 开班在即 | 测试开发线下高薪私教班助力你的职场晋升

    深圳线下高薪私教班即将结束 很多同学都实现了跳槽涨薪的目标 今天和大家分享其中一位同学的求职成果 她成功斩获了4个名企Offer 并且薪资从25W涨到了40W 她自己对这个结果很满意 我们也为她感到高兴 现在 我们推荐她所选择的班型给大家
  • 高通切换到Emergency Download:adb reboot edl

    刷机 开机下adb reboot edl 切到QDloader 9008 点下载 The command adb reboot edl is used to reboot an Android device into EDL Emergen
  • 一文详解Python中PO模式的设计与实现

    在使用 Python 进行编码的时候 会使用自身自带的编码设计格式 比如说最常见的单例模式 稍微抽象一些的抽象工厂模式等等 在利用 Python 做自动化测试的时候 是不是也有自己的设计模式呢 所以在今天这个小章节里 需要续了解的就是 py
  • 测试开发 | 智能辅助在心理健康治疗中的革新:倾听、理解、支持的新时代

    随着科技的迅速发展 智能辅助技术正在逐渐渗透到心理健康治疗领域 为个体提供更为智能 个性化的支持 这种创新性的结合为心理健康领域带来了新的可能性 使治疗更加灵活 高效 并为患者提供了更全面的关怀 1 虚拟治疗环境 智能辅助技术通过虚拟治疗环
  • Postman报错提示 Could not get any response怎么解决

    在通过 postman 请求做接口测试的过程中 有时候会遇到一些报错 当遇到这些报错我们不要着急 看着具体哪里报错 然后进行解决 postman报错 经常使用postman的小伙伴们都应该遇到过一些报错 遇到报错的时候我们不要着急 这么这几
  • Elasticsearch——索引数据

    索引可以说是Elasticsearch中非常重要的模块 一个索引可以视作关系数据库中的一张表 本帖将详细介绍与Elasticsearch索引相关的各种功能等 主要内容如下 索引映射 mapping 结构的定义方法 常用的各种字段类型和动态映
  • 【源码】基于SpringBoot+thymeleaf实现的快递之家管理系统

    系统介绍 基于SpringBoot thymeleaf实现的快递之家管理系统是为学校打造的高效的快递管理系统 系统分为管理员 注册用户两类角色 一共是分为三大菜单项 分别是我的物流 个人管理 后台管理 管理员拥有全部菜单 注册用户拥有我的物
  • Pytest自动化测试 - 必知必会的一些插件

    Pytest拥有丰富的插件架构 超过800个以上的外部插件和活跃的社区 在PyPI项目中以 pytest 为标识 本篇将列举github标星超过两百的一些插件进行实战演示 插件库地址 http plugincompat herokuapp
  • Selenium库编写爬虫详细案例

    一 引言 Selenium作为一个强大的自动化测试工具 其在网络爬虫领域也展现出了许多技术优势 首先 Selenium可以模拟浏览器行为 包括点击 填写表单 下拉等操作 使得它能够处理一些其他爬虫工具无法应对的情况 比如需要登录或者页面使用
  • 多任务学习综述

    文章目录 参考 概述 单任务独立学习 多任务学习 MTL 多任务的类型 联合学习 joint learning 对称 自主学习 learning to learn 非对称 非对