极限多标签学习综述（Extreme Multi-label Learning）

2023-11-16

A Survey on Extreme Multi-label Learning

先给地址： https://arxiv.org/abs/2210.03968

博主曾整理过Multi-Label Image Classification（多标签图像分类），但这类任务中所用的数据集往往较小，分类数量并不多。但在更广泛的场景中，标签类别数目可能以百万量级出现，如推荐系统、搜索引擎中等等。如在社交平台上，为用户推荐tag，以自然文本形式出现的tag标签往往是语义广泛的，因此可以被视为是一个多标签学习任务。

任务定义
给定数据X和标签Y，该任务尝试学习一个函数f以映射输入x到y。y的种类通常特别大，通过按照标签y出现的频率进行排序，可以设定阈值 τ \tau τ将标签分为头部标签和尾部标签。

任务挑战
标签数量的众多将导致很多棘手的问题，主要有以下三种

1. Volume。标签数据的增长使输入特征空间和输出标签空间都很大，从而导致可伸缩性问题和存储开销。应对该问题的三个最常见的假设分别是标签独立假设、洛沃兰克假设和层次结构假设（也分别对应着以下三种解决方案）。
1. Quantity。数量是指标签的频率，分布通常是长尾的，即标签的频率分布高度不平衡，这些很少出现的标签却是数据集中的大多数。下图是维基百科和亚马逊的数据集分布，大量的标签呈现出明显的长尾分布。
  
  对尾部标签的泛化是极限多标签学习的核心问题之一。
1. Quality。质量是指注释标签的质量问题。由于标签集和样本量较大，注释每个实例是非常昂贵的，甚至在很多场景中这一部分都是缺失的。

解决方案
应对这三类挑战，也有一些典型的方法被陆续提出，如下图所示。

1. Volume。Model Assumption 可以分为：二值关联方法、基于嵌入的方法和基于树的方法。
1. Quantity。Tail-label Learning 可以分为：鲁棒损失函数、数据增强、知识转移。
1. Quality。Weak Supervision可以分为：零样本学习、缺失样本学习、多实例学习。

在这里插入图片描述

Model Assumption
应对特征空间和输出标签空间大的 Volume问题，Model Assumption 可以分为三个分支：二值关联方法、基于嵌入的方法和基于树的方法。

二进制相关性方法（binary relevance），假设标签是相互独立的，然后为每个标签分别学习一个二进制分类器。实现简单，但二进制相关性的时间和内存复杂性与标签的数量呈线性关系，因此存在较高的计算开销。当然，在这种方法前置一个标签滤波器是一个减少开销的方法。
基于嵌入的方法（embedding-based），利用标签本身的语义性，它们通常假设标签矩阵是低秩的。通常有两种嵌入方法，即线性或非线性投影。线性嵌入以将特征空间和标签空间一起嵌入到某个联合低维空间，通过在该空间计算相似度得到标签预测。在非线性嵌入中，利用图神经网络学习标签之间的非线性关系较为流行。这类将标签也视为特征的做法，也可以缓解尾标签样本数量不足，减少模型的参数数量和训练成本。此类方法最大的缺点在于嵌入过程中信息的丢失。
基于树的方法（tree-based），一般以层次的形式挖掘标签语义，可以大大减少推理时间。通常有两种类型的构树策略：实例树（instance tree-based）和标签树（label tree-based），这取决于在树节点中树分类是按实例或标签进行划分。在实例树中，每个节点由一组训练示例组成，然后逐层分配给子节点，这一点的直觉来源于特征空间的每个区域只包含少量的活动标签。在标签树中，每个节点由一组标签组成，然后将这些标签分配给子节点，一般通过递归的聚类方法来确定分类，直到达到构树的停止条件。基于树的方法的缺点在于，它可能会出现级联效应的影响，即预测误差从顶部传到底部。

在这里插入图片描述

Tail-label Learning
标签的长尾问题是一个重要的统计特征，除了头部特征外，尾部标签在许多现实应用中也十分重要，可以使信息更丰富和有益，如个性化推荐。但是不经常出现的标签（称为尾部标签）比经常出现的标签（称为头部标签）更难预测，特别是传统的方法采取所有标签重要性同等，很容易模型训练在头部标签上表现更好，而对尾部标签的预测性能更差。

为了应对标签长尾的问题，Tail-label Learning 可以分为以下分支：

鲁棒损失函数（Robust Loss Function）。主要通过设计一些损失函数引导模型增加对尾部标签的优先级，从而提高了尾部标签的泛化性能。
数据增强（Data Manipulation）。提高尾部标签性能的另一个简单想法是生成更多的数据，分为扩充数据或增强标签。
知识转移（Knowledge Transfer）。主要通过将知识从一些标签转移到另一些标签，如ECC为每个标签依次训练一个二进制分类器，然后给定每个标签，它使用原始特征和前一个标签分类器的预测来训练分类器。或者DeepXML同时在头部标签和尾部标签上训练两个深度模型，然后将头部标签的语义表示转移到尾部标签模型中。

Weak Supervision
为了解决标注昂贵问题，Weak Supervision被使用最多，主要讨论如何解决缺失标签甚至完全没有标签。缺失标签可以通过观察到的标签进行训练模型并处理缺失的标签。完全没有标签的zero-shot状态可以分为几种形式：

eXtreme Multilabel Learning(XML)。
Generalized Zero-shot Extreme Multi-label Learning (GZXML)。
Few-Shot eXtreme Multi-label Learning(FSXML)。
Extreme Zero-shot eXtreme Multi-label Learning(EZXML)。

未来方向
模型结构：

基于树的结构如何优化切分方式，基于聚类是否是最优？
基于嵌入如何控制过拟合？

长尾问题：

如何划分头部和尾部？目前的划分方法主要通过，设定特定部分为尾部或根据标签频率卡阈值，并没有一个原则的方法。
如何平衡头部和尾部准确率？很多工作展示了两类指标难以同时优化，因此有需要根据特定的XML任务进行权衡。
如何设计尾部标签的损失函数？
如何评估有尾部标签的模型？目前无法清楚地看到头部标签和尾部标签对指标的贡献。

弱监督学习

极端的多实例多标签学习（Extreme multi-instance multi-label learning）。例如，在视频分类中，标签是以视频级别进行标记的，人们可能希望预测视频的每一帧的相关标签。
开放域的极端多标签学习（Open-set extreme multi-label learning）。在许多真实世界的应用程序中，如何应用出现得特别快的新标签，即开放域标签，其除了对已知标签进行分类外，还需要学习开放域标签。
极端的多标签学习与流媒体标签（Extreme multi-label learning with streaming labels）。处理流媒体标签需要对经过训练的模型进行在线更新，目前还没发做的很好。
极端的多标签学习与缺失的标签（Extreme multi-label learning with missing labels）。由于标签空间大，缺少标签的现象很普遍，同时应对尾部标签和看不见的标签非常具挑战性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

极限多标签学习综述（Extreme Multi-label Learning）的相关文章

osgEarth的Rex引擎原理分析（十五）分页瓦片加载器在更新遍历时对请求处理过程

目标十四中的34 osgEarthDrivers engine rex Loader cpp void PagerLoader traverse osg NodeVisitor nv for count 0 count lt merge
Java-基于SSM的智能仓储管理系统

项目背景随着科学技术的飞速发展社会的方方面面各行各业都在努力与现代的先进技术接轨通过科技手段来提高自身的优势智能仓储系统当然也不能排除在外智能仓储系统是以实际运用为开发背景运用软件工程开发方法采用jsp技术构建的一个管理系统
React 项目中添加 react-redux 状态管理

redux作为一个单独的库他可以搭配 Angular vue react以及jQuery使用今天我们再项目中搭配react redux来使用 Redux的核心概念其实很简单将需要修改的state都存入到store里发起一个actio
java中设计思想及设计原则及设计模式解析

前言在java开发过程中或者各种语言在编程过程中对基础知识的累计这其中就会包含java的设计思想及设计原则及设计模式我们想对当前的架构以及某些功能逻辑进行优化及繁简更加适合当前业务的开发如何让人一看就能懂得代码以及各种热门

随机推荐

10071 - Back to High School Physics

Back to High School Physics Time limit 3 000 seconds A partical 电质点 has inital velocity and accerleration 初速度与加速度 If it
SQL6 查找学校是北大的学生信息

描述题目现在运营想要筛选出所有北京大学的学生进行用户调研请你从用户信息表中取出满足条件的数据结果返回设备id和学校示例 user profile id device id gender age university provinc
Linux--消息队列

目录一线程和进程的概念 1 线程 2 进程 3 ipcs 二消息队列代码写消息 man msgget返回值问题添加消息队列 man msgsnd 运行代码运行结果图进程和消息的状态三消息队列代码读消息 b c读取消息执
微信公众号html教程,公众号排版简易教程

微信公众号文章排版流程 1 将文章转换成Markdown格式 2 使用Typora渲染Markdown格式 3 使用印象笔记生成图表流程图时序图等并转换成图片 4 将Markdown格式转换为Html格式 5 将Html格式内容复制
企业微信开始代开发应用配置代开发应用回调URL

用到的php版本是7 4 开发时间 2022 11 2 在做公司的项目时因为企业微信的更新同一个服务器ip不能在多个企业项目中出现否则就会被判定为第三方服务商所以新建应用时只能新建代开发应用在配置回调的时候走了很多坑在这里梳理一下
Dialog DA14585——基本硬件资源配置

GPIO DA14585共有3中类型的封装 WLCSP34pin QFN40pin QFN48pin 除去专用的RST GND XTAL ANT VBAT脚后分别有14 25 32个IO口可用目前最常用的封装类型是QFN40 处理单元
ssh key创建本地和git的安全连接 && ssh key的创建与github/gitlab中ssh key的添加

如未创建ssh key会报该问题 The authenticity of host can t be established Permission denied publickey ssh key的作用创建本地和gitlab的安全连接 S
从特效入手，深入了解CSS（二）：鼠标 hover 特效

不建议跳跃阅读这篇文章将从头开始介绍如何实现一个特效中间偶尔会穿插一些css3或平时接触不多的css属性首先看一看这一期的特效 HTML部分 h1 Hover Me h1 CSS 部分首先通过grid布局的place content
一文搞定java8中的重要特性

文章目录 Lambda表达式函数式接口四大内置函数接口接口的默认方法和静态方法方法引用重复注解更好的类型推断拓宽注解的应用场景 Optional Stream Date Time API Base64 并行数组并发性 JVM
Windows SDK与Platform SDK的区别

原文URL http forums microsoft com MSDN ShowPost aspx PostID 1986681 SiteID 1 概述 Windows SDK已经取代了Platform SDK Platform SDK已
使用Yolov5+Pytorch训练自定义目标检测模型

一简介使用Pytorch Yolov5和OpenCV 完成目标检测模型的训练和部署项目的两个功能 1 Yolov5离线文件夹主要是为了照顾国内的网络环境文件夹不仅包含了https github com ultralytics yo
物联网(java版本)臻识摄像头+本地实时显示视频

部分代码显示 package com xdnnaovideo videoservice listenermessage import com google gson Gson import com xdnnaovideo videoserv
stm32毕设分享 stm32老人跌倒检测预防系统

文章目录 0 前言 1 整体设计 2 硬件电路 3 软件设计 4 跌倒检测算法 5 关键代码 6 最后 0 前言这两年开始毕业设计和毕业答辩的要求和难度不断提升传统的毕设题目缺少创新和亮点往往达不到毕业答辩的要求这两年不断有学弟学妹
最新版的配音软件--- tts-vue 软件下载安装成功过程

目录本次软件是 Loker 制作感谢作者的无私奉献软件视频效果软件图片效果 1 电脑版的tts vue 软件下载链接以及说明 2 tts vue 网站在线转换链接 3 tts vue 软件功能简介截至最新版本已实现的功能安装
gitlab--基础--5.1--CICD--介绍

gitlab 基础 5 1 CICD 介绍 1 什么是CICD 1 1 CI 持续集成 Continuous Integration 1 1 1 持续集成将各个开发人员的工作集合到一个代码仓库中主要目的是尽早发现集成错误使团队更加紧密
关于退出进程的几种方式

创建于 2012 08 27 迁移自个人的百度空间 HUP 是让进程挂起睡眠 kill 杀掉进程 term 正常的退出进程 kill HUP pid pid 是进程标识如果想要更改配置而不需停止并重新启动服务请使用该命令在对配置文件
深入理解MyBatis一级缓存和二级缓存【超详细源码解析】

视频地址 https www bilibili com video BV1nP411A7Gu MyBatis的缓存是一个常见的面试题一级缓存的作用域为何是 sqlSession 二级缓存的作用域为何是 mapper 怎么理解一二级缓存
Go实现单例模式

非线程安全的单例模式 type Singleton struct var instance Singleton func GetInstance Singleton if instance nil instance Singleton re
【待续】【UE4笔记】 L10地形编辑器

一地形界面包含了管理雕刻和描画功能 1 创建新项 2 雕刻改变地形高度顶点位置 3 描画分层地形材质二编辑样条调节参数添加材质效果如下
极限多标签学习综述（Extreme Multi-label Learning）

A Survey on Extreme Multi label Learning 先给地址 https arxiv org abs 2210 03968 博主曾整理过Multi Label Image Classification 多标签图

极限多标签学习综述（Extreme Multi-label Learning）

A Survey on Extreme Multi-label Learning

极限多标签学习综述（Extreme Multi-label Learning） 的相关文章

随机推荐

热门标签

极限多标签学习综述（Extreme Multi-label Learning）的相关文章