论文阅读 AutoML: A Survey of the State-of-the-Art

2023-11-17

论文阅读 AutoML: A Survey of the State-of-the-Art

摘要

简介

从两个角度介绍NAS。首先是模型的结构,常见的结构包括整体结构、基于单元的结构、层次结构和基于态射的结构等。其次是模型的超参数优化(HPO)。常用的方法有强化学习、进化算法(ea)和梯度下降(gd)、贝叶斯优化等。除了NAS,automl还涉及到其他已经研究了很长时间的技术,我们根据机器学习流水线将这些技术分为以下几类,:数据准备、特征工程、模型生成和模型评估。
文章贡献

  • 从机器学习整个流水线介绍AutoML
  • 介绍比较NAS算法
  • open problems

数据准备

–数据收集

  • 数据综合:数据扩展:数据扭曲和合成过采样;对抗网络生成
  • 数据搜索:标签不够:主动学习选择最“不确定”的未标记的单个示例,要求人类标记,然后它将迭代地标记其余数据。为了将人从标签中抽离出来,进一步加快标签过程,提出了许多半监督学习自标签方法,可归类为self-training, co-training, co-learning。数据不平衡问题:SMOTE技术(Synthetic Minority Over-Sampling Technique ),生成新数据替代对大规模的数据的上/下采样。

–数据清洗

标准化、缩放、编码
图片自标注

特征工程

–特征选择

减少不相关和冗余特征。
特征选择搜索策略可分为:完整、启发式、随机。
特征子集评分方法可分为:过滤方法(散度/相关性+阈值),wrapper(分类精度),embedding

– 特征构造

–特征提取

降维

模型生成

–NAS模型结构

从一个搜索空间选择模型组件。搜索空间通常预定义。操作可以大致分为卷积、池化、连接、元素加法、跳过连接等。操作参数通常也是预定义的。
代表性结构:

  • 整体结构:需要大量资源寻找最佳结构,并且可移植性差。
  • 基于单元的结构:找到cell然后将cell堆叠
  • 层次结构:
  • 基于网络形态的结构:将现有神经网络中的信息转换成新神经网络。

–NAS超参数优化

  • 网格 随机搜索:网格搜索缺点是会搜索不重要的参数。改进:先进性粗搜索找到大致区域再进行精细搜索。
    hyperband算法权衡时间和性能,改进随机搜索的缺点。
  • 强化学习:基于强化学习的算法包括两部分 1、RNN控制器每代产生新的子网络 2、奖励网络 训练评估子网络并更新控制器。缺点是计算资源大。NasNet、BlockQNN和ENAS对计算资源消耗有所提升。
  • 进化算法:EA是基于种群的元启发式优化算法。不同的基于EA的参数优化方法可能使用不同的编码方案表示网络,分为直接和间接编码方案。间接编码指定用于构建网络的生成规则,并允许更紧凑的表示。进化算法包括:选择、交叉、编译、更新。
    选择包含三种策略:适应度、排序选择、锦标赛选择。交叉方法和编码方式有关
  • 贝叶斯优化:在网格搜索或进化算法搜索中,性能计算是独立的,性能较差的区域会被反复测试。贝叶斯优化构造目标函数的概率模型,使用概率模型选择超参数。Sequential model-based optimization(SMBO)是贝叶斯优化的一种简介形式。在这里插入图片描述
    X是搜索空间,D是采样的样本,M是模型。
    根据概率模型,贝叶斯优化可分为高斯过程、树参数估计、随机森林。
  • 梯度下降:

模型评估

一般方法是收敛后看结果,但是需要耗费资源。几种加快模型评估的方法:

  • 低保真度:减少数据量或低分辨率 ,减小模型大小
  • 迁移学习:共享参数等
  • 代理:基于代理的方法是近似于黑箱函数的另一个有力工具。
  • searly stop

NAS性能总结

Open Problem

  • 完整AutoML流水线
  • 可解释性
  • 可复制性
  • 灵活的编码:生成新的原语操作(如卷积、池化)
  • 更多领域
  • 终身学习:使用元学习(meta-learning)加快网络结构的搜索过程
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文阅读 AutoML: A Survey of the State-of-the-Art 的相关文章

随机推荐

  • Java中map集合,你真的了解吗?

    在Java编程中 map集合是一个非常重要的数据结构 它可以存储键值对 并且可以根据键快速查找对应的值 今天 我们就来详细介绍一下Java中的map集合 首先 让我们来了解一下map集合的基本概念 在Java中 map集合是一个接口 它有多
  • padding的四个参数_Google Flutter 布局(二)-Padding、Align、Center详解

    1 1 简介 Padding在Flutter中用的也挺多的 作为一个基础的控件 功能非常单一 给子节点设置padding属性 写过其他端的都了解这个属性 就是设置内边距属性 内边距的空白区域 也是widget的一部分 Flutter中并没有
  • 深入理解Java——从入门到精通

    标题 深入理解Java 从入门到精通 Java是一门广泛应用于软件开发领域的高级编程语言 它的特点包括强大的跨平台性 面向对象的编程范式 丰富的类库以及良好的安全性 无论是在企业级应用开发 移动应用开发还是嵌入式系统开发中 Java都扮演着
  • [分享]如何使用Angular中的自定义校验器

    在Angular的开发中表单是必不可少的 由此引出的表单校验也是万万不可缺少的 解决方法一 全部使用ngModel 双向绑定数据 在最后的submit点击时进行所有表单的校验 这样做固然没有什么问题 而且代码写的也和我们之前使用jQuery
  • 单元格法近似求解多边形最大内接矩形问题【思路讲解+java实现】

    文章目录 问题描述 问题解决方案 多边形网格化 区分每个单元格是在多边形内部还是外部 根据已标记单元格寻找最大内接矩形 剪枝优化 多角度旋转 案例测试 代码实现 说明 问题描述 给定一个多边形的点集 希望找出多边形内部面积最大的矩形 该问题
  • SPI机制是什么?

    一 SPI机制是什么 spi全称为 Service Provider Interface 是JDK内置的一种服务提供发现机制 SPI是一种动态替换发现的机制 一种解耦非常优秀的思想 spi的工作原理 就是ClassPath路径下的META
  • 已知三角形三边长怎么求面积_已知三角形三边求面积的公式——海伦公式

    海伦公式又译作希伦公式 海龙公式 希罗公式 海伦 秦九韶公式 传说是古代的叙拉古国王希伦 Heron 也称海龙 二世发现的公式 是一个利用三角形的三条边长直接求三角形面积的公式 下面我们利用初中的知识进行推导 注意 公式推导过程的方法比公式
  • BigDecimal:比double更精确的小数类

    BigDecimal概述 BigInteger是Number的子类 它用来对超过16位有效位的数进行精确的运算 双精度浮点型变量double可以处理16位有效数 在实际应用中 需要对更大或者更小的数进行运算和处理 float和double只
  • Wordpess百度自动推送代码

    直接将代码中的token换成百度站长中自己的即可 将下列代码放入functions php中就行了 WordPress 百度快速收录 API 提交代码 if function exists Baidu Submit function Bai
  • 操作系统实验进程调度模拟

    操作系统实验 实验一 实验1 基于优先数的时间片轮转调度算法调度处理模拟程序设计 一 实验目的 1 对进程调度的工作做进一步的理解 2 了解进程调度的任务 3 通过编程掌握基于优先数的时间片轮转调度算法具体实现过程 二 实验内容及实验要求
  • 遗传算法的实现

    请用遗传算法实现如下最大化问题 首先先来学习下 遗传算法的本质和过程 遗传算法是计算数学中用于解决最佳化的搜索算法 是进化算法的一种 进化算法最初是借鉴了进化生物学中的一些现象而发展起来的 这些现象包括遗传 突变 自然选择以及杂交等 遗传算
  • C#关键字 abstract,override,virtual的用法

    什么是抽象类 abstract关键字修饰的类称为抽象类 抽象类不能被实例化 抽象类是派生类的基类 关键字 abstract 语法 public abstract class 类名 1 一个抽象类可以同时包含抽象方法和非抽象方法 但不能实例化
  • IDEA工具快捷键---补全返回值

    Ctrl alt v 自动提示
  • 接口测试开发之:一篇搞懂 Cache、Cookie及Session的爱恨情仇

    Cashe Cookie与Session 1 引言 2 Cache 2 1 缓存定义 2 1 1 缓存概念 2 1 2 缓存优点 2 2 浏览器缓存 2 2 1 存储路径 2 2 2 缓存优点 2 2 3 缓存弊端 2 2 4 原理图 2
  • 【习题三】【数据库原理】

    文章目录 一 单选题 二 填空题 一 单选题 1 X Y能从推理规则导出的充分必要条件是 正确答案 B 2 设有关系模式R A B C D E 函数依赖集F A B B C C D D A AB BC AD 是R上的一个分解 那么分解 相对
  • [1143]Flink的Checkpoint和Savepoint

    文章目录 Flink的Checkpoint和Savepoint介绍 第一部分 Flink的Checkpoint 1 Flink Checkpoint原理介绍 2 Checkpoint的简单设置 3 保存多个Checkpoint 4 从Che
  • C++面试题(四)——智能指针的原理和实现

    C 面试题 一 二 和 三 都搞定的话 恭喜你来到这里 这基本就是c 面试题的最后一波了 1 你知道智能指针吗 智能指针的原理 2 常用的智能指针 3 智能指针的实现 1答案 智能指针是一个类 这个类的构造函数中传入一个普通指针 析构函数中
  • vimium使用

    vimium使用 2019 03 07 22 16 by 轩脉刃 阅读 评论 收藏 编辑 vimium使用 chrome下面的vimium插件已经慕名已久 迟迟没有做尝试 今天在家有空就熟悉了一下vimium 感觉还是棒棒的 记录一下一些使
  • 《面试准备》中兴2018笔试题

    include
  • 论文阅读 AutoML: A Survey of the State-of-the-Art

    论文阅读 AutoML A Survey of the State of the Art 摘要 略 简介 从两个角度介绍NAS 首先是模型的结构 常见的结构包括整体结构 基于单元的结构 层次结构和基于态射的结构等 其次是模型的超参数优化 H