极限学习机(Extreme Learning Machine,ELM)详解

2023-05-16

ELM

ELM的提出目的是为了解决人工神经网络训练时耗费的时间和高成本。对此,2004年由南洋理工大学的黄广斌提出了ELM学习理论

机器或者生物学习可以不需要调整隐层节点:给定任何连续目标函数或者可分类目标,只要前馈神经的隐层节点是非线性阶段连续的,神经网络无需调整隐层节点就能任意逼近目标连续函数或者对分类目标加以区分。

ELM考虑的主要问题在于高泛化能力、尽可能少的人工干预以及实时学习
在这里插入图片描述
i i i个隐层节点的输出方程为
h i ( x ) = G ( a i , b i , x ) h_{i}(x)=G\left(a_{i}, b_{i}, x\right) hi(x)=G(ai,bi,x)

最后再根据任务是做分类还是回归,单分类还是多分类来进行加权求和得到输出结果
f ( x ) = ∑ i = 1 L β i G ( a i , b i , x ) = β H f(x)=\sum_{i=1}^{L} \beta_{i} G\left(a_{i}, b_{i}, x\right)=\beta H f(x)=i=1LβiG(ai,bi,x)=βH
对于有 N N N个批次的样本 x i x_{i} xi,目标函数就是使得 m i n ∣ ∣ f ( X ) − T ∣ ∣ m i n ∣ ∣ f ( X ) − T ∣ ∣ m i n ∣ ∣ f ( X ) − T ∣ ∣ min||f(X) - T|| minf(X)Tminf(X)T,最小化损失函数
E = ∑ i = 1 N [ f ( x i ) − t i ] 2 E=\sum_{i=1}^{N}\left[f\left(x_{i}\right)-t_{i}\right]^{2} E=i=1N[f(xi)ti]2
传统的梯度下降不断迭代就可以调整所有的参数,但在这里 H H H是固定的,以训练过程只需要求解方程 β H = T β H = T β H = T β H = T \beta H = TβH=T βH=TβH=TβH=T中的输出权重即 β ^ = T H − 1 \hat{β}=TH^{-1} β^=TH1

OS-ELM(Online Sequential ELM)

因为ELM是一种 batch based 的算法,所以这就意味着在训练阶段,它需要获得所有的训练数据,然后 train then test,而不是随着新数据的到来在线更新。所以黄广斌教授的团队又提出了在线顺序超限学习机算法,用于在线学习并更新网络参数,OS-ELM具备了ELM的速度和泛化能力上的优点,并且可以随着新数据的到来不断更新模型,而不是重新训练模型。
OS-ELM分为两个部分,

  • 第一部分为通过少量的训练样本,利用ELM算法计算并初始化输出权重 β 0 \beta_{0} β0
    ​- 第二部分开始在线学习,每次当一个新的数据样本到来时,通过一个递推公式得到新的输出权重 β 1 \beta_{1} β1,从而实现在线且快速的训练
    在这里插入图片描述
    参考:
  • A Fast and Accurate Online Sequential Learning Algorithm for Feedforward Networks

https://blog.csdn.net/FrankieHello/article/details/89949004

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

极限学习机(Extreme Learning Machine,ELM)详解 的相关文章

随机推荐

  • TensorFlow、Python、CUDA版本对应及下载链接

    关于版本对应 xff0c 官网很详细了 xff1a https tensorflow google cn install source 偷个懒 xff0c 我就把截图放这里吧 xff1a 1 Windows xff1a 2 Linux 和
  • 表格驱动编程在代码中的应用

    1 毕业设计中的使用 第一次使用表格驱动编程 xff0c 是在大学毕业设计的时候 做一个LL 1 的词法分析程序 xff0c 需要读取终结符 非终结符 以及推导公式 程序会根据以上信息生成FIRST集合和LAST集合 xff0c 然后根据递
  • 【嵌入式环境下linux内核及驱动学习笔记-(9-内核定时器)】

    目录 1 时钟tick中断等概念2 延时机制2 1 短延时 xff08 忙等待类 非阻塞害 xff09 2 1 1 ndelay 忙等待延迟多少纳秒2 1 2 udelay 忙等待延迟多少微秒2 1 3 mdelay 忙等待延迟多少毫秒 2
  • 【嵌入式环境下linux内核及驱动学习笔记-(10-内核内存管理)】

    目录 1 linux内核管理内存1 1 页1 2 区1 2 1 了解x86系统的内核地址映射区 xff1a 1 2 2 了解32位ARM系统的内核地址映射区 xff1a 2 内存存取2 1 kmalloc2 1 1 kfree2 1 2 k
  • 力扣刷题常用的c++库函数

    文章目录 1 xff0c max和min1 max函数2 xff0c min函数 2 xff0c sort函数sort 函数和lambda表达式 3 xff0c reverse 函数1 reverse函数可以反转一个字符串2 反转字符数组3
  • STM32学习(4)串口实验

    串口设置的一般步骤可以总结为如下几个步骤 xff1a 串口时钟使能 xff0c GPIO 时钟使能串口复位GPIO 端口模式设置串口参数初始化开启中断并且初始化 NVIC xff08 如果需要开启中断才需要这个步骤 xff09 使能串口编写
  • 【Docker】 入门与实战学习(Docker图形化工具和Docker Compose)

    文章目录 前言Docker图形化工具1 查看portainer镜像2 portainer镜像下载3 启动dockerui容器4 浏览器访问5 单机版Docker xff0c 直接选择Local xff0c 点击连接6 使用即可 Docker
  • 第三天_DOM

    第三天 Web APIs 学习目标 xff1a 能够使用removeChild 方法删除节点 能够完成动态生成表格案例 能够使用传统方式和监听方式给元素注册事件 能够说出事件流执行的三个阶段 能够在事件处理函数中获取事件对象 能够使用事件对
  • MySQL知识点整理汇总

    文章目录 前言一 数据库与SQL1 数据库与数据库管理系统2 关系数据库3 MySQL语句的种类4 MySQL语句的基本书写规则 二 MySQL语句的两大顺序1 MySQL 语句的书写顺序2 MySQL 语句的执行顺序 三 表的创建 删除与
  • 麦克科马克

    这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题 xff0c 有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中 居左 居右SmartyP
  • ROS-创建工作空间与功能包

    这里写目录标题 一 工作空间的组成与结构二 创建工作空间三 创建功能包四 设置环境变量五 功能包的package xml文件和CMakeLists txt文件 一 工作空间的组成与结构 工作空间的组成 xff1a src用于存放功能包源码
  • 「NeurIPS 2020」基于局部子图的图元学习

    点击蓝字 xff0c 设为星标 NeurIPS 2020 的接收论文 Graph Meta Learning via Local Subgraphs xff0c G META 是第一个使用局部子图来进行元学习的模型 Graph Meta L
  • Keras:Input()函数

    目录 1 Keras Input 函数 2 函数定义 xff1a 3 参数解释 4 例子 1 Keras Input 函数 作用 xff1a 初始化深度学习网络输入层的tensor 返回值 xff1a 一个tensor 2 函数定义 xff
  • JDBC入门笔记

    目录 1 xff0c JDBC概述 1 1 JDBC概念 2 xff0c JDBC快速入门 Java操作数据库的流程 2 1 编写代码步骤 3 JDBC API详解 3 1 DriverManager 3 2 Connection 3 2
  • 对抗样本入门详解

    文章目录 对抗样本基本原理对抗样本的发生对抗样本防御难在哪里对抗训练隐藏梯度defensive distillation 对抗样本的生成对抗样本生成方法介绍利用GAN生成对抗样本利用FGSM生成对抗样本代码复现 xff08 基于mnist
  • white/black-box attack(黑盒白盒攻击基础)

    基本概念 攻击方法分类标准 xff1a 假正性攻击 false positive 与伪负性攻击 false negative 假正性攻击 xff1a 原本是错误的但被被攻击模型识别为正例的攻击 eg 一张人类不可识别的图像 xff0c 被D
  • KL散度公式详解

    目录 文章目录 Jensen 39 s inequality讲解KL散度 xff08 又名relative entropy xff09 mutual information Jensen s inequality f x
  • 元学习算法MAML论文详解

    论文信息 题目 xff1a Model Agnostic Meta Learning for Fast Adaptation of Deep Networks 作者 xff1a Chelsea Finn 伯克利大学 xff0c Pieter
  • PINN内嵌物理知识神经网络入门及文献总结

    喜欢可点赞关注 xff0c 并收藏 xff0c 您的支持就是我的写作的动力 文章目录 一 PINN介绍二 物理信息驱动深度学习动手编程教程三 物理信息驱动深度学习方法几点讨论四 相关论文1 定义问题 建立工程架构2 网络结构选择3 不确定性
  • 极限学习机(Extreme Learning Machine,ELM)详解

    ELM ELM的提出目的是为了解决人工神经网络训练时耗费的时间和高成本 对此 xff0c 2004年由南洋理工大学的黄广斌提出了ELM学习理论 机器或者生物学习可以不需要调整隐层节点 xff1a 给定任何连续目标函数或者可分类目标 xff0