神经网络如何学习到加法等算法 - 神经编码器-解释器(Neural Programmer-Interpreters)

2023-05-16

算法的本质

    何为算法(algorithm)?

    从狭义来讲,算法是计算机科学里面的概念,简单来说,所谓算法就是定义良好的计算过程,它取一个或者一组值作为输入,并产生出一个或一组值作为输出。亦即,算法就是一系列的计算步骤,用来将输入数据转换成输出结果[1]。

    从广义来讲,算法是从初始态到可达目标态的序列过程。

    如:命令机器人拿起一个瓶子,那么算法就是从机器手中没有瓶子到不断修正自己机器手到拿起一个瓶子的动作过程。而这些动作和程序没有本质的区别,都是序列化过程。假如我们将拿起瓶子的动作简化为基本的形式:Left,Right,Top,Down,Forward,Backward,OpenHand,CloseHand,这些动作的参数都为T,即持续时间,且简单的做匀速运动。那么机器人拿起瓶子这样的动作过程就可以概括为这些动作的组合序列过程,我们如果定义整个组合序列过程集合即机器人动作空间,那么这个算法就是找到这样一个或者多个子动作空间使机器人拿起瓶子。

神经编码器-解释器

    本质上算法程序就是序列过程,但是通常算法程序都是人类写的。因为人工智能的发展,机器变得越来越智能,越来越能做很多事情,所以这里就有一个有趣的问题:如果机器能够学会了写出自己的算法并改变自身的算法,那么机器是否就拥有了自我进化的能力?

    我们知道任何复杂的事物或概念C都必然由比他自己更简单的事物或概念S构成,如果S不能再分解为比自己更简单的东西,那么S就是C的一个因子,如果C=S那么C不能被分解。以自然数为例:0,1,2,3...任何自然数(排除0以外)必然可以由一个或者多个素数相乘得到,而素数无法被分解为除自身与1相乘的任何自然数相乘的形式,所以任何素数构成得到任何自然数(排除0以外)的乘法因子。同理,加法中任意个0与1可以相加构成任何的自然数,所以0与1构成任意自然数的加法因子。

    由上,为了学习C我们可以先学习S,同样可以递归的找到学习C的所有因子。这和人类相似,我们学习概念也是从简单的开始,然后学习由简单概念构成的复杂概念,尤其在数学上,如果基本的自然数加减乘除都不会的话,自然无法学会更高级的线性方程。这也是我们常说的基础很重要的原因,因为复杂的东西由基础的东西构成。这个在自然语言中也呈现出简单到抽象的层次结构。

     神经编码器-解释器(Neural Programmer-Interpreters,NPI)的思想和上面的类似,即我们可以先学习简单的算法,如:自然数加法,文本替换等,然后学习复杂的算法。在神经编码器-解释器之前,就有很多论文阐述如何学习加法的机器学习算法,如:神经图灵机(Neural Turing Machine),等等,还有最近Facebook发表的用强化学习来训练机器学习简单算法。

     下面根据论文来叙述该算法的思想。NPI由三个可学习组件,即:一个任务未知的递归核心,一个持久的键值对程序内存和特定领域的编码器组成。其中该论文中的递归核心是以LSTM为基础的序列模型。下面是架构图:

前馈过程

   

   

   

   其中:

    为时间 的原始环境状态, 为函数参数, 为编码后的状态, 为特定领域的编码器(函数),

   为程序或程序动作, 为LSTM的内部隐藏状态, 输出状态,为多层感知机(MLP)和LSTM-Core构成的递归网络函数

   为是否终止程序的概率, 为嵌入程序的键(key), 为下一个时间的参数值,皆为解码器

    为下一时间的环境状态,只是环境变化函数,并不是我们计算得到的,而是环境生成的。

加法计算过程

    加法计算过程如下图:

               

    整个加法是在一个表格中进行,其中第1,3,5,7行为指针可达位置,其他行为数字行,红色的箭头为指针,红色的箭头只能左右移动即:LEFT,RIGHT,而这些移动即我们的子程序,ADD,ACT...也是子程序或者叫因子程序。而指针指向的位置为他下面的格子。上面过程为第一个执行ADD1,产生下一个程序WRITE和两个参数,即位置为第4个指针行的指针所指位置(即第8行,第5列,下同)及得到的值2;然后执行并产生程序ADD1等等,都差不多不细讲。其中CARRY为进位程序,ACT是一个综合简化程序,WRITE为写入数字到表格。当然还有其他程序过程,这里只列举了加法。

训练

    训练主要通过运行的轨迹即:这个时间步的输入和应该的输出来监督式训练。最优参数通过下面的公式获得:

    而代价函数为:

    其中单步条件概率可以因子化为以下的和:

    通过梯度上升法,求解最优参数集。 其他问题可参考[2]。

总结

    有人说自然数加法很简单,实际上对于研究人工智能的人而言未必是简单的,因为我们不仅仅要知道是什么,更要知道为什么,往往简单的东西是难以说清楚的比如:1+1为什么等于2,很难说清楚,当然这是皮亚诺公理的内容。自然数加法的基础公理是大学数学分析才学的,相对的自然数加法则是小学数学的内容,所以what和why的层次有巨大的区别。在人工智能中自然数加法如果用回归逼近的方法来做只能得到近似解,而不能得到精确解,这个是有很大差别的。

参考:

 1. Thomas H.Cormen、Charles E.Leiserson、etc,Introduction to Algorithms

 2. Scott Reed 、Nando de Freitas,Neural Programmer-Interpreters

 3. Neural Programmer-Interpreters 动画演示

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络如何学习到加法等算法 - 神经编码器-解释器(Neural Programmer-Interpreters) 的相关文章

  • HAL库的串口基础学习(包含串口接收不定长数据的实现)

    HAL库的串口基础学习 xff08 1 xff09 HAL库有一个特点就是对于许多外设的初始化以及功能操作 xff0c 都提供有一个weak版本的函数 xff0c 这是充分的展现出库名字的含义 xff08 Hardware Abstract
  • 解决头文件相互包含问题的方法

    所谓超前引用是指一个类型在定义之前就被用来定义变量和声明函数 一般情况下 xff0c C C 43 43 要求所有的类型必须在使用前被定义 xff0c 但是在一些特殊情况下 xff0c 这种要求无法满足 xff0c 例如 xff0c 在类C
  • 101. 对称二叉树

    101 对称二叉树 给定一个二叉树 xff0c 检查它是否是镜像对称的 例如 xff0c 二叉树 1 2 2 3 4 4 3 是对称的 1 2 2 3 4 4 3 但是下面这个 1 2 2 null 3 null 3 则不是镜像对称的 1
  • code

    class Solution public void push int node stack1 push node int pop int temp while stack2 empty while stack1 empty temp 61
  • c++ unordered_map

    include lt iostream gt include lt unordered map gt int main simple comparison demo std unordered map lt int char gt exp
  • opencv 打开网络摄像头

    闲着没事从同学那里找到了个openwrt xff0c 突然间想起来OPENCV可以很轻松的打开自带的摄像头 xff0c 刚开始学习OPENCV 打开过若干次笔记本的摄像头 xff0c OPENCV能否打开网络摄像头呢 xff1f 在百度上搜
  • opencv 识别网球 ,或者绿色的小球 输出重心坐标

    void image process IplImage image int iLowH 61 26 int iHighH 61 69 int iLowS 61 42 int iHighS 61 206 int iLowV 61 0 int
  • linux 下面如何安装Eigen

    linux 下面如何进行安装 Eigen 1 安装 xff1a sudo apt get install libeigen3 dev 2 调整 xff0c 默认安装路径是 xff1a usr include eigen3 cd usr in
  • matlab 怎么把二维数组画出三维的图像出来

    最近要用到matlab 来进行可视化显示以下数据 xff0c 把数据导入matlab 之后 是二维数组的数据 xff0c 想以数组的x和y 分别为x 和y 轴 xff0c 然后以数组相对应的数据为z 轴 xff0c 然后进行画图显示 cle
  • C++ 怎么批量读取多个文件

    C 43 43 怎么批量读取多个文件 char szName 100 61 39 0 39 sprintf szName 34 training wall clouser wall d pcd 34 j num wall 格式化输出文件名
  • ros 下面同步相机和IMU 两个topic

    This file is used for collecting data fromm imu and camera at the same time One camera and one imu include lt ros ros h
  • 线程和进程的区别与联系以及单线程多进程与单进程多线程的区别

    线程和进程 概念 进程 xff08 process xff09 xff1a 是指具有已一定功能的独立程序 xff0c 是系统资源分配的基本单位 xff0c 在内存中有其完备的数据空间和代码空间 xff0c 拥有完整的虚拟空间地址 一个进程所
  • QgraphicsScene类

    概述 QgraphicsScene类为管理大量的2D图形item提供了一个管理界面 xff0c 做为item的容器 xff0c 它配合使用QgraphicsView使用来观察items 例如线 xff0c 矩形 xff0c 文本或者自定义的
  • 最好的 Curl 学习指南,强烈建议收藏!

    来自 xff1a 阮一峰的网络日志 链接 xff1a http www ruanyifeng com blog 2019 09 curl reference html 简介 curl 是常用的命令行工具 xff0c 用来请求 Web 服务器
  • TCP超时与重传

    1 TCP重传 A 基于时间信息 设置RTO xff1a tcp协议对超时报文的处理响应比较剧烈 xff0c 如 xff1a i 基于拥塞控制机制 xff0c 减小发送窗口大小 限窗 xff1b ii 当一个重传报文段被再次重传时 xff0
  • tcpdump参数用法详解

    一直在linux下开发的人一定会用到tcpdump xff0c 下面就是关于tcpdump的使用方法说明 1 tcpdump的选项 a 将网络地址和广播地址转变成名字 xff1b d 将匹配信息包的代码以人们能够理解的汇编格式给出 xff1
  • 学习图像处理知识---EmguCV3.4图像ArUco Marker Detection--DetectorParameters 结构体

    好久没有更新了图像处理 ArUco Marker Detection 种汉明 海明 码的格子图 用于相机 相机姿态估计之标记检测 在Emgu CV Aruco Namespace 命名空间中 重要的检测结构体DetectorParamete
  • 仿真导航中2d Nav Goal后小车不能到达目标点

    古月老师的课程我在进行仿真导航过程中 xff0c 遇到了小车不能到达我在rviz中指定的2d Nav Goal的目标点 xff0c 并且反复震荡的问题 解决方法如下 xff1a 模型参数里左右轮参数搞反了 xff0c 互换一下即可
  • 超声波传感器测距原理

    超声波 ultrasonic waves xff1a 人类耳朵能听到的声波频率为20HZ xff5e 20KHz 当声波的振动频率大于20KHz或小于20Hz时 xff0c 我们便听不见了 因此 xff0c 我们把频率高于20000赫兹的声
  • stm32串口中断收发数据环形缓冲区的设计

    cpp view plain copy Function Name USART2 IRQHandler Description This function handles USART2 global interrupt request In

随机推荐