从Bengio的NPS模型看AGI的实现通路

2023-11-16

来源：混沌巡洋舰

这两天深度学习祖师Yoshua Bengio 的 Neural Production System 刷新了AI圈子。与以往的深度学习套路不同的是，这篇文章有效的把符号主义AI对人类认知的模拟与深度学习结合，得到了一个能够学习规则的神经机器。

我们先来看下这个框架的总体思路。什么是规则？其实在计算机诞生之初，规则就是一系列的if else表达式，当某种条件激活，产生某个行为最终达到某个效果，比如如果天气太冷多穿衣服就暖和了。人类的知识大多可以表达成这种形式（实体经由某个动作得到某个结果）。与之相应的是一阶逻辑和因果，这个过程是学习到一些抽象规则，然后在具体的案例中将实体和规则匹配得到。比如亚里士多德是人，人是动物会死亡，所以亚里士多德会死这样的关系，或者果汁是一种饮用液体（可以解渴），因此喝果汁可以解渴这种。也就是对实体和类属性进行绑定，然后通过类属性关联的逻辑法则，将两者有效绑定。最后实现一个推理的过程（演绎法，状态-规则-动作-状态迭代循环）。

这是人类认知推理过程最基本的步骤。过去的专家系统模型，以文中讲到的production system为代表，就是对这样的认知流程的机械模拟，把它们写成程序套进去，但是很快发现这件事是走不通的，因为存在太多的例外，通过对人类已知的规则进行穷举如同数清天上的星辰。而且并非所有的问题尽可以由显示的规则描述。

深度学习兴起之后，人类的直觉感知能力能够被机器模拟，从而使得没有被计算机世界囊括的大量数据插上了数字化的翅膀，如图像，音频。其实本质上深度学习实现了信息的翻译流程（例如分类器的结果就是将图像这类感知信息语义化）。但是同时，深度学习一直缺失符号化的一些核心能力，比如所谓的利用逻辑规则进行推理的能力。一种最基本的方法是把感知符号化（分类器）的结果加上人工规则，比如人脸识别后的结果送到人物数据库搜索罪犯的系统-决定某人是否可以坐火车。而通过神经网络来实现规则学习的最接近的应该是GNN图神经网络，它可以学习实体节点和实体节点的相互作用法则并推理，比如推测化学分子的性质。但是图神经网络有个巨大的问题是它依然依赖已经符号化的实体，然后在这些实体间构建关系。而bengio的新工作则利用了一种80年代出现的专家系统的思想，为它们插上神经网络的翅膀，从而使得逻辑规则是可以学习的。

事实上神经符号主义的最大问题是，符号化的痕迹太重，而失去了神经系统的灵活性，太轻，很难学到规则。而bengio怎么掌握这个火候呢？神经网络最擅长的是做模式识别，它巧妙的利用了变量绑定（variable binding）的思想，把逻辑规则和实体相分离，然后用类似注意力的机制学习哪些逻辑规则应该匹配哪些实体。这样，我们既不要强迫在感知数据里提取符号实体的类型，也不需要强迫规则的模式，一切都是神经网络浑然天成学到。

我们来看怎样一个浑然天成，首先如果用神经网络这样的矩阵乘加来表达。这里需要关注的是如何得到规则的神经表示，假定规则是某种图的形式，那么它必然是一个稀疏的有向图，因为规则关系往往有几个核心的点：

1，规则往往是稀疏的，规则中出现的实体数量往往很少，当规则的激活条件达到，某种行为被启动。

2，规则是抽象的，从而保证范化能力。如果一个规则适应的是非常特定的实体比如某个人。

3，规则往往是非对称的，体现因果性。

这样的规则是专家系统的底座，这个把上述模式转化为神经算子的过程就是NPS框架的基本功劳了。

那么我们看下这个NPS是怎么说的？

1，基于用entity extraction module 提取感知信息中的实体信息，这一步类似用自注意力机制选择需要被关注的实体。

2，由于NPS旨在模拟实体和实体相互作用稀疏规则，因此需要用注意力机制选择primary slot和rule，也就是规则中的主体和所对应的法则。这一步涉及rule selector，也就是到底哪条规则被触发是由神经网络表示。类似于天下雨要带雨伞，天晴要带遮阳伞这种if else 表示。

3，有了规则主体和规则，进一步选择context slot，这对应规则里面出现的另一个对象（从而构成相互作用的一对实体，比如加数和被加数），最终得到完整rule的表达式（由一个多层神经网络MLP表示）。这个选择过程不是一步完成而是分成primary和context slot 本质上做到了对非对称规则的拟合。

4，迭代，多步使用类似的rule的执行机制实现推理目标。

大家注意到这种框架的关键成功之处，是在框架的建设中合理运用稀疏性，对称性这种底层的先验偏置，而非直接使用符号，并通过这些偏置诱导神经符号的产生，这符合bengio一段时间里的长期思路，例如RIM（recurrent independent mechansim 把独立因果规则的先验转化为神经算子），这种范式应该是当下具有普遍性的统一连接主义和符号主义人工智能的方法。如果我们不是采用这种方法而是直接将实体用人工构建的规则相关联，也就回到了旧有知识图谱+规则的方法，就不会那么灵活。

以下的例子就是很好的对上述过程的解释。我们学习一个对Minist手写数字进行各种常规非常规操作的rule，比如旋转，平移，每个rule展开都是一个MLP。通过这个规则的匹配选择，我们会得到一个手写数字的神经操作系统。

另一个更好的例子是物理系统，这里面包含三个不同形状的实体，实体的重量不同，规则就是重的撞轻的轻的会飞。这是在物理碰撞背后的因果关系，而这种关系是可以通过下面的有向无环图体现的。注意这里的物理关系以因果关系的一般形式体现而不是牛顿作用力那种相互关系的形式。只要学到了这种微观的两两因果关系，就可以进一步的通过把整个时间过程进行拆解，在每个时刻仅仅关注相互作用的物体而达到预测整个物理系统的效果。

那么这种方法是否也是一个走向通用人工智能的道路呢？我想这确实部分的接近了事实的真相。因为作为AGI框架首先要体现出人类经过进化和文明得到的符号本体网络，也就是如世间万事万物的知识树，通过DALLE等transformer框架，可以想象如何诱导出这样一棵知识树。也就是通过预训练，引导整个符号体系的生成。而另一方面，在具备了成体系的符号系统后，必然的需要让AI系统具备和人一样的在符号层面进行逻辑推理的能力。这种能力就来源于类似NPS的形式，把符号或因果中的结构先验提取出来，我们可以称之为元结构（meta structure）- 产生其它结构的结构，然后训练基于这些meta structure的神经网络，得到规则表征的神经网络。因为人类常用的meta structure是可以穷举的，比如时空拓扑，因果，逻辑，因此这一类meta structure 的训练并不是无数个，而是有限的数量。由此可见，如果我们构建这样一个网络，它包含世界上最基本的meta structure，就可以做到涵盖各类最基本的智能任务。

我们把整个过程流程化，可以看到它大致对应这样一个图：但感知信息进入，我们通过rcnn，transformer等方法将连续的光场离算化，得到物体（实体表征），这是我们认知的第一个捷径，丢掉了很多对生存不重要的信息，在感知物体的高维向量里，依然包含大量未知的特征信息。而根据这些信息，我们大脑里的元结构处理器可以对这些实体进行匹配，重组，构成新的更加类似于（超）图结构的模型，每个元结构处理器就好像从自己的视角对世界上的信息进行加工，进行某种特定形式的结构化（逻辑，因果），这种结构化得到的模型是对世界进一步的低维度表示，虽然它们丧失了大量感知信息，但是在特定任务，逻辑处理中且更加快速。结构化的过程仿佛是将之前的感知实体推入一个个认知网络的结构卡槽，这样的思维和人工智能早期发起人Marvin Minsky的frame理论是非常相关的。

有了这些任务模型，我们可以在其上进行非常灵活的控制，根据不同的任务选择不同的结构实体来进行推理和控制，并且在其间进行切换。

因此NPS的框架提供了未来AGI一种非常基本的组成元件，当然离真正的智能它还缺少很多其它的核心部分，比如人类的智能以目标展开，我们不停的把真实世界切割成不同的任务，每个任务都有一个目标，而目标之下我们会把它分解成很多子目标，这种能力并非当下的NPS系统涵盖的。另一方面， NPS系统的感知部分也较为简单原始，从中提取实体的过程没有体现高级认知的参与，事实上我们关注的是图片中的一个动物还是一棵树，也是高度依赖于整个目标和认知过程的。因此，未来的AGI构建之路依然任重道远。另一个关键问题是，即使是NPS这样的结构，也依然是在各种小型研究问题得到体现，它是否能够用来撸真实世界的规则和因果，还是一个亟待研究的问题。

愿意探讨一套AGI系统的最小实现框架的同学请加铁哥微信（TieXu0609），还有珍贵的头部AI公司实习机会。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

如果您对实验室的研究感兴趣，欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从Bengio的NPS模型看AGI的实现通路的相关文章

电商数据api拼多多接口获取商品实时数据价格比价api代码演示案例

拼多多商品详情接口接口接入入口它的主要功能是允许卖家从自己的系统中快速获取商品详细信息通过这个接口卖家可以提取到商品的各类数据包括但不限于商品标题价格优惠价收藏数下单人数月销售量等此外还可以获取到商品的SKU图详情
C++ 中 const 和 constexpr 关键字解析：常量、函数和指针

很多 C 的初学者看到 const 这个关键字的第一反应都是一头雾水主要是因为 const 可以出现在很多的位置以及后面加入的 constexpr 更是常常感到困惑今天就为大家一一解释出现它们的含义和以及作用 const 关键字 c
Go 语言运算符详解：加法、算术、赋值、比较、逻辑和位运算符全面解析

运算符用于对变量和值执行操作加号运算符将两个值相加如下面的示例所示示例代码 package main import fmt func main var a 15 25 fmt Println a 尽管加号运算符通常用于将两个值相加
扬帆证券：突发利好！外资重大转变，A股收到多份喜报

A股财报季利好音讯密集传来 1月16日晚间 A股多家上市公司披露了成绩预告其间成绩预增扭亏等利好公告数量占比超80 其间普瑞眼科公告估计2023年净赢利同比添加高达1163 98 1285 51 别的多家上市公司公告称估计20
多模态、长文本、智能体，智谱AI推出GLM-4模型全家桶，发布即上线！

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 2024年01月16日智谱AI首届技术开放日 Zhipu DevDay 在北京中关村国家自主创新示范区展示中心成功举办现场智谱AI团队全面展示了其投身于大模型事业三年多来所
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
CorelDRAW2024官方中文版重磅发布更新

35年专注于矢量设计始于1988年并不断推陈出新致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
【GRNN-RBFNN-ILC算法】【轨迹跟踪】基于神经网络的迭代学习控制用于未知SISO非线性系统的轨迹跟踪（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 第1部分 2 2 第2部分
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金

随机推荐

【经验总结】tcp_tw_recycle参数引发的故障

tcp tw recycle参数引发的故障 By Eric 故障描述 2010年9月7日新上线的手机游戏论坛有部分地区用户反应登陆游戏时出现不能登陆或登陆超时等情况观察用户同时在线数量开始下降情况排错过程一初步检查是否有变更导致的
C++类成员函数中const的用法

C 类中 const的用法个人总结主要有以下几种 1 用来修饰成员变量比如const int var 2 用来修饰形参主要针对引用比如const type 3 用来修饰返回值返回常量引用 4 放在成员函数的形参列表的之后大括号
嵌入式是什么？（一个电子产品的从0到1）-杂谈

这篇博客我想聊聊嵌入式在IT行业存在着很多不同的领域与不同的职位由此也延伸出了各式各样的工程师但其中嵌入式工程师算是比较迷糊的一个职位了即便同是IT的同事也有不少问过我嵌入式是干什么的更别说是非IT行业的人以及刚刚入门的小白
VPP plugin so 的封装与解耦

封装与解耦每一个 plugin 封装了一个独立的功能模块模块依赖的外部 so 接口也封装在每个 plugin 中 vpp 提供统一的使能禁能初始化 plugin 的框架同时每个 plugin 对外提供的接口也使用统一的方式大多采
python 输入输出相关

输入字符串 n input 字符串可以直接遍历输入字符串时遇到需要输出字符串的题可以再建一个字符串用来更新比如这道题输入一个由小写英文字母组成的字符串请将其中的元音字母 a e i o u 转换成大写其它字母仍然保持小写 n i
FPGA 与门

module and gate a b y input a b output y assign y a b endmodule
[tensorflow]联邦学习框架TFF安装记录(基于docker)

1 介绍 tensorflow federated 下面简称为TFF 是谷歌开发的一款开源联邦学习框架该框架基于tensorflow 下面简称为TF 运行安装这个框架花了我两天时间现在对安装过程进行总结本帖子总共分为3章第一章介绍
Linux 查看文件大包括隐藏文件

du h max depth 1 sort hr
实现Vue的登录页面

实现Vue的登录页面步骤 1 前期准备 1 1 安装Node js 从官网下载地址 https nodejs org zh cn 安装完成后在终端输入 node v 来查询版本号 1 2 安装Webpack 在终端输入npm instal
测试servlet的小tips

由于servlet中使用了一些Request请求中的参数我们可以通过请求url中添加这些参数传入到 Request中一个小tips
GTest的测试环境搭建

一 gtest的安装 Google test是一种比较方便的C 测试框架它能够帮助我们比较方便的进行测试代码的编写以及输出尽可能详细的失败信息能够大大缩短我们测试代码的编写效率而且该框架的使用方法也比较简单能够降低我们学习新框架的
Java 移除重复节点

移除重复节点难度简单97 编写代码移除未排序链表中的重复节点保留最开始出现的节点示例1 输入 1 2 3 3 2 1 输出 1 2 3 示例2 输入 1 1 1 1 2 输出 1 2 提示链表长度在 0 20000 范围内链表元
MES管理系统对电子企业来说有什么优点

引言在电子制造企业中 MES管理系统已经成为提高生产效率降低成本提高订单履行速度和准确性的重要工具电子企业MES管理系统是一套集成的信息系统用于监控和控制电子企业的生产过程本文将探讨MES管理系统对于电子企业来说有哪些优点一
人工智能的最新进展：2024年将会发生什么？

文章目录 2024年AI最新发展 2024年AI具体应用 2024年AI的具体预测创作者全栈弄潮儿个人主页全栈弄潮儿的个人主页个人社区欢迎你的加入全栈弄潮儿的个人社区专栏地址 AI大模型人工智能 AI 是一种快速发展的技术
C++ MAP的遍历顺序和插入元素顺序是不同的

当你为MAP插入一个元素后 MAP会按KEY的顺序重新排列所以当你遍历MAP的时候遍历的顺序已经不是你插入元素的顺序举个具体例子 MAP B 1 MAP C 2 MAP A 3 当你遍历MAP输出的时候是按 A B C 顺序输出的
Zookeeper和Nacos的区别

目录 Zookeeper 1 ZK结构 2 ZK的消息广播和崩溃恢复 Nacos 1 存储和数据更新 2 注册中心 Zookeeper 1 ZK结构 Zookeeper的功能主要是通过它的树形节点来实现的当有节点数据变化时或者说节点过期的
Dropout Learning - 防止深度神经网络过拟合

最近在学习caffe 里面有一个名词叫做Dropout Learning 一直没明白是什么意思直到最近才发现一片文章介绍Dropout Learning的希望可以给不知道的同学一定的帮助如果想要更深入的了解可以阅读该文献文章结尾会给
MOV指令在32位汇编程序和64位汇编程序下的相同与不同之处

mov指令原则两个操作数目标操作数和源操作数的大小必须相同两个操作数不能同时为内存操作数也就是不能内存到内存指令指针寄存器不能作为目标操作数 64位汇编程序下 32位汇编程序和64位汇编程序都依照上面的规则语法也相同但如
目标跟踪算法

目标跟踪算法一目标跟踪算法简介 1 1 主要任务 1 1 1 Online Visual Tracker BenchMark 1 1 2 VOT 1 2 难点与挑战 1 3 分类 1 3 1 常规分类 1 3 2 时间分类二常用算法
从Bengio的NPS模型看AGI的实现通路

来源混沌巡洋舰这两天深度学习祖师Yoshua Bengio 的 Neural Production System 刷新了AI圈子与以往的深度学习套路不同的是这篇文章有效的把符号主义AI对人类认知的模拟与深度学习结合得到了一个能够学

从Bengio的NPS模型看AGI的实现通路

从Bengio的NPS模型看AGI的实现通路 的相关文章

随机推荐

热门标签

从Bengio的NPS模型看AGI的实现通路的相关文章