深度学习如何集成领域知识?IBM研究等《知识增强深度学习》综述,全面阐述科学与经验知识增强的深度学习...

2023-11-19

8dc8ad75bfaaaa6fde038b9b8570b61d.png

来源:专知

尽管在过去的几年里,深度学习模型在许多不同的领域取得了巨大的成功,但通常数据匮乏,在不可见的样本上表现不佳,而且缺乏可解释性。目标领域往往存在各种先验知识,利用这些先验知识可以弥补深度学习的不足。为了更好地模仿人类大脑的行为,人们提出了不同的先进方法来识别领域知识并将其集成到深度模型中,以实现数据高效、可泛化和可解释的深度学习,称为知识增强深度学习(KADL)。

ed82a6e4848fbed8b6764c7fe18d2e9d.jpeg

在本综述中,我们定义了KADL的概念,并介绍了它的三个主要任务,即: 知识识别、知识表示和知识整合。与现有的专注于特定类型知识的综述不同,我们提供了领域知识及其表示的广泛而完整的分类法。基于我们的分类法,我们对现有的技术进行了系统的回顾,不同于现有的综述集成方法对知识分类法的不可知的工作。该综述包含了现有的工作,并提供了知识增强深度学习一般领域的研究概览。对大量论文的全面和批判性的回顾不仅有助于了解当前的进展,而且有助于确定知识增强深度学习的未来研究方向。

1. 概述

尽管现有的深度模型在各个领域都取得了令人印象深刻的性能,但它们存在一些严重的缺陷,包括数据依赖性高和泛化[1]差。这些缺陷主要源于模型的数据驱动特性以及它们无法有效利用领域知识。为了解决这些限制,知识增强深度学习范式开始引起研究人员的注意,通过该范式,领域知识和可观察数据协同工作,产生数据高效、可泛化和可解释的深度学习算法

现实世界的领域知识是丰富的。在深度学习背景下,领域知识主要来源于两个来源:目标知识和度量知识。目标知识控制着我们想要预测的目标变量的行为和属性,而度量知识控制着产生目标变量的观察数据的底层机制。基于其表示,本文提出将深度学习中探索的领域知识分为两类:科学知识和经验知识。科学知识代表了在某一领域中已经确立的支配目标变量的属性或行为的规律或理论。相比之下,经验知识是指从长期观察中提取的众所周知的事实或规则,也可以通过人类的推理推断出来。知识可以用各种格式表示和组织。科学知识通常可以用数学方程来精确地表示。另一方面,经验知识通常不太正式,如通过逻辑规则、知识图谱或概率依赖。在深度学习框架中,不同表示形式的知识通过不同的集成方法与数据集成。

由于认识到当前深度学习的不足,人们对捕获先验知识并将其编码到深度学习中越来越感兴趣。两种主流技术是神经符号集成和物理成形深度学习。神经符号集成模型主要是将经验知识编码到传统的符号AI模型中,并将符号模型与深度学习模型进行集成。基于物理的深度学习侧重于将各种理论物理知识编码到不同的深度学习阶段。目前在这一领域的研究论文的范围有限,因为他们关注的要么是神经符号模型,要么是基于物理的机器学习方法,而忽略了许多其他相关的工作。具体而言,现有的神经符号模型综述主要包括对逻辑规则或知识图谱的讨论,以及它们与深度模型[2]、[3]的融合。然而,现有的关于基于物理的机器学习的调研仅限于一个特定的科学学科,并且集成方法通常是特定于任务的,例如,物理[4],[5],信息物理系统[6],几何[7]和化学[8]。因此,这些综述集中在实验室环境下解决科学问题的方法上,缺乏对现实世界应用的讨论。为了解决这一局限性,我们对现有的知识增强深度学习研究进行了全面而系统的综述。我们的综述有三个方面的贡献:

  • 本综述建立了一种新的领域知识分类方法,包括科学知识和经验知识。我们的工作包含了现有的工作,这些工作关注特定学科领域知识的子集[4]-[8]。

  • 本综述涵盖了广泛的知识表示和集成方法与系统分类。它不同于现有的关于一般集成技术的综述,后者不确定领域知识的分类[9]-[13]。

  • 本综述涵盖的方法不仅适用于在实验室环境下解决科学问题,更重要的是,适用于现实世界的应用任务。这项综述不局限于特定的应用任务,它涉及从计算机视觉到自然语言处理的任务。因此,我们的综述不仅引起了深度学习研究者的兴趣,也引起了不同领域的深度学习实践者的兴趣。

我们组织这次综述如下。在第二节中,我们首先介绍了KADL的概念,并定义了三个基本任务(即知识识别、知识表示和知识集成)。然后我们回顾了KADL方法,其中我们根据它们的重点领域知识对不同的技术进行了分类:1)第三节中的带有科学知识的深度学习,2)第四节中的带有经验知识的深度学习。在每个类别中,我们确定了领域知识、它的表示格式,以及为知识与数据的集成提出的现有方法。表一概述了现有的知识增强深度学习方法。

6acd02a8f8706f78bcf5909da28f448d.jpeg

2. 知识增强深度学习

知识增强深度学习的主要任务包括知识识别、知识表示和知识集成到深度模型中。

539ac2c5bad92de8049f2e282242506c.jpeg

3. 用科学知识进行深度学习

深度学习模型在先进的科学和工程领域越来越重要,而这些领域传统上是由机械(如第一原理)模型主导的。这类模型对于那些发生机制尚未被专家很好理解的科学问题,或者那些精确解在计算上不可行的问题,产生了特别有希望的性能。然而,现有的深度学习需要大量带注释的数据,对新数据或设置的泛化能力很差。在将科学和工程中的传统方法与现有的数据驱动的深度模型相结合方面,研究界有越来越多的共识。带有科学知识的深度学习探索了经典机制模型和现代深度模型之间的连续统一体。在机器学习领域,将科学知识整合到深度学习(也称为基于物理的机器学习)中,以产生物理上一致的、可解释的预测,并降低数据依赖性的努力越来越多。在下面,我们首先确定科学知识的类型及其表征。然后介绍了将科学知识与深度模型集成的不同方法。

9f63799e8ae40509b6deac57d81d042b.jpeg

4. 基于经验知识的深度学习

除了科学知识外,经验知识被广泛认为是神经符号模型的主要知识来源。经验知识是指日常生活中众所周知的事实,描述一个对象的语义属性或多个对象之间的语义关系。它通常是直观的,是通过长时间的观察或完善的研究得出的。与科学知识不同,经验知识虽然广泛存在,但具有描述性和不精确性。包含语义信息的经验知识可以作为深度学习中预测任务(如回归或分类任务)的强大先验知识,特别是在小数据环境下,仅训练数据不足以捕获变量之间的关系[65]。

08b730fa69e425db5b3af2181eb9d884.jpeg

4bece6da0ab68fa76cde8475bfbb6a96.jpeg

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

c213c3e0c76beec8928e486ac962a803.jpeg

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习如何集成领域知识?IBM研究等《知识增强深度学习》综述,全面阐述科学与经验知识增强的深度学习... 的相关文章

  • 微信二次分享

    微信二次分享 效果演示 如何运行项目 克隆代码到本地 git clone https github com Jameswain WeiXinSDK git 安装依赖 npm i 运行项目 npm run dev 通过charles配置代理
  • 无法加载 DLL“halcon”: 找不到指定的模块。 (异常来自 HRESULT:0x8007007E)

    将项目拷贝到没有安装halcon的电脑上 出现标题所示异常 参考文章 https www 51halcon com thread 997 1 1 html 我的解决办法是将halcon dll 文件拷贝到 bin debug目录下
  • Vscode连接远程服务器(一套配置成功)

    安装远程开发插件Remote Development 1 在商店中搜索Remote Development并安装 2 添加服务器连接配置 点击该选项卡 会进入SSH TARGETS的添加 如下图所示 填写配置信息可在下边操作中查看 修改 想
  • vue中 el-table 实现拖拽排序教程

    el table基础上如何实现表格上下拖拽排序 element ui 表格没有自带的拖拽排序的功能 只能借助第三方插件Sortablejs来实现 实现步骤 1 安装Sortable js npm install save sortablej
  • 初识区块链

    这篇博客主要从社会和经济层面来直白的向大家讲述区块链是什么 比特币是什么 分享的内容仅限于自己的理解 里面会存在本人的观点 但是希望读者能有自己的独立看法 审慎的阅读本文 甚至能考虑到我的认知不足导致的偏差 不为任何投资电子货币者提供意见
  • Mysql命令use:使用数据库

    use命令可以让我们来使用数据库 use命令格式 use lt 数据库名 gt 例如 如果xhkdb数据库存在 尝试存取它 mysql gt use xhkdb 屏幕提示 Database changed 1 use 语句可以通告MySQL
  • java加载多个properties文件_Spring加载配置和读取多个Properties文件的讲解

    一个系统中通常会存在如下一些以Properties形式存在的配置文件 1 数据库配置文件demo db properties database url jdbc mysql localhost smaple database driver
  • 全卷积网络(FCN)与图像分割

    全卷积网络 FCN 与图像分割 从图像分类到图像分割 卷积神经网络 CNN 自2012年以来 在图像分类和图像检测等方面取得了巨大的成就和广泛的应用 CNN的强大之处在于它的多层结构能自动学习特征 并且可以学习到多个层次的特征 较浅的卷积层
  • 西安烽火通信面经——Java后端开发

    由于地方比较太偏远 2号线 3号线 6号线 等了半个小时的公交还不来 只能打滴滴 一面 技术面 1 先自我介绍一下 这个没什么说的 简单介绍了一下 2 说一下Java语言的跨平台性 这个是基于JVM实现的 简单说了一下 3 说一下Java语
  • 1300*C. Page Numbers

    解析 注意单个数的情况 include
  • 使用pycharm入门python的一些注意点

    今儿在帮别人跑一段python代码 实际上我对python并不熟悉 只能边摸索边尝试 选择了pycharm这个工具 一 怎么安装python使用的库文件 能用来安装python的库文件的 有很多种办法 这里只介绍pip和pip3 因为pip
  • unity粒子特效附上贴图后播放动画

    转自 http jingyan baidu com article f96699bbb1a0d6894f3c1b77 html 参考 http www unitymanual com thread 2993 1 1 html dsign a
  • FFmpeg下载及命令行使用

    下载地址 访问FFmpeg官网 选择Dlownload 选择 Windows Package 选择相应版本 点击进行下载 并进行解压 可得到如下几个文件 版本说明 Static 只包含了3个体积很大的exe Shared 除了体积很小的ex
  • DeepSpeed配置参数 - 快速上手

    目录 DeepSpeed配置参数 快速上手 batch Size optimizer scheduler fp16 zero optimization csv monitor 例子 DeepSpeed配置参数 快速上手 DeepSpeed是
  • AI推荐的初级算法工程师学习路线

    学习算法是一项长期而且不断更新的工作 以下是一份初学者从入门到达到任职初级算法工程师要求的学习内容大纲 供您参考 1 编程语言 首先学习至少一门主流编程语言 如Python C Java等等 2 数据结构 学习数据结构是学习算法的基础 建议
  • CentOS 防火墙配置 80端口

    看了好几个页面内容都有错 下面是正确方法 sbin iptables I INPUT p tcp dport 80 j ACCEPT sbin iptables I INPUT p tcp dport 22 j ACCEPT 然后保存 et
  • 【STM32】标准库 串口下载以及STLINK

    STM32的串口下载 打开FlyMcu 接线就像之前那样接 USART1串口通信 必须是1 其他的不支持串口通信 编译之后就会生成HEX文件 而且上面的按钮Select也可以选择生成的位置 搜索串口 选择 然后波特率选择115200 在联机
  • 【tvm官网教程01】设计和架构-1

    tvm官网教程01 设计和架构 1 目的 1 编译流 1 1 关键数据结构 1 2 Transformations 1 2 1 变换的分类 1 2 2 relay transform 1 2 2 1 子函数 1 2 2 2 overall问
  • Consul服务注册与发现

    目录 一 Consul简介 一 官网 二 特点 二 安装并运行Consul 一 官网安装说明 二 下载 三 使用开发模式启动 三 服务提供者 四 服务消费者 五 三个注册中心异同点 一 CAP理论 二 AP架构 三 CP架构 一 Consu
  • 带有两个/三个未知数的算数-几何均值不等式的证明及其思路解析

    这是一篇学习手记 注 尽管文中大量使用了 一个显然的想法 自然而然 我们会想 等词语 我们也必须承认 这些伟大成果的证明需要天才的思路和不断的尝试 因此 第一次学习理解不了是很有可能的 比如我 基础 带有两个未知数的算数 几何均值不等式的证

随机推荐

  • MySQL同时In俩个字段,In多个字段,Mybatis多个In查询问题,Mysql多个IN查询多出数据问题,Mysql多个IN查询 数据准确问题

    背景 今天产品验收的时候 导入了大量数据 发现造价项目某个查询列表数据多出了几条数据 看了Mybatis查询 才发现是同时使用了多个IN查询导致的问题 入参是对象列表 In值是分开循环赋值的 问题就出在这里 需要根据两个字段去查询多个值 这
  • Barcode Reader Toolkit for Windows v8.3.3.3正式发布!

    Barcode Reader Toolkit for Windows 是一个工具包 允许开发人员在其应用程序中添加条形码检测 该工具包将图像文件或内存位图作为输入 并返回有关每个条形码的信息 包括值 类型和位置 所有主要的线性 1 D 条形
  • 1流明等于多少lux_要想投影仪画质清晰,投影仪流明和对比度不得不看

    在选购投影机的时候 大家都会根据预算 尽可能选择画质清晰的投影机 一般来说会根据使用场景的不同 从XGA到1080P甚至4K的分辨率 那么 投影机的画质清晰效果只和分辨率有关么 其实不是 一款画质效果好的投影机 和投影机的流明和对比度也是息
  • Vue—实现动画、过度效果

    动画效果
  • UnityLuaMvvM Lua 带通知的Mode类

    实现数据更新UI自动刷新的核心代码 欢迎关注https gitee com xiongks UnityMVVM mode function modeType local obj obj modeType modeType obj filds
  • extends OverWrite

    extends 扩展延伸 继承 用这个方法对class有了进一步的汇总 减少了对具有相同属性的类重复enter的工作量 使函数模块化更高 注 构造函数内的属性和方法能继承 package Extends 定义一个父类public class
  • 远程桌面连接技术【包含出现问题的解决手段】

    远程桌面连接技术 文章目录 远程桌面连接技术 前言 定义 远程连接的方法 远程桌面协议 RDP 由于我没有两台电脑 这里用虚拟机演示 1 为两台计算机设置相同的网段的 IP 地址 2 远程计算机的设置 2 1 在电脑中找到 远程桌面连接 2
  • 【单片机】keil和Proteus使用教程

    需要云服务器等云产品来学习Linux的同学可以移步 gt 腾讯云 lt gt 阿里云 lt gt 华为云 lt 官网 轻量型云服务器低至112元 年 新用户首次下单享超低折扣 目录 一 kei
  • I/O流之进步认识、InputStream以及FileInputStream

    File类 用于描述一个文件或者文件夹的 通过File对象 我们可以读取文件或者文件夹的属性数据 如果我们需要读取文件的内容数据 那么我们需要使用IO流技术 IO流 Input Output IO流解决问题 解决设备与设备之间的数据传输问题
  • Windows 10安装WSA(WindowsSubsystemForAndroid)

    0 Win10安装好了仍然不能用 Win10安装好了仍然不能用 Win10安装好了仍然不能用 抱着试一试的心态装了一下 果然不行 随手记录下 1 首先 直接在应用商店里下载WSA是会报错的 所以要从微软商店把这个包下载下来 打开https
  • 下载 arm-linux-gcc

    https releases linaro org components toolchain binaries latest 4 arm linux gnueabihf 如果你使用的是ubuntu系统 你可以使用apt方式来安装arm li
  • mybatis plus中update_time字段未自动更新

    参考 MyBatis Plus官方文档 mybatis plus对于create time update time这样的数据库字段提供了自动插入功能 不用每次都手动进行更新 使用指南 加 TableField注解 自定义实现类TimeMet
  • 抗击疫情,AI可以做些什么?

    目前 新冠疫情的发展 可以说无时无刻不在牵动着大家的心 在这样的历史背景下 作为人工智能 数据科学领域的从业者 我们不妨来探讨一下 AI在遏制类似的疾病传播中 可以起到什么样的作用 当然 单纯靠AI技术确实无法让病毒停止传播 在一定时期内
  • STM32的单脉冲模式实现精确个数脉冲

    我们在做嵌入式产品的开发过程中 有时需要输出指定数目的脉冲 实现它的方法较多 这里介绍一种利用 STM32定时器的单脉冲模式来实现的方法 STM32定时器的单脉冲输出功能 其实是定时器输出比较功能的一个特殊应用 即让定时器在某个事件触发后的
  • keil mdk代码提示与代码补全设置

    主要参考https blog csdn net w5862338 article details 50520423 结合自己的实际问题 一旦习惯了一些实用的功能 当进入到类似的环境中而没有熟悉的功能 会觉得很不方便 代码提示与补全就是这样实
  • 60-400-045-使用-binlog-Maxwell读取MySQL binlog日志到Kafka

    文章目录 启动MySQL 创建maxwell的数据库和用户 在MySQL中创建一个测试数据库和表 启动Zookeeper 启动kafka 并创建主题为maxwell的topic 启动kafaka的消费者 检查数据是否到位 启动maxwell
  • [网络安全]sqli-labs Less-17 解题详析

    考察报错注入 本文使用extractvalue进行注入 原理及姿势可参考 网络安全 sqli labs Less 5 解题详析 判断注入类型 由以下回显可知 注入类型为单引号注入 查库名 账号输入admin 密码输入 1 and extra
  • Visual C++6.0的安装及使用教程

    Visual C 6 0下载链接 链接 https pan baidu com s 18ubNr9Gor3GbRrAkJe612w 密码 piek 对刚学习C语言或C 的小伙伴们来说 一款简单好用的编译器必不可少 今天给大家介绍的是Visu
  • 深度学习小白——DenseNet学习

    原论文地址 https arxiv org abs 1608 06993 用Keras写的pre model代码地址 https github com flyyufelix DenseNet Keras 一 主要原理 其借鉴了ResNet的
  • 深度学习如何集成领域知识?IBM研究等《知识增强深度学习》综述,全面阐述科学与经验知识增强的深度学习...

    来源 专知 尽管在过去的几年里 深度学习模型在许多不同的领域取得了巨大的成功 但通常数据匮乏 在不可见的样本上表现不佳 而且缺乏可解释性 目标领域往往存在各种先验知识 利用这些先验知识可以弥补深度学习的不足 为了更好地模仿人类大脑的行为 人