Empowering Language Models with Knowledge Graph Reasoning for Open-Domain Question Answering

2023-11-15

本文是LLM系列文章,针对《Empowering Language Models with Knowledge Graph Reasoning for Open-Domain Question Answering》的翻译。

用知识图谱推理增强语言模型的问答能力

摘要

回答开放领域的问题需要掌握有关上下文实体的世界知识。由于预先训练的语言模型缺乏存储所有所需知识的能力,因此通常使用外部知识源(如知识图谱)来增强语言模型。在这项工作中,我们提出了knOwledge REasOning授权语言模型(OREOLM),该模型由一个新的知识交互层组成,该层可以灵活地插入到现有的基于Transformer的LM中,以与可微知识图谱推理模块协同交互。通过这种方式,LM引导KG走向期望的答案,而检索到的知识改进了LM。通过在RoBERTa和T5中采用OREOLM,我们显示出显著的性能提升,在闭书设置中实现了最先进的结果。性能的提高主要来自KG推理推断缺失关系事实的能力。此外,OREOLM提供了推理路径作为解释模型决策的理由。

1 引言

2 方法

3 实验

4 相关工作

5 结论

我们提出了OREOLM,这是一个将符号KG推理与现有LM相结合的新模型。我们展示了OREOLM可以为开放域QA基准带来显著的性能提升,无论是对于闭书和开书设置,还是仅编码器和编码器-解码器模型。此外,OREOLM生成有助于解释模型预测的推理路径。未来,我们希望通过训练来改进OREOLM,以执行更多的推理步骤,支持局部推理,并将OREOLM应用于更广泛的知识密集型NLP任务。

6 局限性

有限的推理步骤
在我们的实验中,我们表明在单跳和多跳(主要是两个)QA数据集上,使用推理步骤T=2比T=1具有更好的性能。因此,我们是否可以更多地扩展推理步骤,这是一个自然的问题?由于以前的KG推理大多可以支持很长的路径(使用LSTM设计)。尽管我们在提交论文之前没有花太多时间进行探索,但我们确实尝试使用t=3,但目前没有得到更好的结果。我们假设以下原因:1)我们当前模型的改进很大一部分依赖于弱监督关系预训练。为此,我们构造了一个K-hop(K=2)子图,并在此基础上对依赖图进行采样。我们选择的K越大,生成的关系标签中包含的噪声就越多,速度呈指数级增长。因此,对于高阶T,很难获得准确的推理路径基本事实。另一个潜在的原因是,在Transformer模型中,下层和上层的表示空间可能非常不同,例如,在下层编码更多的语法和表面知识,而在上层编码更多的语义知识。目前,我们采用了MLP投影头,希望将集成知识映射到同一空间,但它可能存在许多缺陷,需要进一步改进。
大型实体嵌入表需要预训练和GPU资源
我们目前的设计有一个庞大的实体嵌入表,应该通过额外的监督来学习,不能直接微调到下游任务。这限制了我们方法的使用。
需要实体链接
当前的模型设计需要为传入的问题添加实体链接的额外步骤,然后添加特殊的token作为接口。一个真正的端到端模型应该确定哪些元素可以在不依赖外部模型的情况下开始自己进行推理。
仅支持基于关系路径的推理
尽管有很多潜在的推理任务,如逻辑推理、常识推理、物理推理、时间推理等。我们目前的模型设计主要侧重于基于路径的关系推理,在现阶段不应该适用于其他推理任务。
路径独立性的不合理假设
当我们推导方程1时,我们假设从不同实体开始的推理路径应该是独立的。这并不总是正确的,尤其是对于需要逻辑推理的问题,比如对每个实体状态进行连接或析取运算。因此,我们目前的方法可能不适用于那些具有逻辑依赖关系的复杂QA。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Empowering Language Models with Knowledge Graph Reasoning for Open-Domain Question Answering 的相关文章

随机推荐

  • Win 10 删除多余无效的打开方式

    一 问题描述 提示 使用右键 属性 打开方式 选错了应用程序 我这里选wps exe 选成了ksolaunch exe 然后就在右键中出现了一个无效的打开方式 很别扭 二 解决方案 在学习多篇文章关于如何删除多余打开方式的文章后发现 要删除
  • 【CV夏令营】笔记03:使用PaddlePaddle套件

    0 学习背景 有幸参与了DataWhale的AI视觉夏令营 沉浸式全流程体验AI比赛 比赛题目是 脑PET图像分析和疾病预测挑战赛 这里给出链接 https challenge xfyun cn topic info type pet 20
  • 2019 必知的 10 大顶级 python 库

    朋友们 我是床长 如需转载请标明出处 http blog csdn net jiangjunshow 作为数据科学和机器学习相关的研究和开发人员 大家每天都要用到 python 在本文中 我们将讨论一些 python 中的顶级库 开发人员可
  • 【前端

    图 先看一个例子 html div class container div class item 内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容 内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容内容
  • 图片清晰度,分辨率,像素总结

    像素 像素是一个个小方块 是构成位图的基本单位 将图片放大即可看出来 如图 分辨率 显示分辨率是指像素的总数量 如上图的2200 1400 也就是宽有2200个像素 高有1400个像素 图像分辨率是指每英寸所包含的像素个数 如上图的72像素
  • 基础网络拓扑的配置

    要求 全网可达 拓扑结构 使用的设备 1台路由器 2台交换机 4台电脑 解决网络拓扑 1 确定广播域的个数 2 分配网段 3 配置IP地址 优先配置路由器 确定广播域的个数 路由器有两个接口有连线 分为两个不同的广播域 分配网段 我采用19
  • Invalid contextPath ‘/xxx‘: must match the start of requestPath: ‘//xxx/yyy‘

    记录一个升级spring boot 版本从2 1升级到2 6之后的错误 java lang IllegalArgumentException Invalid contextPath admin must match the start of
  • java jar killed_容器中Java 程序OOMKilled原因浅析

    背景 业务的容器化刚刚搞完 线上开始告警 容器重启 容器重启 describe pod 查看原因是OOMKilled 分析 OOMKilled 是pod 中的进程使用的内存超过了 spec containers resources limi
  • 指针(一)

    学习c语言 不学指针 等于没学 可见指针在c语言中有多重要 指针是C语言中的一个重要概念及其特点 也是掌握C语言比较困难的部分 指针定义 指针也就是内存地址 指针变量是用来存放内存地址的的变量 指针的作用是 通过指针不仅可以对数据本身 还可
  • OpenGL ES着色器语言(GLSL ES)规范 ——下篇

    文章目录 前言 分支和循环 if if else for continue break discard 着色器内置变量 函数 函数定义 规范声明 webgl内置函数 存储限定字 const attribute uniform varying
  • MYSQL 8数据库原理及应用(徐丽霞 微课版)——第一章知识要点

    目录 数据库的基本概念 数据库管理技术的发展阶段 数据库的体系结构 数据模型 关系运算 数据库的基本概念 信息与数据库 数据 Data 是描述事物的符号记录 是数据库中存储的基本对象 信息 信息的传递需要物质载体 且信息的获取和传递都要消耗
  • 业务高速增长场景下的稳定性建设实战

    背景 静儿在2017年8月25日怀着 再也不要下班时间收到报警 的美好期待加入美团金融智能支付负责核心交易 结果入职后收到的报警一天紧似一天 核心交易是整个智能支付的核心链路 承担着智能支付百分之百的流量 下面是我们的日单量增长曲线 从图中
  • postman界面变成了左右结构怎么办

    前些天发现了一个巨牛的人工智能学习网站 通俗易懂 风趣幽默 忍不住分享一下给大家 点击跳转到教程 在左上角 file settongs中设置一下
  • Linux下编辑文件并保存

    第一步 cd到该文件的目录下 第二步 vi 要编辑的文件名 进入普通模式 可以查看文件内容 第三步 输入 i 进入编辑模式 开始编辑文本 第四步 编辑之后 按ESC退出到普通模式 第五步 在普通模式下 输入 进入命令模式 第六步 在命令模式
  • ADCS攻击利用

    ADCS攻击利用 个人公众号创世信安 一 ADCS相关介绍 1 ADCS AD CS证书服务 SSL证书 可以部署企业根或者独立根建立SSL加密通道 和其他服务证书的区别在于加密强度 本次利用的漏洞产生的原因是ADCS支持的服务器角色功能错
  • spring-boot整合基本jdbc(基于oracle数据库)

    点击有惊喜 https mp weixin qq com s 2My JPTIaF02w70J CRM4A 快速搭建一个web工程 搭建完一个web工程 要想连接上oracle数据库 还得进行以下操作 1 在pom xml中引入jdbc连接
  • 奋斗的人生很精彩

    奋斗 是人生道路上永恒的主题 它意味着不懈的努力 不断的追求 以及对梦想的执着追求 在我们的人生旅途中 每个人都有自己的目标和梦想 有些人梦想成为一名成功的商人 有些人希望成为一名伟大的科学家 而有些人则渴望成为一名杰出的艺术家 无论我们的
  • Linux下线程池的代码

    此博客仅为了存放代码 Linux 加锁 线程池 头文件 include
  • 在jupyter Notebook上绘制动态曲线

    在jupyter Notebook上绘制动态曲线 1 前言 2 实现原理 3 实现源码 1 前言 在上一篇文章中介绍了在如Pycharm VsCode IDEA等 非交互式编程软件中绘制动态曲线的实现原理 那么问题来了 在如jupyter
  • Empowering Language Models with Knowledge Graph Reasoning for Open-Domain Question Answering

    本文是LLM系列文章 针对 Empowering Language Models with Knowledge Graph Reasoning for Open Domain Question Answering 的翻译 用知识图谱推理增强