知识图谱综述论文阅读

2023-05-16

论文摘要

论文为A Survey on Knowledge Graphs: Representation, Acquisition and Applications,发表日期2020年,论文PDF,点击链接。

代表实体间结构关系的知识图谱已成为认知和人类智能研究的一个日益流行的方向。在这篇论文中,作者对知识图谱进行了全面的回顾,涵盖了1)知识图谱表示学习、2)知识获取和补全、3)时序知识图谱、4)知识感知应用等方面的研究主题,并总结了最近的突破和未来的研究方向。作者对这些主题进行全视图分类。知识图谱嵌入从表示空间、得分函数、编码模型和辅助信息四个方面进行组织。对知识获取,特别是知识图的完成、嵌入方法、路径推理和逻辑规则推理进行了综述。同时进一步探讨了一些新兴的主题,包括元关系学习、常识推理和时序知识图谱。为了方便未来对知识图谱的研究,论文还提供了一个针对不同任务的数据集和开源库的管理集合。最后,对几个有前景的研究方向进行了深入的展望。

如果只是看着玩玩可以穿梭到这篇博文:

https://www.omegaxyz.com/2020/04/29/dark-forest-kg/

知识图谱

知识图谱的术语与知识库是同义的,只是稍有不同。当考虑知识图谱的图结构时,可以看作是一个图。当它涉及到形式语义时,它可以作为解释和推断事实的知识库。知识可以在资源描述框架(RDF)下以事实三元组的形式表示(头、关系、尾)或(主语、谓语、宾语),例如(Albert Einstein, WinnerOf, Nobel Prize)。它也可以表示为一个有向图,其中节点是实体,边是关系。下图是知识库和关系图示例。

在这里插入图片描述

历史

知识表示在逻辑和人工智能领域经历了漫长的发展历史。图形化知识表示的概念最早可以追溯到1956年Richens提出的语义网概念,而符号逻辑知识可以追溯到1959年的一般问题求解者。知识库首先用于基于知识的推理和问题解决系统。MYCIN是最著名的基于规则的医学诊断专家系统之一,其知识库约有600条规则。后来,人类知识表示的社区看到了基于框架的语言、基于规则的和混合表示的发展。大约在这一时期的末期,Cyc项目1开始了,旨在汇集人类知识。资源描述框架(RDF) 2和Web本体语言(OWL) 3相继发布,成为语义Web 4的重要标准。然后,许多开放知识库或本体被发布,如WordNet、DBpedia、YAGO和Freebase。Stokman和Vries在1988年的一篇图论中提出了结构知识的现代概念。然而,知识图谱的概念自2012年谷歌的搜索引擎5首次推出以来,得到了极大的普及,提出了知识库的知识融合框架来构建大规模的知识图谱。

在这里插入图片描述

知识图谱研究方向

包含四个主要方面

1)知识图谱表示学习、2)知识获取和补全、3)时序知识图谱、4)知识感知应用

在这里插入图片描述

知识表示学习(Knowledge Representation Learning)

知识表示学习是知识图谱的一个重要研究课题,它为许多知识获取任务和后续应用铺平了道路。作者将KRL分为表示空间、评分函数、编码模型和辅助信息四个方面,为开发KRL模型提供了清晰的工作流程。具体的材料包括:

  • 关系和实体所表示的表示空间;
  • 测量事实三元组可信性的打分函数;
  • 编码用于表示和学习关系交互的模型;
  • 将辅助信息纳入到嵌入方法中。

表示学习包括点向空间、流形空间、复向量空间、高斯分布和离散空间。评分指标一般分为基于距离的评分函数和基于相似度匹配的评分函数。目前的研究主要集中在编码模型,包括线性/双线性模型,因子分解和神经网络。辅助信息包括文本信息、可视信息和类型信息。

表示学习实际上也就是嵌入,可以参考知识图谱嵌入综述论文**(Knowledge Graph Embedding: A Survey of Approaches and Applications)**,这篇讲得更清晰,论文讲解可以参考以下两篇。

https://www.omegaxyz.com/2020/01/12/kge-translational-distance-models/
https://www.omegaxyz.com/2020/01/13/kge-semantic-matching-models/

知识获取(Knowledge Acquisition)

知识获取任务分为三类:

  • 知识图谱补全(KGC)
  • 关系提取(RE)
  • 命名实体识别(NER)

第一个用于扩展现有的知识图,而其他两个用于从文本中发现新知识(即关系和实体)。KGC可分为以下几类:基于嵌入的排序、关系路径推理、基于规则的推理和元关系学习。实体发现包括识别、消歧、类型化和对齐。关系提取模型利用了注意机制、图卷积网络(GCNs)、对抗性训练、强化学习、深度剩余学习和转移学习。

时序知识图谱(Temporal Knowledge Graphs)

时序知识图谱结合时间信息进行表示学习,也就是在三元组上添加一个时间标签。此研究主要分为时间嵌入、实体动态、时间关系依赖、时间逻辑推理四个研究领域。

知识图谱应用(Knowledge-aware Applications)

知识感知应用程序包括自然语言理解(NLU)、问答系统、推荐系统和各种真实世界的任务,这些应用程序注入知识以改进表示学习。

发展前景和方向

更加复杂的推理

知识表示和推理的数值计算需要一个连续的向量空间来捕捉实体和关系的语义。基于嵌入的方法对于复杂的逻辑推理有一定的局限性,关系路径和符号逻辑的两个方向都值得进一步探索。一些有前途的方法如循环关系路径编码、基于GNN的消息传递知识图谱、基于强化学习的路径查找和推理等,在处理复杂推理时都是很有前途的。对于逻辑规则和嵌入的组合,一些工作结合了马尔科夫逻辑网络与KGE,旨在利用逻辑规则和处理他们的不确定性。利用有效的嵌入实现对不确定性和领域知识的概率推理将是一个值得关注的研究方向。

统一框架展开研究

将知识图谱和文本放在同一个屋檐下,可以有一种相互关注的知识图和文本信息共享的联合学习框架,以类似于图网络统一框架的方式进行统一化的研究。

可解释性

最近的神经模型在透明性和可解释性方面存在局限性,尽管它们已经取得了令人印象深刻的性能。一些方法结合了黑盒神经模型和符号推理,通过结合逻辑规则来提高互操作性。可解释性可以说服人们相信预测。因此,进一步的工作应该是提高预测知识的可解释性和可靠性。

可扩展性

对大规模的知识图谱十分必要。

知识的信息聚合

全局知识的聚合是知识感知应用的核心。例如,推荐系统使用知识图谱对用户-项目交互和文本分类进行建模,将文本和知识图谱编码到语义空间中。现有的知识聚合方法大多设计了注意机制和GNNs等神经结构。自然语言处理社区通过Transformer和BERT模型等变体的大规模预训练得到了发展,而最近的一项发现表明,对非结构化文本进行预训练的语言模型实际上可以获得某些事实知识。大规模的预培训可以是一种直接的知识注入方式。然而,以一种有效的、可解释的方式重新思考知识聚合的方式也具有重要意义。

图谱的自动构建

当前的知识图谱高度依赖于手工构建,这是劳动密集型且昂贵的。知识图谱在不同认知智能领域的广泛应用,要求从大规模的非结构化内容中自动构建知识图谱。面对多模态、异构和大规模的应用,自动构建仍然是一个巨大的挑战。

最后补充一个论文中没有的方向ELG:事理知识图谱。

在这里插入图片描述

更多内容访问 omegaxyz.com
网站所有代码采用Apache 2.0授权
网站文章采用知识共享许可协议BY-NC-SA4.0授权
© 2020 • OmegaXYZ-版权所有 转载请注明出处

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

知识图谱综述论文阅读 的相关文章

  • Android手机移植TensorFlow,实现物体识别、行人检测、图像风格迁移

    Android手机移植TensorFlow xff0c 实现物体识别 行人检测 图像风格迁移 转载 xff1a http mp weixin qq com s ZUaxGPgqAGrN9itwRnSL2A 详解如何将TensorFlow训练
  • celery启动报错:kombu.exceptions.VersionMismatch: Redis transport requires redis-py versions 3.2.0

    问题原因 xff1a kombu依赖包从v4 3 0开始对redis py v2 10 6不兼容 所以需要使用旧版本的kombu 解决方法 xff1a pip install kombu 61 61 4 2 0 此时重启celery即可正常
  • SSH与GIT操作时出现Host key verification failed

    问题描述 在进行首次SSH链接与GIT操作时出现以下报错 xff1a 解决方法 vim etc ssh ssh config 在文档的末尾添上 StrictHostKeyChecking no UserKnownHostsFile dev
  • Cordova 打包 Android release app 过程详解

    转自 xff1a http www tuicool com articles 673mE3m Android app 的打包分为 debug 和 release 两种 xff0c 后者是用来发布到应用商店的版本 这篇文章会告诉你 Cordo
  • 人生苦短,我用Manjaro || 愿你Manjaro半天,归来仍是Deepin

    前言 先秀一下桌面 xff08 爱哟 xff0c 木兰姐姐真好看呀 xff09 Manjaro总体上装起来是挺方便的 但是对于双显卡的本子的确是真的不友好 本教主希望来总结一下装这个manajro gnome的艰辛历程 xff0c 以及双显
  • C# Winform调用MATLAB 动态链接库运算后窗体发生改变

    C Winform调用MATLAB 动态链接库运算后窗体发生改变 问题描述 xff1a 开始启动时 大小为最开始设置的大小 xff0c 当调用MATLAB 动态链接库时 xff0c 窗口突然变小 解决方案 在网上查询主要说两种方法 xff1
  • 在柱状图中找最大矩形——O(n)时间复杂度java实现

    最近在刷leetcode xff0c 又碰到了这道题 xff0c 想起来当时算法有些瑕疵 xff0c 所以将最新的AC代码更新在最上面做个对比 xff0c 具体思路见注释 public class Solution 思路 主要是使用一个栈来
  • 组合模式与职责链模式编程实现

    组合模式 简介 将对象组合成树形结构以表示 部分 整体 的层次结构 组合模式使得用户对单个对象和组合对象的使用具有一致性 动机 总部 分部和办事处是成树状结构 xff0c 也就是有组织结构的 xff0c 不可以简单的平行管理 希望总公司的组
  • 动态规划-最大的正方形面积

    题目表述 Given a 2D binary matrix filled with 0 s and 1 s find the largest square containing only 1 s and return its area Fo
  • 迭代器模式C++实现

    简介 提供一种方法顺序访问一个聚合对象中各个元素 xff0c 而又不暴露该对象的内部表示 动机 一个聚合对象 xff0c 如列表 xff08 List xff09 应提供一种方法来让别人可以访问它的元素 xff0c 而又不需要暴露它的内部结
  • macOS Catalina常见问题汇总

    本文共535个字 xff0c 预计阅读时间需要2分钟 作为一个伪程序员 xff0c 我来说说macOS Catalina的一些软件兼容性和注意点 macOS Catalina 正式版无法使用的APP 有道词典闪退 brew版本过低的加载错误
  • Failed to import pydot. You must install pydot and graphviz for `pydotprint` to work.

    Graphviz的可执行文件 http www graphviz org Download windows PHP 参考 xff1a http blog csdn net u014749291 article details 5489108
  • 计算机保研-中科院计算所霸面(笔试面试)

    基本情况 xff1a 学校 xff1a 末流211 排名 xff1a 1 70 绩点 xff1a 4 33 5 0 竞赛 xff1a 无ACM xff0c 有某水赛国奖 xff08 中国人工智能学会主办 xff09 科研 xff1a 一篇水
  • 计算机保研-中科大计算机

    Abstract 2019年中科大计算机夏令营比往年增加了不少难度 xff0c 统一增加了机试环节 xff0c 面试难度提高 xff08 陈恩红实验室和李向阳实验室向来包含机试 xff09 xff0c 最终录取率在60 左右 xff08 往
  • NSGA-II资料合集

    关于NSGA II的一些资料 NSGA II中文翻译 MATLAB代码 NSGA II的解释 简介 关于演化计算 生物系统中 xff0c 进化被认为是一种成功的自适应方法 xff0c 具有很好的健壮性 基本思想 xff1a 达尔文进化论是一
  • 简单区块链Python实现

    什么是区块链 区块链是一种数据结构 xff0c 也是一个分布式数据库 从技术上来看 xff1a 区块是一种记录交易的数据结构 xff0c 反映了一笔交易的资金流向 系统中已经达成的交易的区块连接在一起形成了一条主链 xff0c 所有参与计算
  • 复旦大学计算机保研夏令营

    Abstract 复旦的夏令营 xff1a 自由而无用 xff0c 一期招了200人入营 xff0c 不提供住宿 xff08 导致我租了个旅馆每天要骑单车来学校 xff0c 不过沿途环境不错 xff0c 有很多吃的地方 xff09 xff0
  • 计算机保研夏令营预推免

    夏令营与预推免个人情况 学校 xff1a 末流211 xff08 安徽大学 xff09 排名 xff1a 1 70绩点 xff1a 4 33 5 0竞赛 xff1a 无ACM xff0c 有某水赛国奖 xff08 中国人工智能学会主办 xf
  • 知识图谱嵌入的应用场景

    In KG应用 xff08 在 KG 范围内的应用 xff09 链接预测 xff08 Link prediction xff09 链接预测任务有时也称为实体预测或实体排序 xff0c 用来预测两个实体之间是否有特定的关系 即已知头实体h和关
  • Neo4j数据导入与可视化

    本文共1262个字 xff0c 预计阅读时间需要5分钟 简介 Neo4j是一个高性能的NoSQL图形数据库 xff0c 它将结构化数据存储在网络上而不是表中 它是一个嵌入式的 基于磁盘的 具备完全的事务特性的Java持久化引擎 xff0c

随机推荐

  • 用户身份链接方法——DeepLink

    论文 xff1a DeepLink A Deep Learning Approach for User Identity Linkage UIL xff08 User Identity Linkage xff09 xff1a 用户身份链接
  • 可视化图布局算法简介

    Fruchterman Reingold FR FR算法将所有的结点看做是电子 xff0c 每个结点收到两个力的作用 xff1a 其他结点的库伦力 xff08 斥力 xff09 f a d
  • Windows无法连接到打印机怎么办?快收藏这些正确做法!

    案例 xff1a Windows无法连接到打印机怎么办 xff1f 朋友们朋友们 xff0c 最近为了备考国考 xff0c 我特地买了个打印机回来打印资料 xff0c 但是我的Windows无法连接到打印机 xff0c 这是为什么呢 xff
  • Python爬虫Scrapy入门

    Scrapy组成 Scrapy是Python开发的一个快速 高层次的屏幕抓取和web抓取框架 xff0c 用于抓取web站点并从页面中提取结构化的数据 引擎 xff08 Scrapy xff09 xff1a 用来处理整个系统的数据流 xff
  • Mac下终端pip与pip3配置(软链接)

    缘起 今日Mac上的Python环境绝对是个asshole 系统自带一个Python2 7我官网下载一个3 6homebrew悄悄下了个3 xanaconda自带了一个3 x前天更新了一下Xcode命令行工具 xff0c 竟然给我偷偷下了个
  • 推荐系统摘要

    作为一个推荐系统的门外汉 xff0c 或者说是用户 xff0c 我觉得推荐系统有以下几个特性 推荐系统的真实目的并不是做到让用户满意 xff0c 而是提高销售能力 xff0c 业务水平和收益 一个好的推荐系统并不是推荐用户最喜爱 想要的东西
  • 数据分析岗位面试必备

    业务逻辑 数据分析遵循一定的流程 xff0c 不仅可以保证数据分析每一个阶段的工作内容有章可循 xff0c 而且还可以让分析最终的结果更加准确 xff0c 更加有说服力 一般情况下 xff0c 数据分析分为以下几个步骤 xff1a 业务理解
  • 基于LDA的文本主题聚类Python实现

    LDA简介 LDA xff08 Latent Dirichlet Allocation xff09 是一种文档主题生成模型 xff0c 也称为一个三层贝叶斯概率模型 xff0c 包含词 主题和文档三层结构 所谓生成模型 xff0c 就是说
  • Neo4j-import导入CSV的数据

    本文共1215个字 xff0c 预计阅读时间需要4分钟 最近有个上亿个关系 节点的数据需要导入到Neo4j xff0c 有以下几个工具可以导入 xff1a Cypher CREATE 语句 xff0c 为每一条数据写一个CREATECyph
  • Ajax与jQuery异步加载数据

    本文共1096个字 xff0c 预计阅读时间需要4分钟 简介 一次性从服务器数据库中读取数据并传送到前端页面上是不现实的 xff0c 一方面会加重服务器的压力 xff0c 另一方面客户的带宽资源也会被占用 Ajax刚好可以解决数据异步加载的
  • 图注意力网络(GAT) TensorFlow解析

    论文 图注意力网络来自 Graph Attention Networks xff0c ICLR 2018 https arxiv org abs 1710 10903 注意力机制 代码 span class token keyword im
  • 知识图谱属性与关系区别

    本文共674个字 xff0c 预计阅读时间需要3分钟 知识图谱中属性和关系的区别主要是在于其面对的实体不同 实体关系分为两种 xff0c 一种是属性property xff0c 一种是关系relation 其最大区别在于 xff0c 属性所
  • 知识融合(实体对齐)笔记

    本文共1132个字 xff0c 预计阅读时间需要4分钟 知识融合 本体匹配 xff08 ontology matching xff09 侧重发现模式层等价或相似的类 属性或关系 xff0c 也成为本体映射 xff08 mapping xff
  • C/C++/Windows/VC/MFC/Unix/Linux编程书籍推荐

    C C 43 43 编程书籍 C Primer Plus C 43 43 Primer C 43 43 Primer Plus C和指针 C陷阱与缺陷 C专家编程 C 43 43 沉思录 C语言深度剖析 Effective C 43 43
  • FR算法(Fruchterman-Reingold)Python实现

    简介Fruchterman Reingold FR FR算法将所有的结点看做是电子 xff0c 每个结点收到两个力的作用 xff1a 其他结点的库伦力 xff08 斥力 xff09 f a d
  • COVID-19知识图谱问答系统(基于REFO)

    本文共669个字 xff0c 预计阅读时间需要3分钟 简介 基于知识图谱的问答系统 xff0c 即KBQA 其中一个简单的实现方法是根据用户输入的自然语言问句 xff0c 转化为图数据库中的关系查询 xff0c 最终将数据库中的实体及关系呈
  • 黑暗森林:知识图谱的前世今生

    黑暗森林 宇宙就是一座黑暗森林 每个文明都是带枪的猎人 像幽灵般潜行于林间 轻轻拨开挡路的树枝 竭力不让脚步发出一点儿声音 连呼吸都必须小心翼翼 他必须小心 因为林中到处都有与他一样潜行的猎人 如果他发现了别的生命 能做的只有一件事 开枪消
  • 图神经网络(GNN)TensorFlow实现

    图神经网络的研究与图嵌入或网络嵌入密切相关 xff0c 图嵌入或网络嵌入是数据挖掘和机器学习界日益关注的另一个课题 图嵌入旨在通过保留图的网络拓扑结构和节点内容信息 xff0c 将图中顶点表示为低维向量 xff0c 以便使用简单的机器学习算
  • BERT-BiLSTM-CRF命名实体识别应用

    引言 本文将采用BERT 43 BiLSTM 43 CRF模型进行命名实体识别 xff08 Named Entity Recognition 简称NER xff09 xff0c 即实体识别 命名实体识别 xff0c 是指识别文本中具有特定意
  • 知识图谱综述论文阅读

    论文摘要 论文为A Survey on Knowledge Graphs Representation Acquisition and Applications xff0c 发表日期2020年 xff0c 论文PDF xff0c 点击链接