【知识图谱】基本概念&数据&综合应用&具体使用

2023-11-15

1.基本概念

知识图谱主要作用:查找和匹配
难点:怎么构建
知识图谱不只是个图模型,拿到点后能不能进行预测,分析,能不能让这个ai基于这个图模型做出诊断与分析工作,graph embedding是最核心的事情了,将点参数化

1.1知识图谱组成

在这里插入图片描述
在这里插入图片描述
<例> 例如上图的人,人有关键点,组成局部信息,有人和骨架图之后,怎么综合利用图模型进行分析。淘宝出现的数据,在抖音会出现;去上海看房子,青岛的,成都的也开始打电话了。
在这里插入图片描述
<例>挑出实体,寻找实体的联系和属性。
<引申> 不光视觉,听觉还有文本,尽可能的把知识融合在一起,形成一个图模型,有复杂的关系网络。把所有的人情世故,关系融合在一起,则是知识图谱。图模型把所有信息连接起来了。

1.2 应用

1.2.1 应用一 医疗领域方向检索

方式:利用历史数据,使看病更简单
目的:便于检索
在这里插入图片描述

1.2.2 应用二 金融领域反欺诈-金融知识图谱

可以从下载大量贷款app等相关信息入手
在这里插入图片描述

1.2.3 推荐系统

从实体角度出发etc.
在这里插入图片描述

2.数据

2.1 文本数据

文本数据是最好获得的,故知识图谱是nlp的重要应用,做知识图谱需要用到大量nlp技术。

2.2 难点

可能是图片可能是音频视频等非结构化数据
在这里插入图片描述

2.3 方法

有许多开源的nlp工具包,语义识别,角色标注,时间,地点,人名等(哈工大做nlp较多)。首先先打标签。
在这里插入图片描述

2.3.1 分句、分词、主谓关系

关于标注,有很多是可以用工具包去做

2.3.2 打标签

在这里插入图片描述

2.3.3 找关系

2.3.3.1 实体关系

在这里插入图片描述

3.知识图谱综合应用——跳出nlp

比如侦察凶杀案,进行推理工作。

3.1 神经网络引入

传统上输入向量输出结果,每个嫌疑人作为一个向量输入节点。那么如何将一个节点输入一个向量啊。
除了传统的搜索,现在知识图谱尝试做推理预测工作。比如图识别,embedding把每一个节点编码成一个向量,比如一个图识别,首先将识别道的点进行编码,除了本身固有的属性(实物本身的身高,体重)。

3.1.1 传统图像猫狗识别

识别出了点后进行二分类,识别是猫是狗

在这里插入图片描述
用到图模型就得用特征
在这里插入图片描述

3.2 视觉领域:与图卷积结合

对人的局部特征关节点特征提出来,需要提出局部特征(如头、肩膀)与联系,行动过程中,会有联系。比如人在运动的时候,头和肩膀的关系比较大,就不是简单的局部特征的卷积。再进行一些融合,在图模型中进行卷积,即也有graph embedding。
图匹配,两张图不同角度的关节点信息进行一对一的匹配,但有的会有遮挡,则不完全一对一
在这里插入图片描述
怎么样做特征,不仅仅是构建图,更重要的是我可以用这个图做个什么事。如果能把其中每个实体用向量表示出来就无敌了。
检测,分析,识别算法用上去,想玩什么玩什么。
对于知识图谱不仅仅是用nlp技术构建一个图谱更重要的是利用这个做事。
在这里插入图片描述

4 知识图谱的使用

4.1 算法固定,难点是根据场景构建特定图谱

在这里插入图片描述

4.2 报错好解决,选Neo4j

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【知识图谱】基本概念&数据&综合应用&具体使用 的相关文章

随机推荐

  • Mock入门

    关键参数 name 唯一标识 return value 当被调用时 返回的值 可为函数 side effct 当存在时 return value不生效 返回side effect 导入库 from unittest import mock
  • 用户画像-标签体系

    1 前言 最近在学习用户画像 翻看了 彭友会 的七十多份资料 简单过了一遍赵宏田老师的书 最近又看了许多微信公众号里的文章 整体感受就是 资料太杂 内容太乱 重复的太多 相互间也会有些冲突 但大致可以归为两类 赵宏田老师的一套 另外其它的一
  • PDF文件复制文字

    最近在看电子书时 发现有的一些 PDF 文件看起来像是扫描的 但能直接复制文字 有的则不能 查找相关资料后明白了 不能复制的pdf文件 01 pdf文件加密了 02 扫描和图形格式做的PDF文件 PDF文件如果加密了 对于一些不允许做修改
  • Android关于AutoService、Javapoet讲解

    AutoService会自动在META INF文件夹下生成Processor配置信息文件 该文件里就是实现该服务接口的具体实现类 而当外部程序装配这个模块的时候 就能通过该jar包META INF services 里的配置文件找到具体的实
  • ChatGPT不能代替人类写作的四个原因

    近期留学圈最火的C位当属ChatGPT 作为一款OpenAI开发的语言模型 ChatGPT在文本生成上的优秀表现大大助力了母语非当地语言的留学生们 写邮件 翻译并理解文本乃至写代码 ChatGPT似乎所向披靡 不少同学也产生了这个想法 用它
  • pageHelper分页失效解决方案

    前言 pageHelper是一款优秀的Mybatis分页插件 在项目中可以非常便利的使用 使开发效率得到很大的提升 但不支持一对多结果映射的分页查询 所以在平时的使用时 对于一对多分页会出现分页错误 这篇文章主要对pageHelper分页错
  • activiti学习之服务任务

    写在前面 对于工作流 我们使用最多的是用户任务节点 用户任务节点就是给用户来生成任务的 需要人来手动的处理 而与之对应的还有服务任务节点 这种类型的节点需要人手动的参与而是程序来执行 即执行某个类的某个方法 这个类一般是org activi
  • Java 实现 MD5 加密算法

    1 MD5 加密算法 1 1 MD5 算法介绍 MD5 消息摘要算法 英文 MD5 Message Digest Algorithm 一种被广泛使用的密码散列函数 可以产生出一个128位 16字节 的散列值 hash value 用于确保信
  • 子图匹配算法——VF2算法讲解

    讲的很通透了 https zhuanlan zhihu com p 259393192
  • CSS五款超好用的布局网站

    CSS Grid Generator https cssgrid generator netlify app CSS Layout https csslayout io Flexbox Generator https loading io
  • vtkdicom0.8_vtk9.2_dcmtk3.6.7_qt6.2编译OK

    目录 0 结果展示 1 cmake要点 2 编译报错解决 3 参考链接 0 结果展示
  • 吃透Chisel语言.23.Chisel时序电路(三)——Chisel移位寄存器(Shift Register)详解

    Chisel时序电路 三 Chisel移位寄存器 Shift Register 详解 上一篇文章介绍了Chisel计数器以及一些高级用法 内容很多 学下来肯定收获也会很多 除了计数器以外 还有一种寄存器的应用十分广泛 那就是移位寄存器 这一
  • Linux Test Project(一)

    http www vimlinux com lipeng 2014 09 12 ltp Testing Linux one syscall at a time LTP是从SGI开始的 后由IBM 思科 富士通 SUSE Redhat等组织开
  • Java多线程下 ThreadLocal 的应用实例

    ThreadLocal很容易让人望文生义 想当然地认为是一个 本地线程 其实 ThreadLocal并不是一个 Thread 而是 Thread 的局部变量 也许把它命名为 ThreadLocalVariable更容易让人理解一些 当使用
  • jQuery Ajax 初始化方法

    ajaxSetup headers Authorization auth token cache false 禁用缓存 dataType json contentType application json contentType appli
  • 《深入理解java虚拟机》笔记

    深入理解java虚拟机 走进java java不仅仅是一门编程语言 还是一个由一系列计算机软件和规范形成的技术体系 她有以下优点 结构严谨 面向对象 摆脱硬件平台的限制 实现了一次编写 到处运行 提供了一个相对安全的内存管理和访问机制 有一
  • 面向文本和视觉线索联合推断的多模态上下文推理方法

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入 报告题目 面向文本和视觉线索联合推断的多模态上下文推理方法 内容简介 联合文本和视觉线索条件推理任务是一项复杂多模态推理任务 其中 文本线索提供与视觉内容互补的先验假设或者外部知
  • 学习笔记-创建赫夫曼树

    赫夫曼树 给定 n 个权值作为 n 个叶子结点 构造一棵二叉树 若该树的带权路径长度 wpl 达到最小 称这样的二叉树为最优二叉树 也称为哈夫曼树 Huffman Tree 还有的书翻译为霍夫曼树 赫夫曼树是带权路径长度最短的树 权值较大的
  • 学会项目成本管理计算,PMP计算题就是送分题

    学会项目成本管理计算 PMP计算题就是送分题 PMP中的计算主要在 lt 项目成本管理 gt 的控制成本部分 服务于挣值管理 EVM Earned Value Management 挣值分析 EVA Earned Value Analysi
  • 【知识图谱】基本概念&数据&综合应用&具体使用

    知识图谱 基本概念 数据 综合应用 具体使用 1 基本概念 1 1知识图谱组成 1 2 应用 1 2 1 应用一 医疗领域方向检索 1 2 2 应用二 金融领域反欺诈 金融知识图谱 1 2 3 推荐系统 2 数据 2 1 文本数据 2 2