1.知识图谱
知识图谱是一种基于图的数据结构,由节点(point)和边(Edge)组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”,知识图谱本质上是语义网络。通过这种先验的知识网络,让机器像人类一样可以联想、推理。
它将不同种类的信息连接在一起得到了一个关系网络,因此知识图谱提供了从关系角度去分析问题的能力。
(1)谷歌在2012.5.16提出知识图谱的概念,为了提升搜索引擎返回的答案质量和用户的查询效率。通过知识图谱,搜索引擎不再是简单的字符串匹配,可以返回更精准,更结构化的信息,满足查询的需求。
things not strings
不要无意义的字符串,为了获取字符串背后的对象、事物(之前的搜索就是给出一大堆相匹配的字符串内容,现在给的是额外相关信息的延申以及通向这些信息的超链接,即知识图谱所提供的联想推理功能)
知识图谱可以分为通用知识图谱和领域知识图谱,通用知识图谱已经取得了很快的发展,百度等都有自己的通用知识图谱;领域知识图谱特别是中文领域内的知识图谱还有待发展,值得我们研究,比如医疗领域、科技文献领域、各种学科内领域。
2.知识图谱的前世今生
(1)1960年,语义网络的提出,就是相互连接的节点、边。比如is-a;part-of的关系,都是由自己定义的所以不太规范;
(2)1980年,引入哲学领域中的本体,本体准确定义了某一领域的概念,以及这些概念的特性、概念之间的关系属性以及属性的约束,计算机可以理解且共同接受。(感觉不好理解的朋友可以这样理解:本体就是定义了某一类别事物的共同特点,像是一个预训练模型,比如定义一个狗的本体,这个模型中有所有狗共享的一个属性,就是狗都有狗腿;本体+数据就构成了知识图谱,数据是个体的具体特定数据,本体只是整个类别共享的特点,并不包含特定个体的特点,因此本体+数据的过程也可以理解为预训练模型+下游数据集进行微调,得到解决任务的最终模型)
(3)1989年,万维网的诞生,利用连接进行跳转,超文本链接;
(4)1998年,语义链接语义网,网络上数据更加可读,不仅仅是万维网中文档之间的链接,计算机还是不懂文档中的内容,变成了文档中内容、对象的链接;
(5)2006年开放数据之间链接;
(6)2012.5.16谷歌提出kg。
知识图谱可以分为:
(1)传统的知识工程:规则明确,应用封闭(专家、人工构建)
(2)大数据知识工程:大数据、GPU、模型的发展;众包技术;高质量用户提供的高质量知识库。
知识的常见分类:
(1)事实知识:特定实体的基本事实;
(2)概念知识:概念之间相应的层级关系(父级-子级)
(3)词汇知识:上下位、同义、反义;
(4)常识知识:无须言明的知识(不言而喻的知识,很少出现在文本中)
3.知识图谱技术
知识抽取:
知识表示:
知识存储:
知识连接:
知识融合:
后续补充技术的相关笔记
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)