如何构建知识图谱？

2024-01-10

我用 PageRank 制作了一个可以在我的计算机上运行的小型搜索引擎的原型。我有兴趣在其之上构建一个知识图，它应该只返回在正确上下文中的查询网页，类似于谷歌如何找到搜索问题的相关答案。我看到了很多关于知识图的宣传，但没有很多文献，而且几乎没有像构建知识图的指南这样的伪代码。有谁知道有关此类知识图在内部如何工作的良好参考资料，这样就无需创建有关知识图谱的模型？

知识图谱是一个流行词。它是为实现结果而组合的模型和技术的总和。您旅程的第一站始于自然语言处理 http://en.wikipedia.org/wiki/Natural_language_processing, 本体论 http://en.wikipedia.org/wiki/Ontology_learning and 文本挖掘 http://en.wikipedia.org/wiki/Text_mining。人工智能是一个广阔的领域，去here http://soda.swedish-ict.se/3600/1/SICS-T--2009-06--SE.pdf进行该领域的研究调查。

在构建自己的模型之前，我建议您使用专用工具箱尝试不同的标准算法，例如gensim https://radimrehurek.com/gensim/。您将了解 tf-idf、LDA、文档特征向量等。

我假设您想使用文本数据，如果您想使用其他图像进行图像搜索，那就不同了。音频部分也一样。

构建模型只是第一步，谷歌知识图最困难的部分是实际上每天扩展到数十亿个请求......

一个好的处理管道可以“轻松地”构建在阿帕奇火花 https://spark.apache.org/、“当前一代 Hadoop”。它提供了一个有弹性的分布式数据存储，如果您想扩展，这是必需的。

如果您想将数据保留为图表，就像图论（如 pagerank）中那样，用于实时查询，我建议您使用Bulbs http://bulbflow.com/overview/这是一个“类似于图形的 ORM，但不是 SQL，而是使用图形遍历语言 Gremlin 来查询数据库”的框架。例如，您可以将后端从 Neo4j 切换到 OpenRDF（如果您做本体论，则很有用）。

对于图形分析，您可以使用 Spark，GraphX https://spark.apache.org/graphx/模块或GraphLab https://dato.com/products/create/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何构建知识图谱？的相关文章

如何仅使用单个数组在 JavaScript 中模拟调用堆栈

我正在看维基百科页面 https en wikipedia org wiki Call stack在调用堆栈上并尝试理解这个图像据我所知哈哈 const memory memory 0 3 top of stack pointer m
代表 Git 存储库的数学结构是什么

我正在学习 Git 如果我能描述一下代表 Git 存储库的数学结构那就太好了例如它是一个有向无环图它的节点代表提交它的节点有代表分支等的标签每个节点最多一个标签没有标签使用两次我知道这个描述不正确我只是想解释我正在寻找的内
shell脚本中关联数组的时间复杂度

我想知道在 shell 脚本中使用关联数组时如何构造实现另外我想知道基于 shell 脚本的关联数组的时间复杂度是否是最佳的因为我们可以使用字母和数字作为它们各自的键编辑他们使用什么哈希函数如果您使用关联数组则不能通过使用
迭代任意大小的子集

我可以迭代大小为 1 的子集 for int a 0 a lt size a 或大小为 2 的子集 for int a1 0 a1 lt size a1 for int a2 a1 1 a2 lt size a2 or 3 for int
如何计算 Postgres 上图表中所有连接的节点（行）？

我的桌子有account id and device id One account id可以有多个device ids 反之亦然我正在尝试计算每个连接的多对多关系的深度 Ex account id device id 1 10 1 11
归并排序中递归树的高度log(n)+1是怎么来的

我按照 stackoveflow 的建议阅读了一些问题和答案我正在遵循 cormen 的算法简介一书进行自学那本书里已经解释得很清楚了但唯一没有解释的是如何在合并排序分析中计算树的高度如果在后面的章节中对此进行解释的话我仍然在
在鼠标光标位置添加 cytoscape 节点

我想在画布上的单击事件上的鼠标箭头位置添加一个 cytoscape 节点我怎样才能做到这一点我的方法效果不太好我可以通过单击创建一个节点但无法确保创建的节点的位置位于我单击的位置使用这样的东西 cy click function
以编程方式在 App Store 上运行搜索？

是否可以从我的应用程序中打开 App Store 应用程序并运行搜索我想看看是否有一个 appstore 类型的 URL 可以使用就像 mailto 和 sms 分别打开邮件和短信一样有谁知道这是否可能编辑更多信息我一直在尝试使
两组点之间的最佳匹配

I ve got two lists of points let s call them L1 P1 x1 y1 Pn xn yn and L2 P 1 x 1 y 1 P n x n y n 我的任务是找到它们点之间的最佳匹配以最小化它
实施二分查找有哪些陷阱？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案二分查找比看起来更难实现虽然二分搜索的基本思想相对简单但细节可能出人意料地棘手 Donald Knuth 新的二分搜索实现中最有可
在java中使用BUBBLE SORT对二维字符串数组进行排序

类似的问题已经被问过但从来没有关于二维字符串数组因此在尝试了很长时间之后我找不到我想要的我正在尝试使用 BubbleSort 对 java 中的 2D 字符串数组进行排序作为输入我收到一个二维字符串数组一个表以及您应该排序的
解开 Knuth 的结：如何重构意大利面条式代码？

这个问题的灵感来自如何将流程图转化为实施 https stackoverflow com questions 36647765它询问如何通过算法消除goto代码中的语句这answer https stackoverflow com a 3
n 或 nlog(n) 比常数时间或对数时间更好吗？

在 Coursera 上的普林斯顿教程中讲师解释了遇到的常见增长顺序函数他说线性和线性算术运行时间是我们努力的目标他的推理是随着输入大小的增加运行时间也会增加我认为这是他犯了错误的地方因为我之前听过他提到线性增长顺序对于高
每个术语出现的次数

我得到了一个数组a n 2 where n can be 10 5最大时有n个科目和n个学生全部编号为 1 2 n a i 0 and a i 1 1 lt i lt n 表示在第 i 个科目中所有来自a i 0 to a i 1 通过
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
在数据库中搜索时忽略空文本框

此代码能够搜索数据并将其加载到DataGridView基于搜索表单文本框中提供的值如果我将任何文本框留空则不会有搜索结果因为 SQL 查询是用 AND 组合的如何在搜索从 SQL 查询或 C 代码时忽略空文本框 private
如何对对象进行排序？（画家算法）

所以我有 4 个矩形形状我正在尝试应用排序算法画家算法 https en wikipedia org wiki Painter 27s algorithm 来知道我需要先绘制哪些形状在 3d 中然后绘制哪个形状 Note 相机位于右
使用 Java 进行树可视化 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个库来生成图形或树例如组织图表该库应该能够从该图中生成纯图像有谁知道一个好的希望开源
C# 存档中的文件列表

我正在创建一个 FileFinder 类您可以在其中进行如下搜索 var fileFinder new FileFinder new string C MyFolder1 C MyFolder2 new string
如何计算排列？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个关于 Java 排列的问题 Suppose I have five different elements in an arra

随机推荐

SSL 安全 SaaS 应用程序的 URL 设计

我正在使用 ASP NET MVC 平台开发一个应用程序它将作为一项服务通过网络公开 SaaS http en wikipedia org wiki Software as a Service模型我正在尝试确定为每个用户帐户划分 URL
将静态库添加到同一解决方案中的项目 (Visual Studio 2012)

我正在尝试创建一个将在项目中使用的静态库该库编译良好并为其创建 lib 文件为了测试我的代码我向同一解决方案添加了另一个项目当我尝试构建测试项目时出现以下错误错误 LNK1120 4 个未解析的外部错误 LNK2019 函数
Mysql 慢查询日志正在记录更快的查询

我在数据库服务器上设置了mysql慢查询日志并将长查询时间设置为5 刚刚检查了日志及其日志查询只需几毫秒有人知道为什么会这样吗这是一些日志最后一个查询并不是最优化的它说它检查了 450000 行所以我在日志中看到它不会感到惊讶
为 Jboss 启用 gzip 压缩

Jboss 5 1 0 的 gzip 压缩是如何启用的在 tomcat http 连接器内对吗我不记得这个文件存储在哪里 server xml 编辑 jboss server default deploy jbossweb sar se
Go Flush() 不起作用

请检查一下这个要点并告诉我出了什么问题为什么我看不到我的消息要旨 https gist github com cnaize 895f61b762a9f5ee074c https gist github com cnaize 895f6
如何在 Android 中使用 Intent 拨打电话？

我正在使用以下代码在 Android 中拨打电话但它给了我安全异常请帮助 posted by 111 333 222 4 String uri tel posted by trim Intent intent new Intent In
如何在 SQL 中找到连续的活跃周？

我想做的是找到某人在周日活跃的连续周数并为其分配一个值他们每天必须参加至少 2 场比赛才能算作本周的活跃比赛如果它们连续 2 周活跃我想指定值为 100 连续 3 周指定为 200 连续 4 周指定为 300 并持续最多连续 9 周
JUunit 测试用例中内部图形尚未初始化

我正在使用 JavaFx 制作一个轻量级绘画应用程序我的一些问题LayerController类及其方法addLayer所以我认为编写一些 JUnit 测试用例来检查我的方法的正确性是一个好主意简而言之我正在画一个Canvas使用它的
如何创建具有格式的字符串？

我需要创建一个String具有可以转换的格式Int Int64 Double等输入String 使用 Objective C 我可以通过以下方式做到这一点 NSString str NSString stringWithFormat d f
MySQL 类似断言的约束

我是MySQL新手我刚刚发现它不支持断言我得到了这张表 CREATE TABLE guest ssn varchar 16 NOT NULL name varchar 200 NOT NULL surname varchar 200 N
UIImage 上的圆角

我正在尝试使用圆角在 iPhone 上绘制图像就像联系人应用程序中的联系人图像一样我的代码通常可以工作但它偶尔会在 UIImage 绘图例程中崩溃EXEC BAD ACCESS KERN INVALID ADDRESS 我认为这可能与
为什么新的 AKSequencer 不发出任何声音？

我有一个相当复杂的应用程序到目前为止一直在使用 AKAppleSequencer 但由于该定序器时不时出现一些奇怪的行为和错误我一直希望迁移到较新的 AKSequencer 不幸的是新的音序器似乎没有在 Playgrounds 或太多
On Key Down 限制用户输入一些特殊字符

我想限制用户在工具栏搜索中不允许他她使用一些特殊字符例如 gt tblFundComp bind keydown function e if e keyCode gt 48 e keyCode lt 57 return false el
Spring Security 配置 anyRequest().authenticated() 未按预期工作

我对spring security配置的理解http anyRequest authenticated 是任何请求都必须经过身份验证否则我的 Spring 应用程序将返回 401 响应不幸的是我的 spring 应用程序不会以这种方式
如何解析命令行参数？

我想解析 perl 脚本中的参数列表例如我有这种情况 script pl h 127 0 0 1 u user p pass arg1 arg2 arg3 我该如何解析数组中不是选项的参数列表以及标量值中的选项参数 Thanks 好吧如
升级 3.0.3 -> 3.2.2 后，NServiceBus 端点寻找 RavenDB 超时

使用 NuGet 我将项目中的所有 NServiceBus 引用从 3 0 3 升级到 3 2 2 对于此解决方案中的 4 个服务我还为它们提供了对 NuGet 中的 NServiceBus Host 的引用我将二进制文件部署到测试环境
formik中的submit Form、handleSubmit、onSubmit有什么区别？

福米克医生说 https jaredpalmer com formik docs guides form submission https jaredpalmer com formik docs guides form submission
从 Roslyn 方法调用中的相应参数获取方法参数的名称

我想知道是否有一些现有的逻辑可以通过查看该特定方法构造函数的调用来获取有关其包含的方法构造函数签名中的参数定义的名称或任何其他相关信息基本上我只是希望能够获得一个变量的默认名称该名称将作为参数传递给调用因此如果一个方法定义如
Flexbox 使用align-items: flex-start 和align-content: center

再会我正在尝试使用 Flex 框在横轴上包含多余空间的 Flex 容器中强制执行以下行为如果所有弹性项目都适合一行那么它们应该在横轴的顶部对齐但一旦它们包裹起来柔性项目应该凝结在横轴的中心为此我尝试了以下标记https js
如何构建知识图谱？

我用 PageRank 制作了一个可以在我的计算机上运行的小型搜索引擎的原型我有兴趣在其之上构建一个知识图它应该只返回在正确上下文中的查询网页类似于谷歌如何找到搜索问题的相关答案我看到了很多关于知识图的宣传但没有很多文献而且几乎

如何构建知识图谱？

如何构建知识图谱？ 的相关文章

随机推荐

热门标签

如何构建知识图谱？的相关文章