Freebase RDF 转储的 Jena 解析问题(2014 年 1 月)

2023-12-04

我正在尝试使用 Jena 解析 freebase 转储文件 freebase-rdf-2014-01-12-00-00.gz (25 GB)。 耶拿报告了许多有关不良数据的问题。 示例 - 150.0 无效,true 和 false 值无效 我通过在转储文件中在小数和真/假周围添加双引号解决了这些问题。 但问题仍然存在reported by Jena.(current - org.apache.jena.riot.RiotException: [line: 161083, col: 110] Illegal object: [MINUS])

有什么方法可以预处理这些数据,这样我就不必一一解决每个问题。 我的Java代码:

    // Open TDB dataset
    String directory = "D:/test_dump";
    Dataset dataset = TDBFactory.createDataset(directory);

    // Assume we want the default model, or we could get a named model here
    Model tdb = dataset.getDefaultModel();

    // Read the input file - only needs to be done once
    String source = "D:/test_dump/fixed-freebase-second-rdf.gz";
    FileManager.get().readModel( tdb, source, "N-TRIPLES" ); 

数据采用 Turtle 格式,而不是 N-Triples。他们使用各种 Turtle 缩写(例如true for "true"^^xsd:boolean或号码-27 for "-27"^^xsd:integer).

可能仍然存在错误,因为它们的转储还包含非法语法,例如用于$在前缀名称中没有必要的\

在事物周围添加引号changesRDF。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Freebase RDF 转储的 Jena 解析问题(2014 年 1 月) 的相关文章

  • 如何在任意长度的sparql路径中使用Union/or?

    我使用下面的查询从 DBPedia 本体中查找具有城市域 或城市超类 或国家范围 或国家超类 的所有属性 当我使用固定长度的路径时没有问题但是当我把 要定义任意长度的路径 我收到此错误 Virtuoso 37000 错误 SP031 SPA
  • 计算OWL本体中子类的深度

    我正在寻找一个 SPARQL 查询 它可以返回 OWL 层次结构中指定子类的位置 我研究了几个例子 但我能达到的最好结果是计算指定超类与其子类之间的相对路径 感谢约书亚 泰勒 https stackoverflow com a 230949
  • DatatypeProperty、ObjectProperty 和FunctionalProperty 之间有什么区别,什么时候应该使用它们?

    在编写本体时 有几种非常常用的类型 包括 数据类型属性 对象属性 功能特性 反函数性质 前三个看起来像是以一组特定的方式使用 但我发现我对它们的想法受到了我在 FOAF 中的使用方式的挑战 它们分别在什么时候应该使用或者什么时候不应该使用
  • Sparql 查询永远运行

    我在耶拿执行 SPARQL 查询时遇到了困难 结果导致了我无法理解的行为 我正在尝试查询 Esco 本体 https ec europa eu esco download https ec europa eu esco download 我
  • 禁用 apache.http.wire 调试日志

    我正在将 Travis CI 与我的 github 存储库 java 项目 一起使用 我的一项测试使用 SPARQL 和 Jena 从 Dbpedia 获取数据 它导致我在日志中将许多记录打印到 Travis 输出中 从而导致 Travis
  • RDF 读取/解析错误

    我有一些 RDF 文件 我想将其导入到 tripplestore AllegroGraph 中 但在第一个文件中 我收到 SAX 解析器错误 指出存在无法识别的字符 删除有问题的行后 一切都很好 然后我尝试使用 W3C RDF 验证器和带有
  • RDF 文件转换为 Excel 可读格式

    我下载了 ttl 格式的 rdf 文件 我是 RDF 新手 我想看看是否可以以某种简单的 txt csv 格式获取数据 有谁知道如何做到这一点 RDF 有一个非常简单的数据模型 它只是subject predicate object 您可以
  • 如何将嵌入的 Blazegraph 内容转储到 RDF 文件?

    I have 创建了 blazegraph RDF4J 存储库和连接 https wiki blazegraph com wiki index php Sesame API Tutorial在斯卡拉中 val props new Prope
  • 如何推断两个人之间的财产是兄弟

    我需要推断一个人是另一个人的兄弟 如果他们有同一个父亲 所以 如果我有这个 巴特有父亲荷马 丽莎有父亲荷马 Because Bart and Lisa有同一个父亲 我想推断 丽莎有弟弟巴特 有没有什么方法可以利用任何属性特征来做到这一点 使
  • SPARQL - 查找具有最相似属性的对象

    假设有一个人的 RDF 数据库 每个人都有许多三元组来定义这个人的朋友 这么多 person x hasFriend otherPerson 如何找到拥有最相似朋友的人 我是 SPARQL 的新手 这似乎是一个非常复杂的查询 基本上 结果将
  • 如何使用SPARQL计算有向图的最大度?

    我在两个单独的查询中计算了有向图中每个节点的入度和出度 SELECT s COUNT AS outdegree s p o GROUP BY s ORDER BY DESC outdegree SELECT o COUNT AS indeg
  • 如何使用 SPARQL 区分事物和无生命物体

    使用 SPARQL 我可以很轻松地获取有关某些资源的所有相关信息 但我很难弄清楚如何真正区分事物和资源things 其中Thing是所有类的超类 是无生命的物体 例如杯子 勺子 铅笔等 例如 下面是 DBPedia 中的一些无生命物体 Fo
  • 从 RDF 节点拉出字符串

    在使用 Jena 的 SPARQL 查询时 我试图以更易读的格式获取数据 但是我不知道如何以正确的方式提取数据 就目前而言 输出是 http www w3 org TR 2003 PR owl guide 20031209 wine Sau
  • W3C 验证器无法处理 RDF/XML

    我正在尝试描述一个非常基本的地铁火车站地图 其中包含站点和时间 这个 RDF 到 Turtle 转换器 http rdf translator appspot com 可以解析我的 XML 但 W3C 验证器抛出 Error Your do
  • 两个本体之间的映射

    我如何使用 owl sameas 来链接两个本体 如果我有本体A c rdf type owl Class 和本体B d rdf type owl Class 我想将两个本体与共享概念 c 和 d 联系起来 我读过有关 owl sameas
  • 通过SPARQL UPDATE从本体中删除空白节点

    我在 SPARQL UPDATE 插入 操作的帮助下将一些数据存储在 protege 中制作的本体模型中 以下是更新查询 PREFIX test
  • 什么是适合 .net 的优秀 RDF 库? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个可以处理 RDF 和 OWL 数据的库 到目前为止我已经发现 semweb http razor occams info c
  • SPARQL 查询在 Fuseki 中有效,但在 Jena TDB 中无效

    我将数据组织在多个图表中 保存三元组的图表很重要 数据结构很复杂 但可以简化如下 我的商店包含蛋糕 其中有不同蛋糕类型的层次结构 所有子类
  • 为什么 RDF 中对对象使用代码而不是字符串?

    例如 entity f06574 rdfs label Orioles 或者这样的格式 tt0268252 a Movie 在任一情况下 f06574 and tt0268252是代码 而不是实体或实例的实际字符串 原因之一可能是因为同一个
  • 在 SPARQL 中计算满足约束的值,并为不满足约束的值返回 0

    我想使用 SPARQL 查询检测满足属性值条件的所有值 例如 假设我想检测其中值的所有资源rdfs label有类型xsd string 逻辑上的定义可以是 x 字符串标签 x y rdfs 标签 x y xsd 字符串 y 我找到了一种在

随机推荐

  • matplotlib 一起使用 twinx 和 twiny(如 twinxy)

    我可以同时拥有 twinx 和 twiny 即类似 twinxy 的东西 吗 我想将 CDF 放在条形图上 其中条形图的 X 轴采用对数刻度 我无法将 Y 放在一起 因为与 CDF 的 0 1 相比 条形图 y 范围非常大 有任何想法吗 T
  • 考虑到数据帧的一列中存在重复项,如何删除数据帧中的行

    嗨 亲爱的 我对列中有重复项的数据框有一个小问题 我想删除列中出现重复项的行 例如我的数据框是这样的 Value City Card Type ID 100 Michigan Silver 001 120 Angeles Gold 002
  • Azure Web 应用程序间歇性崩溃

    我们的 Web 应用程序无缘无故地开始崩溃 目前我不知道会发生什么情况 我们正在为 SOAP 服务运行基本身份验证 并为主 Web 应用程序运行 ADFS 崩溃可能发生在一天中的任何时间 这是一个测试环境 流量相当低 当检测到崩溃时 我在下
  • 使用 Http JSON AngularJS 2 时出错

    在尝试了几种在线教程后我无法使其工作 我尝试使用以下代码 import Http HTTP PROVIDERS from angular2 http Component viewProviders HTTP PROVIDERS templa
  • 默认 HTML/CSS 链接颜色是什么?

    我需要它的代码表示 比如 FFFFFF 从 HTML5 开始 超链接的前景色等正在以以下形式实现标准化 预期默认渲染行为指南 特别是 取自该部分措辞内容 未访问和已访问的超链接的建议默认颜色如下 link color 0000EE visi
  • 在写入时读取 XML 文件(用 Python)

    我必须监视全天运行的工具正在写入的 XML 文件 但 XML 文件直到最后才正确完成并关闭 与 XML 流处理相同的约束 即时解析不完整的 XML 文件并触发操作 跟踪文件中的最后位置以避免从头开始再次处理 关于回答需要在 Python 中
  • 如何根据文件扩展名过滤 git diff?

    有没有限制的选项git diff一组给定的文件扩展名 是的 如果你确保 git 扩展一个 glob 而不是你的 shell 那么它会在任何级别匹配 所以像这样的东西 引号很重要 应该可以正常工作 git diff c h
  • 如何将报亭集成到应用程序中

    我想在我的应用程序中集成 iOS5 NEWSSTAND 的新功能 但我很困惑如何开始 有谁能够帮助我 有它的示例代码吗 任何人都可以知道如何在我们的应用程序中实现它 谢谢 创建 Apple NewsStand 应用程序的非常好的教程 htt
  • 如何选择具有相同类名的所有元素?

    我有一个布尔变量 它存储在隐藏的输入字段中 基本上 如果用户已登录 则false 如果不是 那就是true 有下载按钮将链接到文件下载 我的目标是这样 如果他们没有登录 按钮将不会显示 并且链接将不起作用 如果有一个警报说他们需要登录或其他
  • IIS7 URL 重写规则执行从 *.html 文件到 *.php 文件的 301 重定向

    我想使用 IIS7 的 URL 重写模块根据特定模式创建 301 重定向 我有一个仅包含 HTML 文件的网站 我正在将该网站转换为 PHP 文件 但保留所有相同的文件名 例如 以下网址 index html contact contact
  • 使用 ag-grid 单元格内的值和 ID 进行选择?

    我对 ag grid 很陌生 正在评估它 我的项目的数据有多个查找表 即 Foo 有 Bar 类别 Baz 品牌和 Boo 类别 我希望能够在 ag grid 中编辑它们 不幸的是 这些查找表不在我的控制范围内 而且我并不总是有连续的 ID
  • 为什么“linq to sql classes”在创建类时会更改表的名称?

    我进入并在 Visual Studio 中添加一个新的 linq to sql 类 然后将一个表从数据库资源管理器拖到新的 DBML 中 新类的名称不再是复数 如果我仍然希望它是复数怎么办 如果我拖动一个不是复数的表 我会收到一堆编译错误
  • XML 到 JSON 还是数组? PHP

    我在想 如果我可以通过 func 运行 XML 来验证它 针对模式 然后将 XML 转换为 json 以便于对象访问 那么它可能能够使用和处理 XML 数据 如何轻松地将 XML 转换为 JSON json json encode simp
  • 类型“void”上不存在属性“then”

    我应该如何处理 Typescript 错误 Property then does not exist on type void 我的代码如下所示 import Component from angular core import Socia
  • C# 一旦主线程睡眠,所有线程都停止

    我有一个类运行生产者 消费者模型 如下所示 public class SyncEvents public bool waiting public SyncEvents waiting true public class Producer p
  • hash() 随机化在密码学上是否被认为是强大的?

    从CPython 3 3 默认情况下启用哈希随机化 在以前的版本中 可以通过指定来打开它 R命令行选项或通过设置PYTHONHASHSEED环境变量 to random 引用了文档 默认情况下 hash str bytes 和 dateti
  • 如何使 MVC POST 返回上一页?

    我有以下操作 该操作是从带有记录列表的屏幕调用的 HttpPost Authorize Roles admin public ActionResult Edit EditViewModel itemView 操作完成后 我想返回调用该操作的
  • 查找矩阵中最高值的行索引和列索引

    矩阵中最大值的位置 行和列 可以通过以下方式找到 ma lt matrix 1 50 nrow 5 which ma max ma arr ind TRUE 如果我们不想要最大值的坐标而是 N 个最高值的坐标怎么办 就像是 order ma
  • 在 MVC5 中使用异步有什么优势?

    有什么区别 public ActionResult Login LoginViewModel model string returnUrl if ModelState IsValid IdentityResult result Identi
  • Freebase RDF 转储的 Jena 解析问题(2014 年 1 月)

    我正在尝试使用 Jena 解析 freebase 转储文件 freebase rdf 2014 01 12 00 00 gz 25 GB 耶拿报告了许多有关不良数据的问题 示例 150 0 无效 true 和 false 值无效 我通过在转