使用 Jena 解析 RDF 递归

2024-02-28

我正在尝试使用 Apache Jena 递归解析 RDF 文档。它由如下数据集组成：

<dcat:dataset>
    <dcat:Dataset rdf:about="http://url/" > 
        <dct:description xml:lang="ca">Description</dct:description>
        <dct:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/>
        <dcat:keyword xml:lang="ca">Keyword1</dcat:keyword>
        <dcat:distribution>
            <dcat:Download>
                <dcat:accessURL>http:/url/</dcat:accessURL>
                <dct:format>
                    <dct:IMT>
                        <rdf:value>application/pdf</rdf:value>
                        <rdfs:label>pdf</rdfs:label>
                    </dct:IMT>
                </dct:format>
                <dct:modified rdf:datatype="http://www.w3.or/2001/XMLSchema#date">2012-11-09T16:23:22</dct:modified>
           </dcat:Download>
        </dcat:distribution>
        <dct:publisher>
           <foaf:Organization>
              <dct:title xml:lang="en">Company</dct:title>
              <foaf:homepage rdf:resource="http://url/"/>
           </foaf:Organization>
        </dct:publisher>
    </dcat:Dataset>
</dcat:dataset>

到目前为止，我已经得到了位于 dcat:Dataset 正下方的每一条语句（使用 Jena 迭代 RDF 文件中的特定资源 https://stackoverflow.com/questions/16939159/iterate-over-specific-resource-in-rdf-file-with-jena），但我想找到每个级别中的每个三元组。我的输出应该如下所示：

description: Description
license: http://creativecommons.org/licenses/by/3.0/
keyword: Keyword1
distribution -> Download -> accessurl: http:/url/
distribution -> Download -> format -> IMT -> value: application/pdf
distribution -> Download -> format -> IMT -> label: pdf
...

我已经用递归函数尝试过，该函数迭代语句，当语句不是文字时，它会跟随对象到达下一个节点。像这样：

private String recursiveQuery(Statement stmt) {
    Resource subject = stmt.getSubject();
    Property predicate = stmt.getPredicate();
    RDFNode object = stmt.getObject();

    if(object.isLiteral()) {
        out.println("LIT: " + predicate.getLocalName());
        return object.toString();

    } else {
        out.println(predicate.getLocalName());
        Resource r = stmt.getResource();
        StmtIterator stmts = r.listProperties();
        while (stmts.hasNext()) {
            Statement s = stmts.next();
            out.println(s.getPredicate().getLocalName());
            return recursiveQuery(s);
        }
    }
    return null;

}

但不知怎的，我用这种方法毫无进展。非常感谢您的每一个见解。

根据您链接到的先前问题，我完成了您的数据，以便我们有一些工作数据可供使用。这是完成的数据：

<rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:dcat="http://www.w3.org/ns/dcat#"
    xmlns:skos="http://www.w3.org/2004/02/skos/core#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:owl="http://www.w3.org/2002/07/owl#"
    xmlns:dct="http://purl.org/dc/terms/"
    xmlns:dctypes="http://purl.org/dc/dcmitype/"
    xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">
  <dcat:Catalog rdf:about="http://uri/">
    <dcat:dataset>
    <dcat:Dataset rdf:about="http://url/" > 
        <dct:description xml:lang="ca">Description</dct:description>
        <dct:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/>
        <dcat:keyword xml:lang="ca">Keyword1</dcat:keyword>
        <dcat:distribution>
            <dcat:Download>
                <dcat:accessURL>http:/url/</dcat:accessURL>
                <dct:format>
                    <dct:IMT>
                        <rdf:value>application/pdf</rdf:value>
                        <rdfs:label>pdf</rdfs:label>
                    </dct:IMT>
                </dct:format>
                <dct:modified rdf:datatype="http://www.w3.or/2001/XMLSchema#date">2012-11-09T16:23:22</dct:modified>
           </dcat:Download>
        </dcat:distribution>
        <dct:publisher>
           <foaf:Organization>
              <dct:title xml:lang="en">Company</dct:title>
              <foaf:homepage rdf:resource="http://url/"/>
           </foaf:Organization>
        </dct:publisher>
    </dcat:Dataset>
    </dcat:dataset>
  </dcat:Catalog>
 </rdf:RDF>

听起来你只是想做一个深度优先搜索 http://en.wikipedia.org/wiki/Depth_first_search在类型的每个元素上dcat:Dataset。这很容易做到。我们只需选择 type 的每个元素dcat:Dataset然后从中开始深度优先搜索RDFNode.

import java.util.HashSet;
import java.util.Set;

import com.hp.hpl.jena.rdf.model.Model;
import com.hp.hpl.jena.rdf.model.ModelFactory;
import com.hp.hpl.jena.rdf.model.RDFNode;
import com.hp.hpl.jena.rdf.model.Statement;
import com.hp.hpl.jena.rdf.model.StmtIterator;
import com.hp.hpl.jena.vocabulary.RDF;


public class DFSinRDFwithJena {
    public static void main(String[] args) {
        Model model = ModelFactory.createDefaultModel();
        model.read( "rdfdfs.rdf" );

        StmtIterator stmts = model.listStatements( null, RDF.type, model.getResource( "http://www.w3.org/ns/dcat#" + "Dataset" ));
        while ( stmts.hasNext() ) {
            rdfDFS( stmts.next().getSubject(), new HashSet<RDFNode>(), "" );
        }
        model.write( System.out, "N3" );
    }

    public static void rdfDFS( RDFNode node, Set<RDFNode> visited, String prefix ) {
        if ( visited.contains( node )) {
            return;
        }
        else {
            visited.add( node );
            System.out.println( prefix + node );
            if ( node.isResource() ) {
                StmtIterator stmts = node.asResource().listProperties();
                while ( stmts.hasNext() ) {
                    Statement stmt = stmts.next();
                    rdfDFS( stmt.getObject(), visited, prefix + node + " =[" + stmt.getPredicate() + "]=> " );
                }
            }
        }
    }
}

这会产生输出：

http://url/
http://url/ =[http://purl.org/dc/terms/publisher]=> -f6d9b42:13f2e8dc5fb:-7ffd
http://url/ =[http://purl.org/dc/terms/publisher]=> -f6d9b42:13f2e8dc5fb:-7ffd =[http://purl.org/dc/terms/title]=> Company@en
http://url/ =[http://purl.org/dc/terms/publisher]=> -f6d9b42:13f2e8dc5fb:-7ffd =[http://www.w3.org/1999/02/22-rdf-syntax-ns#type]=> http://xmlns.com/foaf/0.1/Organization
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://purl.org/dc/terms/modified]=> 2012-11-09T16:23:22^^http://www.w3.or/2001/XMLSchema#date
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://purl.org/dc/terms/format]=> -f6d9b42:13f2e8dc5fb:-7ffe
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://purl.org/dc/terms/format]=> -f6d9b42:13f2e8dc5fb:-7ffe =[http://www.w3.org/2000/01/rdf-schema#label]=> pdf
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://purl.org/dc/terms/format]=> -f6d9b42:13f2e8dc5fb:-7ffe =[http://www.w3.org/1999/02/22-rdf-syntax-ns#value]=> application/pdf
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://purl.org/dc/terms/format]=> -f6d9b42:13f2e8dc5fb:-7ffe =[http://www.w3.org/1999/02/22-rdf-syntax-ns#type]=> http://purl.org/dc/terms/IMT
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://www.w3.org/ns/dcat#accessURL]=> http:/url/
http://url/ =[http://www.w3.org/ns/dcat#distribution]=> -f6d9b42:13f2e8dc5fb:-7fff =[http://www.w3.org/1999/02/22-rdf-syntax-ns#type]=> http://www.w3.org/ns/dcat#Download
http://url/ =[http://www.w3.org/ns/dcat#keyword]=> Keyword1@ca
http://url/ =[http://purl.org/dc/terms/license]=> http://creativecommons.org/licenses/by/3.0/
http://url/ =[http://purl.org/dc/terms/description]=> Description@ca
http://url/ =[http://www.w3.org/1999/02/22-rdf-syntax-ns#type]=> http://www.w3.org/ns/dcat#Dataset

这不如您描述的输出漂亮，但似乎是您想要的。

关于 RDF 作为图形表示的注意事项

该问题使用了“每个陈述，直接位于dcat:Dataset”，我认为值得指出的是，以防出现任何混淆，RDF 是一种基于图的表示。确实，RDF/XML 序列化可用于提供一些人类可读的结构良好的 XML，但并不要求 XML 表示具有这种结构。要查看此差异，请注意以下 RDF/XML 表示the same图表如本答案之前发布的图表。

<rdf:RDF
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:dcat="http://www.w3.org/ns/dcat#"
    xmlns:skos="http://www.w3.org/2004/02/skos/core#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:owl="http://www.w3.org/2002/07/owl#"
    xmlns:dct="http://purl.org/dc/terms/"
    xmlns:dctypes="http://purl.org/dc/dcmitype/"
    xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" > 
  <rdf:Description rdf:nodeID="A0">
    <dct:modified rdf:datatype="http://www.w3.or/2001/XMLSchema#date">2012-11-09T16:23:22</dct:modified>
    <dct:format rdf:nodeID="A1"/>
    <dcat:accessURL>http:/url/</dcat:accessURL>
    <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Download"/>
  </rdf:Description>
  <rdf:Description rdf:about="http://uri/">
    <dcat:dataset rdf:resource="http://url/"/>
    <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Catalog"/>
  </rdf:Description>
  <rdf:Description rdf:about="http://url/">
    <dct:publisher rdf:nodeID="A2"/>
    <dcat:distribution rdf:nodeID="A0"/>
    <dcat:keyword xml:lang="ca">Keyword1</dcat:keyword>
    <dct:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/>
    <dct:description xml:lang="ca">Description</dct:description>
    <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset"/>
  </rdf:Description>
  <rdf:Description rdf:nodeID="A2">
    <foaf:homepage rdf:resource="http://url/"/>
    <dct:title xml:lang="en">Company</dct:title>
    <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Organization"/>
  </rdf:Description>
  <rdf:Description rdf:nodeID="A1">
    <rdfs:label>pdf</rdfs:label>
    <rdf:value>application/pdf</rdf:value>
    <rdf:type rdf:resource="http://purl.org/dc/terms/IMT"/>
  </rdf:Description>
</rdf:RDF>

The RDF图是完全相同的，尽管XML结构是非常不同的。我提出这一点只是为了强调使用 RDF 确实很重要这一事实作为图表，而不是分层 XML，即使特定的序列化可能表明我们可以使用后者。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

rdf

jena

使用 Jena 解析 RDF 递归的相关文章

比较 SPARQL 图

如何使用 SPARQL 比较两个 RDF 图如果我有图表 a 和 b 我想找到 a 出现在 b 中的所有时间我可以查询 a 的所有主语谓词和宾语然后以编程方式构建一个与 b 中的 a 模式匹配的模式查询有没有一种方法可以在 SPA
OWL/XML 读取问题

我在使用 Jena 从 Java 读取 OWL XML 文件时遇到问题我读取 RDF XML 文件没有问题但每当我从 Protege 创建 OWL XML 文件并尝试读取它时 Java 都会给出以下错误警告主要 RDFDefault
解析模型后，Redland RDF 中 RDF 节点的生命周期？

我正在解析 RDF model 使用librdf parser parse string into model 然后我保留librdf model但释放librdf parser 在我看来模型中的节点似乎也消失了那么一生会做什么雷德兰R
仅当对象是文字时才按语言过滤

我写了以下查询 SELECT DISTINCT predicate object label WHERE VALUES subject
rdf:Bag、rdf:Seq 和 rdf:Alt 在使用时有何不同？

我正在读RDF 模式 1 1 http www w3 org TR rdf schema ch bag建议其中包括以下内容强调是后加的 5 1 2 rdf 袋子 http www w3 org TR rdf schema ch bag
将 CSV 转换为 RDF，其中一列是一组值

我想将 CSV 转换为 RDF 事实上该 CSV 的一列是一组用分隔符在我的例子中为空格符连接的值以下是 CSV 示例带标题 col1 col2 col3 A B C D John M X Y Z Jack 我希望转换过程创建一个
使用 SPARQL 仅对一个值进行 DISTINCT

我想使用 SPARQL 检索人口超过 10 万的意大利城市列表我使用以下查询 PREFIX dbo
使用 Jena 解析 RDF 递归

我正在尝试使用 Apache Jena 递归解析 RDF 文档它由如下数据集组成
禁用 apache.http.wire 调试日志

我正在将 Travis CI 与我的 github 存储库 java 项目一起使用我的一项测试使用 SPARQL 和 Jena 从 Dbpedia 获取数据它导致我在日志中将许多记录打印到 Travis 输出中从而导致 Travis
在 OWL 中的同一属性中定义多个域/范围

在 OWL 中设置数据对象属性的域范围的正确方法是什么如果我有两节课A B和数据属性hasName
RDF 文件转换为 Excel 可读格式

我下载了 ttl 格式的 rdf 文件我是 RDF 新手我想看看是否可以以某种简单的 txt csv 格式获取数据有谁知道如何做到这一点 RDF 有一个非常简单的数据模型它只是subject predicate object 您可以
Jena PrefixMapping：当模型是从数据集中获取的命名模型时，基本命名空间缺失

这是我用来加载的代码OntModel to a Dataset作为命名模型然后我尝试检索PrefixMapping以两种不同的方式实现相同的目的 public static void loadDatasetwithNamedModels
Jena 桌面 SPARQL 客户端 (TDB)？

我正在开发一个使用 Jena 进行存储带有 TDB 后端的应用程序我正在寻找类似 Squirrel 的东西它可以让我看到正在存储的内容运行查询等这似乎是一个明显需要的东西但我的可能措辞不好谷歌查询没有出现任何有希望的东西
RDF和OWL工作流程问题

我一直在通过 Protege 查看和使用 OWL 我想知道我是否正确理解工作流程和它的想法从头开始构建数据库使用 Protege 或等效工具为您的数据生成 OWL 本体将此模式导出为 RDF 使用定义为三元组中的某些元素的类以及目
SPARQL - 查找具有最相似属性的对象

假设有一个人的 RDF 数据库每个人都有许多三元组来定义这个人的朋友这么多 person x hasFriend otherPerson 如何找到拥有最相似朋友的人我是 SPARQL 的新手这似乎是一个非常复杂的查询基本上结果将
W3C 验证器无法处理 RDF/XML

我正在尝试描述一个非常基本的地铁火车站地图其中包含站点和时间这个 RDF 到 Turtle 转换器 http rdf translator appspot com 可以解析我的 XML 但 W3C 验证器抛出 Error Your do
在构建语义 Web 应用程序时，OWL 是如何实际使用的？

我一直在阅读有关语义 Web 技术例如 RDF 和 OWL 的内容并且对在现有关系数据库之上构建 RDF 三重存储语义数据库的可能性很感兴趣这只是一项研发活动看看我能做什么我喜欢的样子OWLIM http www ontotext
来自 WEBVTT 的 RDF/JSON Javascript 解析器

晚上好开门见山我需要一个脚本来从 WEBVTT 文件中的特定时间间隔获取 RDF JSON 结构这样的事情存在吗 RDF JSON 是 Talis 指定的文件结构如下所示 S P O WEBVTT 实现上述结构如下 0 00 00
通过SPARQL UPDATE从本体中删除空白节点

我在 SPARQL UPDATE 插入操作的帮助下将一些数据存储在 protege 中制作的本体模型中以下是更新查询 PREFIX test
将 SWRL 与 Jena 和 Pellet 结合使用

我无法找到一些使用 SWRL 和 Jena 的简单代码示例佩莱或者至少使用 SWRL 我研究了 Pellet 文档中的一些示例但没有关于使用 SWRL 的示例网络上的大多数示例都不完整且令人困惑我找到的唯一解决方案是使用 Jess

随机推荐

语法错误：插入“enum Identifier”，插入“EnumBody”，插入“}”

我编写了一个枚举类型当我运行为其创建的 JUnit 测试时该类型会出现以下语法错误 java lang Error Unresolved compilation problems Syntax error insert enum Ide
需要 python lxml 语法帮助来解析 html

我是 python 的新手我需要一些有关使用 lxml 查找和迭代 html 标签的语法的帮助以下是我正在处理的用例 HTML 文件的格式相当好但并不完美屏幕上有多个表格其中一个包含一组搜索结果每个表格包含页眉和页脚每个结果行
每天第一次调用网络服务很慢

在构建此 Web 服务和调用它的应用程序时我们注意到每天对该 Web 服务的第一次调用非常慢有时甚至会超时然而此后的每一次通话都效果很好有人能解释一下为什么会这样以及我们如何摆脱这种痛苦吗提前致谢如果是 ASP NET Web
更改seaborn箱线图线彩虹颜色

I found this beautiful graph online apparently made with plotly and wanted to recreate it with seaborn 到目前为止这是我的代码 impo
AngularJS 实现模板本地化

我想实现视图的本地化也应该包括正文我之前通过加载 JSON 文件并通过键进行迭代来完成此操作键是类名比我简单地将键的值分配给元素与类语言文件 JSON Header Title My Title Header Text Lore
Jersey 2 + HK2 - @ApplicationScoped 不工作

我有课 ApplicationScoped public class Service private Map
(bool) 可靠地转换为 0 或 1 吗？ [复制]

这个问题在这里已经有答案了来自一些reading https stackoverflow com questions 6627178 c99 why are false and true defined as 0 and 1 and no
iOS 中可用的路径目录

NSSearchPathDirectory 这些常量指定各种目录的位置 enum NSApplicationDirectory 1 NSDemoApplicationDirectory NSDeveloperApplicationDirec
将Angular2项目集成到Tomcat服务器中

我为我的项目开发了一个 Spring maven Rest api 对于客户端我使用 Angular2 和 typescript 作为 Angular 的新手参考 Angular 网站进行开发使用 npm 和 lite server
C# Winform 网格渲染在 Windows 7 上缓慢

我注意到 C winform datagrid 在我的 windows 7 64 位机器上非常慢对于具有 1000 行足够的列文本以适合屏幕宽度的标准网格我看到滚动时出现明显的渲染延迟即滚动滚动条移动滞后约 0 5 秒而不是平滑
当超过 6 个参数时 Observable.forkJoin 返回错误类型

我遇到 Observable forkJoin 的问题它推断出错误的返回类型然后在传递超过 6 个参数时导致错误 Observable forkJoin service getType1 service getType2 service
如何在 shell 脚本中即时解释变量？

我正在使用 JQ 在 shell 脚本中读取 JSON 在这里我无法动态解释 shell 脚本中的变量 HOME HOST PEMFILE JSON 文件 script install HOME lib install sh HOST P
新的默认VB.NET项目立即报错

我刚刚在 Mac 上安装了 Mono 版本 2 10 8 和 MonoDevelop 2 8 6 5 当我创建一个新项目文件 gt 新解决方案 gt VBNet gt ASP NET gt Web 应用程序时创建后出现错误尝试加载项
C 函数 fwrite() 不写入文件

我正在尝试编写结构tempGroupFile into GroupFile fwrite 写入时返回1 但实际上文件中没有写入数据GroupFile 功能printRec 在屏幕上打印出结构 data是结构变量文件GroupFile这些操
Android 上的 HTML5

根据 http developer android com sdk android 2 0 highlights html http developer android com sdk android 2 0 highlights html
如何在关闭钩子中获取返回码

我需要根据我的应用程序结果修改JVM返回代码但显式调用 System exit code 是有风险的因为应用程序很复杂并且很难识别正在运行的线程的结束所以我想出了在 JVM 退出之前使用 shutdown hook 来修改返回代码
无法将 tomsfastmath 链接到 libtomcrypt

我正在用 c 编写一个安全的即时消息程序使用 libtomcrypt C 库来实现 RSA 和 SPRNG 函数我将 libtomcrypt 编译为静态库并且能够链接到它并运行 sprng 函数并查看和使用它生成的随机数据我遇到的问
RenderFlex 溢出错误仅出现在小部件测试中，如果我运行应用程序，一切正常

可以在这里找到一个最小的可重现示例 https github com HerrNiklasRaab repro widget test overflow https github com HerrNiklasRaab repro widge
EGit：发出快进拉取 ~ 如何在 EGit 中为远程存储库配置 fetch

那么让我来设置我的场景我在 Spring Tool Suite Eclipse 4 5 1 中使用 EGit 4 1 1 我和精通技术的同事从远程 URL 克隆了相同的 git 存储库我的精通技术的同事更喜欢命令行他使用 VIM 修改
使用 Jena 解析 RDF 递归

我正在尝试使用 Apache Jena 递归解析 RDF 文档它由如下数据集组成

使用 Jena 解析 RDF 递归

关于 RDF 作为图形表示的注意事项

使用 Jena 解析 RDF 递归 的相关文章

随机推荐

热门标签

使用 Jena 解析 RDF 递归的相关文章