我有一些 RDF 文件,我想将其导入到 tripplestore(AllegroGraph) 中,但在第一个文件中,我收到 SAX 解析器错误,指出存在无法识别的字符。删除有问题的行后,一切都很好。
然后我尝试使用 W3C RDF 验证器和带有错误行的 RDF 上的 Jena,但我得到的只是一些有关未定义语言的警告(绝对没有关于错误行的信息)。
您能否建议一种方法(如果可能的话,使用 java)来查找 RDF 文件中的错误?
Edit:有问题的行是:
<gn:alternateName xml:lang="got">𐌰𐍆𐌲𐌰𐌽𐌹𐍃𐍄𐌰𐌽</gn:alternateName>
你可以用芝麻的Rio解析器 http://www.openrdf.org/doc/sesame2/api/org/openrdf/rio/package-summary.html进行验证。里面有说明这篇博文 http://rivuli-development.com/further-reading/sesame-cookbook/parsing-and-writing-rdf-with-rio/关于如何与里约热内卢合作的总体情况。特别是对于验证,技巧是创建并附加一个解析错误监听器 http://www.openrdf.org/doc/sesame2/api/index.html?org/openrdf/rio/ParseErrorListener.html从解析器接收详细的警告和错误。
然而,既然您提到您遇到的问题是在 SAX/XML 级别,您也可以使用通用 XML 验证器来查看问题所在。最可能的原因(但如果没有更多细节很难判断)是某个地方有一个错误编码的字符。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)