我有一个包含 N-Quads 的文件(使用 schema.org 词汇表),我想使用 Apache Jena 的命令行工具将其加载到 TDB RDF 存储中。我正在使用的命令是:
tdbloader --loc <rdf_store_location> <file_to_load>
但在加载过程中,我遇到了一个错误:
[行:769293,列:154]非法的unicode转义序列值:\”(0x22)
我还从 Jena 命令行工具运行了验证工具:
riot --validate <file_to_load>
事实上,至少有 30 个类似的错误/警告:
Bad IRI
路径包含不在相对引用开头的段 /../,或者包含 /./ 这些应该被删除
有没有办法通过使用命令行工具(Jena 或如果您了解其他工具)来忽略无效的 N-Quads 或删除它们?
否则,唯一的选择是执行脚本来删除无效字符。但除了文件很大(60 GB)之外,我想这很容易出错。
None
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)