我是 Marklogic 的新手,我尝试将 100k 记录的 CSV 文件导入到 Marklogic,导入后,我发现它默认导入到文档数据库。另外,我发现对于每条记录,我都会看到数据库中生成的 XML 文件,其中增量编号附加到我在导入时提到的“documentUri”。例如:documentUri_1.xml。据我了解,创建多个 xml 文件是为了以分布式方式读取数据。
问题:
1. 如何获取该文档的根文档URI?哪个有多个xml文件?
问题:2. 如何将相同的 CSV 文件导入到不同的数据库?
问题:3. 当我使用 xquery 列出数据库中的所有文档时,我得到的是所有所有 xml 文件 URI 而不是 dummy.xml uri?我该如何实现这一目标?
注意:我使用以下命令进行导入:
mlcp.bat import -host localhost -port 8000 -username admin -password admin -input_file_path dummy.csv -mode local -input_file_type delimited_text -uri_id 'dummy.xml'
你能帮我解决这个问题吗?
问题1)不存在“根文档”这样的东西。每个文档都是独立的。但您可以按集合将文档分组在一起(见下文)。
问题 2) 使用-数据库 https://docs.marklogic.com/guide/mlcp/import#id_23879MLCP 选项。
问题 3)我认为您正在寻找 mlcp 选项-文件名作为集合 https://docs.marklogic.com/guide/mlcp/import#id_23879。这将允许您通过以文件命名的集合查找文档。例如,在 XQuery 中:
collection("dummy.csv")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)