如何获取Marklogic数据库中的文档总数?

2024-02-11

我在 Marklogic 数据库中有大约 20 个 lacs 文档。我想要我的搜索应用程序中的文档总数进行分页。为了获得我正在使用的总数

xdmp:estimate(cts:search(doc(), $query))

其中 $query 是各种查询的组合cts:and-query。但我没有得到正确的总数。当 $query 为空时,它显示的计数比数据库中的文档总数高得多。当我使用

xdmp:estimate(doc())

它向我显示了正确的总数,但它将是静态总数,不会根据查询而改变。我希望根据响应特定查询返回的结果得出总计,这就是为什么我将 $query 作为参数传递,但它没有显示正确的总计。fn:count()显示正确的总数,但当文档数量约为 20 lacs 时fn:count()不起作用,因为fn:count()慢于xdmp:estimate().

请帮助我获取响应用户输入的搜索词而返回的正确文档总数。


要了解这里发生的情况,请首先阅读以下架构白皮书:http://resources.marklogic.com/library/media/inside-marklogic http://resources.marklogic.com/library/media/inside-marklogic

现在尝试这个测试用例:

xdmp:estimate(doc()),
xdmp:estimate(cts:search(doc(), ()))

第一个表达式将计算文件在数据库中。第二个表达式将计算文档片段在数据库中。因此,如果结果不同,您可能配置了片段根或片段父级。一些特殊文档还会创建额外的片段:我认为拼写词典和同义词库文档可以做到这一点。

如果要将估计限制为 XML 文档根,请在可搜索表达式中指定文档根 QName,或使用/*如果您不关心根元素名称。

xdmp:estimate(cts:search(/*, ()))

您还可以使用 cts:query 参数来指定仅出现在您要计数的文档中的 QName。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何获取Marklogic数据库中的文档总数? 的相关文章

  • 在Windows中转义curl命令

    我正在尝试运行curl我可以从 Windows 的命令行中执行命令 但我怎么也想不出如何逃脱它 我正在执行这个 C WINDOWS system32 gt curl anyauth user user password X POST d r
  • 避免 XDMP-EXPNTREECACHEFULL 并加载文档

    我正在使用 marklogic 4 并且有大约 15000 个文档 每个文档大约 10 KB 我想将整个内容作为文档加载 并将所有文档转换为单个 csv 文件并输出到 HTTP 输出流以供下载 当我以这种方式加载文档时 let uri ct
  • 如何在 Marklogic 中构建一个简单的搜索应用程序?

    我想在 Marklogic 中构建一个简单的搜索应用程序 但我不想使用应用程序生成器 我想编写自己的 xqy 文件 我想从用户那里获取名字 姓氏和地址的输入 用户可以按名字 姓氏或地址进行搜索 他还可以通过输入所有三个字段来进行搜索 也可以
  • 在 MarkLogic 8 中调用具有来自其余端点的依赖项的 xquery 库

    我们正在从 MarkLogic 6 升级到 8 并且在调用库模块时遇到了一些问题 我们有 xquery 库模块 可以从自定义 REST 扩展和非 REST xquery 调用 马克逻辑公司文档表示 REST 端点可以使用通过新 ext 端点
  • 无法从 CPF 操作模块内创建 MarkLogic 计划任务

    我有一个 MarkLogic 数据库内容处理框架 CPF 已安装且 CPF 管道如下 每当插入文档时 它都会获取以下值执行日期从文档中并安排当时的任务 Example 样本文件
  • MarkLogic 8 - 将大型结果集流式传输到文件 - JavaScript - Node.js 客户端 API

    假设我有一个查询将返回一个非常大的响应 可能有数千条记录 也可能有千兆字节的数据 通常在用户界面中 我们只显示该数据的单个页面 现在我需要一个选项来获取整个结果集并将其流式传输到文件中 然后用户可以在闲暇时去下载这个 那么 如何使用查询生成
  • 基于同一元素多个属性值的Marklogic查询

    我有以下 xml 样本1 xml
  • 如何在 Ubuntu 14.04 上安装 MarkLogic 8?

    在 Ubuntu 14 04 上安装 MarkLogic 8 的步骤是什么 根据 Alex Bleasdale David Ennis 的说法 下载 CentOS 版本 然后 Ubuntu 和其他基于 Debian 的发行版使用 DEB 软
  • Marklogic:导入 csv 时在文档上创建多个 XML 文件。如何获取根文档 URI 路径?

    我是 Marklogic 的新手 我尝试将 100k 记录的 CSV 文件导入到 Marklogic 导入后 我发现它默认导入到文档数据库 另外 我发现对于每条记录 我都会看到数据库中生成的 XML 文件 其中增量编号附加到我在导入时提到的
  • 由不受信任的机构颁发的证书链

    我正在使用curl 终端并发出以下命令 curl anyauth user admin admin https localhost 8000 LATEST search q caesar 我收到以下警报 curl 77 schannel 下
  • 从另一个本地主机访问 markLogic

    我正在尝试使用 markLogic 作为文档存储库并编写一个可以从我的本地主机 Apache 访问它的客户端 在 markLogic 中 我创建了一个新的 REST 服务器 8011 现在我想通过 希望简单的 HTTP 请求 实际上使用 j
  • Marklogic 中的 JavaScript 多语句事务

    我想在 marklogic 中的服务器端 JavaScript 中编写多语句事务 我想要实现的是 执行更新事务 然后编写查询语句来查询更新的文档并确认更新在事务中可见 最后进行回滚 通过进行回滚 我想确认事务内进行的更新在事务外不可见 而在
  • 在 MarkLogic 中处理禁运内容场景

    我有一个 MarkLogic 7 数据库 其中插入了多个文档 每个文档都有自己的created on and released on 举例来说 如果将文档插入到数据库中1400小时及其released on值为1700小时然后我需要将此文档
  • 如何在Marklogic中使用Group By?

    我想在 xquery 中使用 Group By 有人可以告诉我如何在 Marklogic 中使用 Group By 吗 或者 您可以使用调用 XSLTxdmp xslt invoke or xdmp xslt eval MarkLogic
  • 跨集群访问日志

    我有一个包含 3 个节点的集群 我已经配置了应用程序服务器的数据库 我想知道集群中各主机生成的访问日志是否相同 或者每个主机都有一个单独的 访问日志 用于记录对其主机的请求 我知道集群中的每个主机都维护自己的审核日志文件 访问日志的工作方式
  • 如何获取Marklogic数据库中的文档总数?

    我在 Marklogic 数据库中有大约 20 个 lacs 文档 我想要我的搜索应用程序中的文档总数进行分页 为了获得我正在使用的总数 xdmp estimate cts search doc query 其中 query 是各种查询的组
  • 使用索引数据计算非结构化文档中的所有唯一单词

    我已将非结构化 HTML 文档加载到 Marklogic 中 并且 对于任何给定的文档 URI 我需要一种使用索引 词典来提供所有唯一单词的字数统计的方法 例如 假设我有以下文件 保存在 URI html example html 下 h1
  • 有没有查看/编辑/删除Marklogic文档的工具

    有没有什么工具可以view edit deleteMarklogic 的文档 比如 Mongo Management Studio for MongoDb MarkLogic 内置了对 WebDav 的支持 您可以在管理控制台中创建 Web
  • 如何使用marklogic数据库进行数据实时处理

    我正在尝试评估数据实时处理的标记逻辑 早些时候 我使用 kafka 和 Storm 来实时处理数据 并在处理后插入到数据库中 我是 marklogic 的新手 所以有人可以告诉我 marklogic 中是否有任何可用的东西 我可以使用它来实
  • 如何向节点的所有特定子节点添加属性

    我有以下节点 我想在其中向所有节点添加属性add nodes

随机推荐