聚合框架中的 $skip 和 $limit

2024-03-23

当我阅读该文档时，我发现以下注释：

当管道中 $sort 紧邻 $limit 之前时，$sort 操作仅在进行时保留前 n 个结果，其中 n 是指定的限制，并且 MongoDB 只需要在内存中存储 n 个项目。当allowDiskUse为true并且n个项目超过聚合内存限制时，此优化仍然适用。

如果我对此是正确的，那么它仅适用于我同时使用 $sort 和 $limit 的情况，例如

db.coll.aggregate([
    ...,
    {$sort: ...},
    {$limit: limit},
    ...
]);

然而，我认为大多数时候我们都会

db.coll.aggregate([
    ...,
    {$sort: ...},
    {$skip: skip},
    {$limit: limit},
    ...
]);

问题1: 如果我在这里使用$skip，是否意味着上面的规则不适用？

我问这个问题是因为理论上MongoDB还是可以计算top的n记录并通过仅排序顶部来提高性能n记录。不过我没有找到任何关于此的文件。如果这条规则不适用，

问题2：我是否需要将查询更改为以下内容以提高性能？

db.coll.aggregate([
    ...,
    {$sort: ...},
    {$limit: skip + limit},
    {$skip: skip},
    {$limit: limit},
    ...
]);

EDIT：我认为解释我的用例会让上面的问题更有意义。我正在使用 MongoDB 2.6 提供的文本搜索功能来查找产品。我担心如果用户输入像“red”这样很常见的关键词，会返回太多结果。因此，我正在寻找更好的方法来产生这个结果。

EDIT2: 事实证明上面最后的代码等于

db.coll.aggregate([
    ...,
    {$sort: ...},
    {$limit: skip + limit},
    {$skip: skip},
    ...
]);

因此，我们总是可以使用这种形式来制作top n规则适用。

由于这是我们正在讨论的文本搜索查询，因此最佳形式是这样的：

db.collection.aggregate([
    { 
       "$match": {
               "$text": { "$search": "cake tea" }
    }
    },
    { "$sort": { "score": { "$meta": "textScore" } } },
    { "$limit": skip + limit },
    { "$skip": skip }
])

顶部“排序”结果中的内存保留的基本原理只能在其自身的“限制”内起作用，并且对于超出一些合理的数据“页面”之外的任何内容来说，这都不是最佳的。

除了内存消耗的合理范围之外，额外的阶段可能会产生负面影响而不是正面影响。

这些确实是 MongoDB 当前形式可用的文本搜索功能的实际限制。但对于任何更详细且需要更高性能的内容，就像许多 SQL“全文”解决方案的情况一样，您最好使用外部“专用”文本搜索解决方案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MongoDB

aggregationframework

聚合框架中的 $skip 和 $limit 的相关文章

Mongoid 命名范围比较同一文档中的两个时间字段

我需要在 Mongoid 中创建一个命名范围来比较同一文档中的两个时间字段例如 scope foo where gt updated at gt gt checked at 这显然不会像它对待的那样起作用 checked at作为一个符号
Mongodb聚合数组大小大于匹配项[重复]

这个问题在这里已经有答案了我有一个集合其中投资是 mongodb 文档内的一个数组现在使用聚合我尝试过滤投资长度超过 5 倍的结果然后使用匹配查询进行下一步处理 Collection id 000000 investments h
MONGODB [DEBUG] 游标的cursor.refresh() 7078636577051629992

更新大型 json 列表时出现以下错误 2012 04 01T09 34 00 00 00 app run 1 MONGODB DEBUG cursor refresh for cursor 7078636577051629992 201
（节点：20732）[DEP0018] DeprecationWarning：未处理的承诺拒绝已被弃用。未来在nodejs中

我正在尝试在我的应用程序中生成确认链接虽然它工作正常并且也生成链接但是当我访问该链接时它在 Chrome 控制台中显示 POST http localhost 3000 api auth confirmation 400 Bad Re
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
未找到“MongoId”类（带有 MongoDB Doctrine 的 Zend 框架）

我目前正在尝试将 MongoDB 与 ZendFramework 中的 Doctrine 集成我做了很多教程在 StackOverflow 或其他地方但没有任何效果我一步步按照教程进行操作 http www bigwisu com
在 mongodb 和 nodejs 中对博客和评级进行建模

我有一个博客集合其中包含用户给予的标题正文和综合评分另一个集合评级其架构引用了博客以对象 ID 的形式对博客进行评级如果有的话的用户以及他们给出的评级即 1 或 1 当特定用户按照最新优先的顺序浏览博客时比如每页 4
使用 ObjectId 键和字符串数组定义映射作为 mongoose 模式中的值

我在为数据库创建 Mongoose 架构时遇到问题我想创建一个以 objectId 作为键以字符串值数组作为值的映射我能得到的最接近的是 var schema new Schema map myId type mongoose Sch
查询 MongoDB 集合中的字段。

我正在尝试查询 mongodb 集合中的特定字段这是我的代码和输出 Mongo m new Mongo DB db m getDB mydb DBCollection coll db getCollection student addin
Mongodb 数据建模/投票更新（向上和向下）

Mongo 中有一个关于投票数据模型更新查询的示例 http www mongodb org display DOCS MongoDB Data Modeling and Rails MongoDBDataModelingandRails
一次更新猫鼬中的多个文档

我有一个用户文档数组每个用户都有关注者属性它是一个数字我只想将此属性增加 1 然后立即更新数据库中的所有这些用户文档更多细节在请求中我有一组用户 id 我使用这些 id 进行查询以获取一组用户文档 const users awa
Node js mongodb 删除错误“key $lte 不得以 '$' 开头”

db collection session remove timestamp lte a function err docs console log err console log docs Version mongodb is 2 6 5
在 Meteor 中运行示例的问题

我正在测试 Meteor 示例这是我运行时看到的meteor在待办事项示例中 Unexpected mongo exit code 100 Restarting Unexpected mongo exit code 100 Restart
使用 Java 进行 MongoDB 查询。计算数组中的匹配项

我在 Mongo 中存储了类似于以下内容的数据 LIST NAME a VALUE z NAME b VALUE y NAME c VALUE x NAME d VALUE w NAME e VALUE v NAME f VALUE u N
pymongo.errors.BulkWriteError：发生批量操作错误（MongoDB 3.4.2、pymongo 3.4.0、python 2.7.13）

我正在迁移数亿条该格式的推文 id str created at text 使用 pymongo 将文本文件转换为 MongoDB 为每个用户创建一个集合来存储他她的推文我使用的插入方法是insert many 常常会遇到BulkWri
Cosmos DB Mongo API 如何管理“请求率很大”情况

我有以下代码 async function bulkInsert db collectionName documents try const cosmosResults await db collection collectionName
限制号mongodb 输入中的行数

如何限制数量在kettle中使用的mongodb输入转换中检索到的行数我尝试在 mongodb 输入查询中使用以下查询但它们都不起作用查询限制 10 或 limit 10 请让我知道我哪里出错了谢谢迪普蒂有几个查询修改操作符
了解新的 mongo id 并将其与 Iron-router 一起使用

我有一个简单的帖子路线来寻找帖子 id 问题是pathFor助手创建这样的路径 ObjectID 52e16453431fc2fba4b6d6a8 我猜 mongoDB 插入已更改现在 id对象在其内部包含另一个对象称为 str 这是我
Spring Data MongoDB：聚合框架 - 使用嵌套属性进行排序会抛出无效引用

I found Spring论坛上的这篇文章 http forum spring io forum spring projects data nosql 130522 spring data mongodb aggregation fram
用于从字段中查找最大值的 MongoTemplate 方法或查询

我正在使用 MongoTemplate 进行数据库操作现在我想从所选结果中获取最大字段值有人可以指导我如何编写查询以便当我将查询传递给 find 方法时它将返回我所需的文档最大字段提前致谢问候可以在spring data mo

随机推荐

caffe全卷积cnn - 如何使用裁剪参数

我正在尝试为我的问题训练一个完全卷积网络我正在使用实施https github com shelhamer fcn berkeleyvision org https github com shelhamer fcn berkeleyvis
重复并连接字符串 N 次

在 Ruby 中我可以使用以下命令重复字符串 n 次 E G my string 2 gt my stringmy string 在 R 中是否有同样简单的方法来做到这一点您可以使用replicate or rep replicate
是否有 Ruby 方法来确定同一类的两个实例的所有实例变量是否相等？

是否有一种 Ruby 方法可以根据两个对象的所有实例变量是否相等来比较它们该方法的行为类似于此代码 class Coordinates attr reader x y def initialize x y x x y y end end
规范化/标准化 numpy 重新排列

我想知道规范化标准化 numpy 的最佳方法是什么recarray是为了清楚起见我不是在谈论数学矩阵而是在谈论一个记录数组其中还包含例如文本列例如标签 a np genfromtxt iris csv delimiter dty
使用 Python 套接字连接不同网络上的 2 个设备

因此如果有一个客户端和服务器具有各自的动态 IPv4 地址并且两者都通过 2 个单独的路由器连接到互联网那么如何让客户端和服务器使用其动态 IPv4 地址和路由器的静态 IPv4 相互连接Python 3 中的地址一般来说我对网络
System.Drawing - 参数无效

经过更多测试后我发现此问题可能是由于图像未及时加载以克隆到位图并显示所致这可能还是不可能注意是的标题中还有其他与此错误相关的问题但从一些研究来看它似乎是一个含糊不清的错误有许多可能的原因我没有发现任何与我的情况相同的问题
Angular 代码与我的 python django 应用程序配合不佳

由于某种原因我无法让我的角度代码与我的 python django 应用程序很好地配合当我提交页面时它会将所有空值保存在我的数据库中并且我的获取响应也无法正常工作因为没有返回任何内容任何帮助将不胜感激我还提供了屏幕截图以便更
错误消息存储在SESSION中

将错误消息存储在中是一个好习惯吗SESSION 例如重定向后通过 url 传递对我来说不是一个解决方案我想知道这是否是一个好的解决方案因为用户并发提交会导致问题吗一篇耗时很长的文章而ajax内容是从另一个选项卡获取的这可能会搞
ldap 组件 Symfony3 配置和设置

编写 Symfony3 应用程序并尝试配置 symfony ldap 组件来验证用户身份并从我的 AD 服务器检索用户属性据我了解我需要安装LDAP组件 https symfony com doc current components
如何使用 while() 循环在 vertx 上运行无限循环

我想在不同线程上的 verx 上运行无限循环应该是这样的 vertx executeBlocking future gt while true some logic e g waiting on blocking code 事实是在 v
java中的模糊逻辑

我得到了一个涉及模糊逻辑的新项目模块是为了确定不同的水凝物 http en wikipedia org wiki Precipitation meteorology Hydrometeor使用模糊逻辑方法我对模糊逻辑是什么知之甚少所以
Phonegap InAppBrowser - 后退按钮不会转到上一页

我的应用程序使用 Phonegap 我需要在 InAppBrowser 中显示外部链接但看起来后按钮没有按预期工作如果我这样做 var ref window open www example com a html blank locat
在 OS X 上的 virtualenv 中安装 scrapy 加密时发生错误 [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我正在安装 scrapypip in virtualenv on OS X 10 11 当它安装密码学时它说 buil
mysql 使用主键而不是索引

我有一个相当大的表有几百万行 ID primary countrycode status flag cc 我尝试了以下sql语句但速度很慢 SELECT id countrycode status flag cc FROM table
tar：懦弱地拒绝创建空档案

我使用以下 tar 命令尝试备份整个文件系统 tar cvpzf test backup tar gz exclude test 我收到以下错误消息 tar Cowardly refusing to create an empty arch
Angular - 错误 TS2345：“字符串 | 类型的参数” null' 不能分配给'string' 类型的参数

我的身份验证服务中有这个 constructor private http HttpClient private router Router append headers set token if saved in local storag
Node.js UnhandledPromiseRejectionWarning 即使在捕获它之后

我正在使用 Node 7 2 1 和新版本异步等待特征我还将 Native ES6 Promises 与 mongoose 一起使用如下所示 const mongoose require mongoose mongoose Promi
如何使用 XSLT 修改 SVG 属性

如何使用 XSLT 修改 SVG 文件我喜欢修改以下 SVG 剪切文件
Composer 无法在 docker 容器中工作：“https://packagist.org/packages.json”不包含有效的 JSON

我有一个运行 Symfony 应用程序的 docker 容器运行良好 Composer 安装需要命令例如composer require annotations 容器内经常会失败并出现以下错误 Seld JsonLint Parsin
聚合框架中的 $skip 和 $limit

当我阅读该文档时我发现以下注释当管道中 sort 紧邻 limit 之前时 sort 操作仅在进行时保留前 n 个结果其中 n 是指定的限制并且 MongoDB 只需要在内存中存储 n 个项目当allowDiskUse为true并

聚合框架中的 $skip 和 $limit

聚合框架中的 $skip 和 $limit 的相关文章

随机推荐

热门标签