在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组

2024-05-02

我看到的 MapReduce 示例使用了诸如 count 之类的聚合函数，但是使用 MapReduce 来获取每个类别中前 3 个项目的最佳方法是什么。

我假设我也可以使用 group 函数，但很好奇，因为他们声明分片环境不能使用 group()。然而，我实际上也有兴趣查看 group() 示例。

为了简单起见，我假设您有以下形式的文档：

{category: <int>, score: <int>}

我创建了 1000 个文档，涵盖 100 个类别，其中包括：

for (var i=0; i<1000; i++) {
  db.foo.save({
    category: parseInt(Math.random() * 100),
    score: parseInt(Math.random() * 100)
  });
}

我们的映射器非常简单，只需发出类别作为键，并发送一个包含分数数组的对象作为值：

mapper = function () {
  emit(this.category, {top:[this.score]});
}

MongoDB的reducer不能返回数组，并且reducer的输出必须与我们的值类型相同emit，所以我们必须将它包装在一个对象中。我们需要一个分数数组，因为这将使我们的减速器计算前 3 个分数：

reducer = function (key, values) {
  var scores = [];
  values.forEach(
    function (obj) {
      obj.top.forEach(
        function (score) {
          scores[scores.length] = score;
      });
  });
  scores.sort();
  scores.reverse();
  return {top:scores.slice(0, 3)};
}

最后，调用map-reduce：

db.foo.mapReduce(mapper, reducer, "top_foos");

现在我们有一个集合，其中每个类别包含一个文档，以及所有文档中得分最高的 3 个文档foo在该类别中：

{ "_id" : 0, "value" : { "top" : [ 93, 89, 86 ] } }
{ "_id" : 1, "value" : { "top" : [ 82, 65, 6 ] } }

（如果您使用相同的值，您的确切值可能会有所不同Math.random()数据生成器如我上面所示）

您现在可以使用它来查询foo对于具有最高分数的实际文档：

function find_top_scores(categories) {
  var query = [];
  db.top_foos.find({_id:{$in:categories}}).forEach(
    function (topscores) {
      query[query.length] = {
        category:topscores._id,
        score:{$in:topscores.value.top}
      };
  });
  return db.foo.find({$or:query});

}

此代码不会处理关系，或者更确切地说，如果存在关系，则在生成的最终游标中可能会返回超过 3 个文档find_top_scores.

解决方案使用group有点类似，尽管减速器一次只需考虑两个文档，而不是键的分数数组。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MongoDB

MapReduce

greatestnpergroup

在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组的相关文章

PowerShell 与 MongoDB C# 驱动程序方法不兼容？

由 C 泛型引起的最新 MongoDB 驱动程序的问题 Cannot find an overload for GetCollection and the argument count 1 我可能可以使用其他没有泛型的 GetCollect
使用 dockerfile 在 docker 中安装 mongodb 驱动

我有一个 mongodb docker 容器我需要另一个安装了 php 和 apache 的 docker 容器我想从这个容器运行一个 php 脚本并将一些数据发送到 mongodb 容器以将数据保存在 mongodb 数据库中所以我
Inno Setup安装先决条件[重复]

这个问题在这里已经有答案了我正在通过 Inno Setup 创建一个安装程序我看到很多关于如何检测先决条件是否存在的代码示例但没有任何关于当我找不到先决条件时如何实际安装先决条件的代码示例我确信它非常简单但是我该如何安装先决条件呢
在 Windows 7 - 64 位上安装 Mongodb

我是 mongodb 的新手不知道如何安装它因为我找不到视频或任何有用的资源来实现相同的目的请帮助我在 Windows 7 上安装 mongodb 并提供确切的步骤我尝试从该网站下载最新版本的 mongodb 但不成功提前致谢 R
如何将 LEFT JOIN 限制为 SQL Server 中的第一个结果？

我有一些 SQL 几乎可以做我想做的事情我正在使用三个表 Users UserPhoneNumbers 和 UserPhoneNumberTypes 我正在尝试获取用户列表及其电话号码以供导出数据库本身很旧并且存在一些完整性问题我的问
如何在 MongoDB v3.0.5 中创建用户

我需要在 mongodb 中为我的数据库创建一个用户但似乎我无法让它工作我已经在我的 Windows 7 机器上安装了 mongoDb v3 0 5 根据本文 https docs mongodb org v3 0 tutorial a
我如何在 mongodb 的数组中找到文本搜索

id objectId 23651478 name Tomatos array title Vegetables description Vegitables are good to health id objectId 45761244
猫鼬的深层填充

我有两个模式一张用于用户另一张用于帖子在用户模式中我有latestPost的一个属性它是帖子模式中条目的ObjectId 当我加载用户对象时我想将 lastestPost 作为对象获取其中包含用户架构中作者的用户名其中作者是
在 MongoDb 上序列化仅获取属性

使用 C 6 我可以写 public class Person public Guid Id get public string Name get public Person Guid id string name Id id Name n
mongorestore 从独立到复制集

我已转储在默认端口上运行的独立 mongo 数据库 14Gb 大如下所示 mongodump username
Node.js 重用 MongoDB 参考

我无法理解 Node js 例如 MongoDB 访问这是我得到的 mydb js var mongodb require mongodb server new mongodb Server staff mongohq com 10030
Mongoose 查找 array.length 大于 0 的所有文档并对数据进行排序

我正在使用 mongoose 对 MongoDB 执行 CRUD 操作这就是我的架构的样子 var EmployeeSchema new Schema name String description type String default
修复数据库需要多少额外空间

我已经问过了这个问题在 mongodb google group https groups google com d topic mongodb user oi6S LKfTrs discussion 在没有任何回复的情况下将其发布在这里
未找到“MongoId”类（带有 MongoDB Doctrine 的 Zend 框架）

我目前正在尝试将 MongoDB 与 ZendFramework 中的 Doctrine 集成我做了很多教程在 StackOverflow 或其他地方但没有任何效果我一步步按照教程进行操作 http www bigwisu com
在 mongodb 和 nodejs 中对博客和评级进行建模

我有一个博客集合其中包含用户给予的标题正文和综合评分另一个集合评级其架构引用了博客以对象 ID 的形式对博客进行评级如果有的话的用户以及他们给出的评级即 1 或 1 当特定用户按照最新优先的顺序浏览博客时比如每页 4
获取mongodb中单个查询的最小值和最大值

考虑 Words 中的以下文档 id 1 usages 2 word Name id 2 usages 1 word Street id 3 usages 1 word House id 4 usages 3 word Table id 5
Mongodb $push 嵌套数组

我想向我的嵌套数组添加新数据我的文档是 username erkin email email protected cdn cgi l email protection password b playlists id 58 name asd
按一个字段聚合，选择另一个字段最大值的文档作为集合

使用聚合框架获取每个分组的字段最大值的文档的最佳方法是什么因此使用下面的集合我希望具有为每个具有最新日期的 group id 返回一个文档的功能第二个清单显示了所需的结果 group id date 1 11 1 12 1 11 2
Java/MongoDB 按日期查询

我将一个值作为 java util Date 存储在我的集合中但是当我查询以获取两个特定日期之间的值时我最终得到的值超出了范围这是我的代码插入 BasicDBObject object new BasicDBObject objec
无法对 mongo 进行身份验证，“身份验证失败”

我使用以下说明为 mongo 创建了一个管理员用户 http docs mongodb org manual tutorial add user administrator http docs mongodb org manual tuto

随机推荐

在 Android 中不断更新新的 JSON

我有不断变化的 JSON 我需要在 android 中不断更新更改我该怎么做我的Android代码是 r getImage JSONObject data new JSONObject r String a data getString
学习 Java Native Access 时出现 com.sun.glass.ui 包错误

我正在尝试在 JavaFX 项目中使用 Undecorated 阶段 stage initStyle StageStyle UNDECORATED 它是一个模块化的 Gradle 项目它也是一个多项目构建 https guides gra
将 Set> 转换为 HashMap

在我的代码中的某一时刻我创建了一个Set
使用 SwiftUI ForEach 迭代[任何协议]，其中所述协议是可识别的

在 ViewModel 中我有 public var models any Tabbable Tabbable 开头为 public protocol Tabbable Identifiable associatedtype Id var
每个 System.ComponentModel.DataAnnotations 属性的用途是什么？

我正在使用带有 POCO 的实体框架 4 制作 MVC 3 应用程序我想尽可能多地注释我的所有实体然而我遇到一个问题我无法找到有关每个属性含义的良好文档有些非常简单比如 Required or StringLength 具有像这
Docker compose 绑定失败：端口已分配

我一直在尝试将 Socketio 服务器从 EC2 转移到 Docker 我已经能够通过网络 http 客户端连接到套接字但通过 iOS 或 Android 直接连接到套接字似乎是不可能的我读到问题之一可能是使用 Docker 时暴露的
python中unicode字符串到ascii字符串的近似转换

不知道这是否微不足道但我需要将 unicode 字符串转换为 ascii 字符串并且我不希望周围有所有这些转义字符我的意思是是否有可能近似转换为一些非常相似的 ascii 字符例如 Gavin O Connor 转换为 Gav
Android - 同一行中的两个按钮填充整个宽度

我在定义相对布局时遇到了一些问题我有一个带有滚动的列表视图并且两个按钮始终在列表视图的底部可见我只是希望我的两个按钮有 50 的宽度填充该线这是我的代码
绕过标记为公开的特定记录的设计授权的最佳方法是什么

我在 Rails 3 2 项目中使用 devise 和 cancan 我有一个event模型与一个布尔标志public 如果事件被标记为公开 gt 真实那么我希望任何人无论登录还是无法访问记录 GET events id 如果它被标记为
将模拟泊松分布添加到 ggplot

我做了泊松回归然后可视化模型 library ggplot2 year lt 1990 2010 count lt c 29 8 13 3 20 14 18 15 10 19 17 18 24 47 52 24 25 24 31 56 4
空查询字符串参数

问题正确的检查方法是什么foo使用 asp net 的以下 url 的查询字符串中的参数这可能吗 http example com bar 3 foo 我试过检查Request foo 也Request QueryString foo
作曲家和 Yii

我使用 Composer 作为我的依赖管理器因为我需要使用 Yii Framework 进行开发所以我将其添加到我的composer json 文件中所以它看起来像这样 other properties require other d
我正在用 python 编写一个电报机器人

我想通过Python编写一个电报机器人但它不起作用 import telebot bot telebot TeleBot my token bot message handler content types text def sendin
将输入字段添加到 div 容器 (javascript)

我想将一些 html 数据添加到 div 容器的末尾目前我使用innerHtml来做到这一点
无法使用php连接到远程数据库

我在 Windows 中安装了 Xampp 并且正在使用 Laravel 5 3 创建一个应用程序我正在尝试在本地网络上的另一台服务器上执行查询但是当我尝试这样做时 MySql 服务器使用以下命令对本地服务器上的用户进行身份验证 use
将 ASP.NET Core 6 应用程序部署到现有的 Azure 应用服务？

根据今天的公告ASP NET 核心 6 https devblogs microsoft com dotnet announcing asp net core in net 6 释放据我了解 NET 6 将立即可用 https azure
在 rake 任务中运行 capybara

如何在 Rake 任务中运行 Capybara 功能例如 visit http google com 谢谢你在任务中尝试这样的事情 require capybara require capybara dsl Capybara curre
从 Map 中找出给定值的键的更快方法？

我想从 HashMap 中找出给定值的键目前我必须遍历所有键并检查其在映射中的值有没有更快的方法用于执行此操作的替代数据结构是BiMap来自谷歌集合 API API 文档是here http google collections go
使用 update 和 Aggregate sum() 函数更新 MS Access 数据库表

我的访问数据库中有两个表表1 员工姓名员工编号员工工资表2 员工姓名员工编号工资总额这些表使用员工姓名和员工编号相关联如何使用第一个表中的值 Sum Emp Salary 更新表 2 中的总薪资包含聚合函数或使用
在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组

我看到的 MapReduce 示例使用了诸如 count 之类的聚合函数但是使用 MapReduce 来获取每个类别中前 3 个项目的最佳方法是什么我假设我也可以使用 group 函数但很好奇因为他们声明分片环境不能使用 group

在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组

在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组 的相关文章

随机推荐

热门标签

在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组的相关文章