对子文档进行分组/计数，同时保留根字段

2023-12-22

在 mongodb 中，经过一些 $match 和 $project 后，我得到以下 2 个文档。我正在尝试弄清楚如何将每个事件的每个组中每个团队的状态列表分组/计数在一起。简而言之，我需要知道每个州有多少支球队（0、1 或 2）。我从以下文档开始。

{ 
    "_id" : "event1", 
    "groups" : [
        {
            "_id" : "group1", 
            "wlActive" : true, 
            "teams" : [
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(0)}, 
                {"state" : NumberInt(0)} 
            ]
        }, 
        {
            "_id" : "group2", 
            "wlActive" : false, 
            "teams" : [
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(0)}, 
                {"state" : NumberInt(0)} 
            ]
        }
    ]
},
{ 
    "_id" : "event2", 
    "groups" : [
        {
            "_id" : "group3", 
            "wlActive" : true, 
            "teams" : [
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(0)}, 
                {"state" : NumberInt(0)} 
            ]
        }, 
        {
            "_id" : "group4",
            "wlActive" : false, 
            "teams" : [
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(2)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(1)}, 
                {"state" : NumberInt(0)}, 
                {"state" : NumberInt(0)} 
            ]
        }
    ]
}

我希望最终得到的是这样的：

{ 
    "_id" : "event1", 
    "groups" : [
        {
            "_id" : "group1", 
            "wlActive" : true, 
            "states":[
                {"state":NumberInt(2), count:2},
                {"state":NumberInt(1), count:3},
                {"state":NumberInt(0), count:2}
            }
        }, 
        {
            "_id" : "group2", 
            "wlActive" : false, 
            "states":[
                {"state":NumberInt(2), count:2},
                {"state":NumberInt(1), count:3},
                {"state":NumberInt(0), count:2}
            }
        }
    ]
},
{ 
    "_id" : "event2", 
    "groups" : [
        {
            "_id" : "group3", 
            "wlActive" : true, 
            "states":[
                {"state":NumberInt(2), count:2},
                {"state":NumberInt(1), count:3},
                {"state":NumberInt(0), count:2}
            }
        }, 
        {
            "_id" : "group4",
            "wlActive" : false, 
            "states":[
                {"state":NumberInt(2), count:2},
                {"state":NumberInt(1), count:3},
                {"state":NumberInt(0), count:2}
            }
        }
    ]
}

它不需要完全是这样，但只要我可以获得每个团队状态的计数，并为每个组保留诸如“wlActive”之类的字段。我在这里见过类似的例子，但我似乎无法解决这个问题。

实际上你可以用$addFields https://docs.mongodb.com/manual/reference/operator/aggregation/addFields/ or $project https://docs.mongodb.com/manual/reference/operator/aggregation/project/

db.collection.aggregate([
  { "$addFields": {
    "groups": {
      "$map": {
        "input": "$groups",
        "in": {
          "$mergeObjects": [
            "$$this",
            { "teams": {
              "$reduce": {
                "input": "$$this.teams",
                "initialValue": [ ],
                "in": {
                  "$cond": {
                    "if": { 
                      "$ne": [ { "$indexOfArray":  ["$$value.state", "$$this.state"] }, -1 ]
                    },
                    "then": {
                      "$concatArrays": [
                        { "$filter": {
                          "input": "$$value",
                          "as": "v",
                          "cond": { "$ne": [ "$$v.state", "$$this.state" ]  }
                        }},
                        [{
                          "state": "$$this.state",
                          "count": { "$sum": [
                            { "$arrayElemAt": [
                              "$$value.count",
                              { "$indexOfArray": ["$$value.state", "$$this.state" ] }
                            ]},
                            1
                          ]}
                        }]
                      ]
                    },
                    "else": {
                      "$concatArrays": [
                        "$$value",
                        [{ "state": "$$this.state", "count": 1 }]
                      ]
                    }
                  }
                }
              }
            }}
          ]
        }
      }
    }
  }}
])

这非常复杂并且基本上使用$reduce https://docs.mongodb.com/manual/reference/operator/aggregation/reduce/“内联”作为替代$group https://docs.mongodb.com/manual/reference/operator/aggregation/group/管道运营商。

The $reduce https://docs.mongodb.com/manual/reference/operator/aggregation/reduce/是工作的主要部分，因为它使用键上的“分组”总计来迭代每个数组项“减少”到另一个数组。它通过寻找值来做到这一点state在当前减少的结果内通过$indexOfArray https://docs.mongodb.com/manual/reference/operator/aggregation/indeOfArray/。当找不到某些东西时（-1返回）它通过以下方式附加到当前结果$concatArrays https://docs.mongodb.com/manual/reference/operator/aggregation/concatArrays/与一个新的state and count of 1。这是else case.

当某事is found ( the thencase ），我们通过以下方式从结果数组中删除匹配的元素$filter https://docs.mongodb.com/manual/reference/operator/aggregation/filter/ and 连接来自匹配索引的新元素$indexOfArray https://docs.mongodb.com/manual/reference/operator/aggregation/indexOfArray/并使用提取值$arrayElemAt https://docs.mongodb.com/manual/reference/operator/aggregation/arrayElemAt/。这给出了当前count使用添加的匹配元素的$sum https://docs.mongodb.com/manual/reference/operator/aggregation/sum/为了增加计数1.

当然，传统上你可以这样做$unwind https://docs.mongodb.com/manual/reference/operator/aggregation/unwind/ and $group https://docs.mongodb.com/manual/reference/operator/aggregation/group/声明：

db.collection.aggregate([
  { "$unwind": "$groups" },
  { "$unwind": "$groups.teams" },
  { "$group": {
    "_id": {
      "_id": "$_id",
      "gId": "$groups._id",
      "wlActive": "$groups.wlActive",
      "state": "$groups.teams.state"
    },
    "count": { "$sum": 1 }
  }},
  { "$sort": { "_id": -1, "count": -1 } },
  { "$group": {
    "_id": {
      "_id": "$_id._id",
      "gId": "$_id.gId",
      "wlActive": "$_id.wlActive",
    },
    "teams": { "$push": { "state": "$_id.state", "count": "$count" } }
  }},
  { "$group": {
    "_id": "$_id._id",
    "groups": {
      "$push": {
        "_id": "$_id.gId",
        "wlActive": "$_id.wlActive",
        "teams": "$teams"
      }
    }
  }}
])

Here $unwind https://docs.mongodb.com/manual/reference/operator/aggregation/unwind/习惯于“压扁”将数组内容放入单独的文档中。你这样做到teams水平和$group https://docs.mongodb.com/manual/reference/operator/aggregation/group/ on the 复合键其中标识独特性下降到state level.

由于所有文档详细信息都是初始文档的一部分$group https://docs.mongodb.com/manual/reference/operator/aggregation/group/键，您删除的级别“独特性” so teams变成一个数组使用$push https://docs.mongodb.com/manual/reference/operator/aggregation/push/。为了回到原来的文档形式，另一个$group https://docs.mongodb.com/manual/reference/operator/aggregation/group/是在原来的基础上完成的_id文件的价值和$push https://docs.mongodb.com/manual/reference/operator/aggregation/push/重建了groups array.

那个形式大概是"easier"理解，但它确实需要更长的时间来运行并且需要更多的资源。第一种形式是optimal因为你实际上不需要$group https://docs.mongodb.com/manual/reference/operator/aggregation/group/在现有文档中，您通常应该避免$unwind https://docs.mongodb.com/manual/reference/operator/aggregation/unwind/除非绝对必要。即分组state across 所有文件是必要的，但在单个文档中则不是。

无论哪种方式基本上都会返回相同的结果：

{
        "_id" : "event1",
        "groups" : [
                {
                        "_id" : "group1",
                        "wlActive" : true,
                        "teams" : [
                                {
                                        "state" : 2,
                                        "count" : 2
                                },
                                {
                                        "state" : 1,
                                        "count" : 3
                                },
                                {
                                        "state" : 0,
                                        "count" : 2
                                }
                        ]
                },
                {
                        "_id" : "group2",
                        "wlActive" : false,
                        "teams" : [
                                {
                                        "state" : 2,
                                        "count" : 2
                                },
                                {
                                        "state" : 1,
                                        "count" : 3
                                },
                                {
                                        "state" : 0,
                                        "count" : 2
                                }
                        ]
                }
        ]
}
{
        "_id" : "event2",
        "groups" : [
                {
                        "_id" : "group3",
                        "wlActive" : true,
                        "teams" : [
                                {
                                        "state" : 2,
                                        "count" : 2
                                },
                                {
                                        "state" : 1,
                                        "count" : 3
                                },
                                {
                                        "state" : 0,
                                        "count" : 2
                                }
                        ]
                },
                {
                        "_id" : "group4",
                        "wlActive" : false,
                        "teams" : [
                                {
                                        "state" : 2,
                                        "count" : 2
                                },
                                {
                                        "state" : 1,
                                        "count" : 3
                                },
                                {
                                        "state" : 0,
                                        "count" : 2
                                }
                        ]
                }
        ]
}

不管它的价值如何，因为这并不是真正的“聚合”跨文档的任何内容，您都可以简单地返回所有数据并在客户端代码中“聚合”数组项。

作为 mongo shell 示例：

db.collection.find().map(doc => Object.assign({}, doc, {
  _id: doc._id,
  groups: doc.groups.map(g => Object.assign({}, g, {
    _id: g._id,
    wlActive: g.wlActive,
    teams: ((input) => {
      var obj = input.reduce((o, e) => 
      (o.hasOwnProperty(e.state)) ? 
        Object.assign({} , o, { [e.state]: o[e.state]+1 })
        : Object.assign({}, o, { [e.state]: 1 }),  {});
      return Object.keys(obj)
        .map(k => ({ state: parseInt(k), count: obj[k] }))
        .sort((a,b) => b.state - a.state);
    })(g.teams)
  }))
}))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对子文档进行分组/计数，同时保留根字段的相关文章

使用 PyMongo 将 MongoDB find() 返回序列化为非匿名 JSON 数组

我的 Python 代码查询 MongoDB 并返回an array以下对象 u attribute u value u id ObjectId 534776c66e5987041f6154bd 我想要实现的是返回以下 JSON mycol
MongoDB的ObjectId是如何生成的？

他们是吗somewhat随机的我的意思是人们能够将它们分开吗它们不是随机的可以很容易地预测 BSON ObjectID 是一个 12 字节值由 4 字节时间戳组成自纪元以来的秒数一个 3 字节机器 ID 2 字节进程 ID
Mongoose 4.4.12 中 Schema 方法范围内的“this”为空 {}

当在 Schema 方法内记录到控制台时对象 this 为这发生在一天前我一直在阅读教程和其他堆栈溢出问题但不幸的是我没有找到原因的解决方案这是我的模型 var mongoose require mongoose var Sche
环回关系不填充对象 ID 数组

到目前为止我有 2 个模型工作流程核心工作流程步骤工作流核心有一个steps属性该属性是数组类型并且包含1 多个步骤当呼叫接通时工作流程核心响应正文不会使用实际步骤对象填充步骤数组工作流程核心 json name workflo
Flask 不加载配置

我在 Flask 中加载配置时遇到问题 from config import config DevelopmentConfig TestingConfig ProductionConfig def create app config nam
MongoDB 存储过程等效项

我有一个包含商店列表的大型 CSV 文件其中一个字段是邮政编码我有一个名为 ZipCodes 的独立 MongoDB 数据库它存储任何给定邮政编码的纬度和经度在 SQL Server 中我将执行一个名为 InsertStore 的
我可以将 Play 与 DynamoDB 一起用于 AWS 上的 Web 应用程序吗？

我正在为最终用户设计一个图像存储应用程序它将具有许多 CRUD 类型的功能我想在 Amazon Web Services AWS 上托管该应用程序并打算使用该游戏框架 S3 和 NoSQL 数据库我找不到适用于 Play 的 Dy
MongoDB Java 嵌套文档无法使用键名中的点进行访问

当在Java中使用MongoDB API时我试图检索以下值two在如下所示的文档中 data id 1234 one two three 我正在运行这个 MongoCollection
MongoDB：仅获取过去 24 小时内创建的文档？

我想限制我所做的查询仅查看过去 24 小时内创建的文档构造此查询的最佳方式是什么如何根据日期进行限制 Add createdAt字段索引它然后查询 db getCollection COLLECTION NAME find crea
MongoDB Java 驱动程序：MongoCore 驱动程序与 MongoDB 驱动程序与 MongoDB 异步驱动程序

MongoDB Java 驱动程序有三种不同的驱动程序选项核心驱动 MongoDB 驱动程序 MongoDB 异步驱动程序 The 驱动程序描述页面 https docs mongodb org ecosystem drivers jav
使用 python 字典更新 MongoEngine 文档？

是否可以使用 python 字典更新 MongoEngine 文档例如 class Pets EmbeddedDocument name StringField class Person Document name StringField
mongodb使用skip和limit排序不根据索引对记录进行排序

我正在尝试使用 Mongodb 进行分页skip and limit 我想要按顺序获取页面记录register time 在数据库中记录是按索引排序的而不是按register time 如何使多页记录多次跳转遵循相同的内容regis
如何确定 STARTUP2 BTree Bottom Up 步骤的总体进度？

确定新次要成员的初始同步 STARTUP2 的索引构建阶段的总体进度的好方法是什么在我的例子中索引构建阶段需要很长时间几天如果能够看到它在这个过程中的进度那就太好了日志输出如下所示 Tue Jan 27 20 04 45 006
用于高效大规模图遍历的数据库

我有一个大型二分有向图数据集约 2000 万个元素在当前的使用中我运行的遍历算法每次运行约 500 000 个节点这些算法有效但历史上运行的是从文本文件加载到内存的数据文本文件似乎是一个不好的方法所以我将数据作为邻接列表传输到
CORS 问题。 Flask <-> AngularJS

使用 angularjs 客户端应用程序和提供 api 的 Flask 应用程序启动一个新项目我使用 mongodb 作为数据库我必须立即排除 jsonp 因为我需要能够跨不同端口进行 POST 因此我们为 Angular 应用程序设
缩短node.js和mongoose中的ObjectId

我的网址目前如下所示 http www sitename com watch companyId 507f1f77bcf86cd799439011 employeeId 507f191e810c19729de860ea someOtherI
使用 $or 运算符时 MongoDB 查询会变慢

我正在尝试对我的收藏进行此查询Audios var querySlow palabra regex keywords options i or p pais in interested accents languageCodeTatoeba
在 NodeJs 中处理 Mongodb 全局连接的最佳方法是什么

I using 节点 Mongodb Native https github com mongodb node mongodb native并尝试设置全局连接变量但我对两种可能的解决方案感到困惑大家能帮我看看哪一款比较好吗 1 解决方案
MongoDB GeoJSON“无法从对象、格式错误的几何图形中提取地理密钥？”插入类型 Polygon 时

我收到错误无法从对象中提取地理密钥几何图形格式错误多边形已闭合格式看起来不错因为它已正确插入到 Mongo 中我使用的是 Mongo 版本 2 6 3 在 Centos 6 5 x64 上运行下面的多边形有什么问题我非常仔细
Mongo：无法连接到服务器 127.0.0.1:27017 位于 src/mongo/shell/mongo.js:145

当我尝试在 ubuntu 中的 shell 中运行 mongo 或打开 rockmongo 时我看到以下错误 couldn t connect to server 127 0 0 1 27017 at src mongo shell mo

随机推荐

TFS 团队构建日志单元测试结果

我们正在使用 TFS 2010 Team Build 它会在构建过程中自动运行我们的单元测试如果单击查看日志我可以看到运行的测试列表和每个测试结果成功失败如果发生失败我想查看测试结果输出以便开发人员可以找出失败的原因是什么
使用 extern 和 #include 头文件有什么区别？

我开始质疑 extern 关键字的有用性该关键字用于访问其他模块其他文件中中的变量函数当我们使用 include 预处理器导入带有变量函数原型或函数变量定义的头文件时我们不是在做同样的事情吗 extern之所以需要是因为它
javascript location.href onchange 事件监听器？

我想在你离开页面时显示一条消息不是烦人的警报只是一些告诉你等待的html 在考虑它时我面临着某些困难当用户按下 Stop 时浏览器取消导航离开行动我想要发送消息离开每当单击任何链接时都会出现该消息当单击的链接打开另一个
Windows 7 中“ruby.exe 未被识别为内部或外部命令”

我的操作系统是Windows 7 我正要连接我的本地MySQL数据库与Heroku共享数据库在某一时刻我得到了libmysql dll文件丢失的错误所以我搜索并下载了dll文件并将其保存在ruby中 bin 目录当我再次准备连接时
混合效应逻辑回归

我正在尝试在 python 中实现混合效应逻辑回归作为比较我正在使用glmer函数从lme4R 中的包我发现statsmodels模块有一个BinomialBayesMixedGLM应该能够适合这样的模型然而我遇到了很多问题我找
QTimer线程亲和性

在文档中它说在多线程应用程序中您可以使用QTimer在任何线程中有一个事件循环要从非 GUI 线程启动事件循环请使用QThread exec Qt 使用定时器的线程亲和性来确定哪个线程将发出timeout 信号正因为如此你
位置：固定导致元素比浏览器宽

谁能告诉我为什么position fixed会导致元素比浏览器或页面上的其他内容更宽并导致水平滚动这是代码超文本标记语言
如果我想要像 bootstrap vue 和 vuetify 这样的 2 个 css 框架，请使用同一个项目

我想要 2 个 CSS 框架使用我现有的 nuxtjs 项目有人质疑为什么要使用 2 个 CSS 框架一个 vuejs 项目回答这个问题我想要我的网站网页版和移动版我使用网页版是 boostrapvue 它对于网页版来说很棒或者
使用 FileManager.default.currentDirectoryPath 时，Swift 5.2 出现分段错误：11

我有一个类似于以下内容的自定义 Swift 脚本 usr bin env xcrun sdk macosx swift import Foundation let path FileManager default currentDirect
当两个路由指向同一模型时，设计资源名称出现问题

我的 api v1 和 v2 有两条路由指向相同的 Devise 模型路由如下 scope api do namespace v1 do devise for users controllers gt registrations gt d
如何一次性设置所有formik值？

我有一个formik用于编辑来自 API 端点的数据的表单目前我正在重新初始化useEffect像这样挂钩 React useEffect gt initialValues first name address first name in
找不到与给定名称匹配的资源：attr 'android:tabLayout'

我想通过用我自己的样式替换样式来自定义选项卡小部件我要更换的项目如下
类型或命名空间不存在

好吧我之前已经遇到过这个问题一百万次了而且之前已经被回答过 100 万 1 次了然而再一次我有 3 个项目 A B 和 C 每个项目都有一个 DLL 每个项目都是 Net 4 0 不是客户端构建完整的4 0 项目 C 引用 A
为什么 CHECKSUM_AGG() 对于完全不同的输入值返回相同的值？

我真的不明白怎么办CHECKSUM AGG 有效尽管我知道它是通过使用异或来构建的这解释了为什么它会返回0当您传递相等的整数时但是为什么我在以下 SQL 中得到相同的聚合校验和其中输入值是唯一的 DECLARE test1 TAB
为什么 10 的幂以科学记数法打印为 5 次方？

我想知道 10 的幂是否与控制台中科学计数法的打印相关以及如何相关我搜索了 R 文档但没有找到任何相关的内容或者我真正理解的内容首先我的scipen and digits设置是 unlist options scipen digi
寻求 2D 版本的 approxfun()

我正在 R 中寻找 2D 版本stats approxfun 可以生成插值function来自 x y z 数据集的 f x y 我在包裹中没有找到akima或其他地方我会尝试重新适应interp surfaceR 包中的函数fields
我可以在黄瓜中使用带有示例的背景吗？

我想通过一个示例来说明所有场景的第一步但所有场景的第一步都是相同的只有一个元素不同所以我想在后台完成所有这些步骤并想添加带有背景的示例简而言之假设我想导航到 facebook twitter google 和 youtube 页
Quartz调度器和OSGI

我有一个 OSGI 调度程序包其中包含 Quartz Scheduler Jar 该捆绑包仅向其他捆绑包公开一个应用程序接口并且当注册新作业时它将被包装到临时作业实现 StatefulJob 中并使用调度程序进行调度这样我就不必公
使用unix_socket登录MySQL帐户

我已经创建了一个从机器 A 到机器 B 的转发器通过 SSH 机器 B 有一个正在运行的 MySQL 实例其 root 帐户使用unix socket验证 User Host plugin root localhost unix soc
对子文档进行分组/计数，同时保留根字段

在 mongodb 中经过一些 match 和 project 后我得到以下 2 个文档我正在尝试弄清楚如何将每个事件的每个组中每个团队的状态列表分组计数在一起简而言之我需要知道每个州有多少支球队 0 1 或 2 我从以下文档

对子文档进行分组/计数，同时保留根字段

对子文档进行分组/计数，同时保留根字段 的相关文章

随机推荐

热门标签

对子文档进行分组/计数，同时保留根字段的相关文章