Mongodb子文档之间的多对多关系

2024-04-13

TL;DR：想象一下第一个 $match 阶段给了你几个文档，但你想要refine他们在里面，就像$redact做。但问题是你的子文档有关系，而你想要$where就像他们之间的检查一样。怎样才能做到这一点呢？我无法 $unwind，因为它会导致性能问题（1.5 mb 的文档，具有 5 倍 1000 数组长度，单个展开会导致 1000x~1mb 文档）。

我的架构如下所示：

{
    userName: "user44",
    userID: "44",
    posts : [
        ...
        {
            title : "post1",
            id : "123"
            ...
        },
        {
            title : "post2",
            id : "124"
            ...
        },
        ...
    ],
    comments: [
        ...
        {
            id: "1910",
            postId : "123",
            commentTitle : "comment1",
            comment : "some comment",
            user: "user13"
        },
        {
            id: "1911",
            postId : "124",
            title : "comment2",
            commentTitle : "some comment",
            user: "user22"
        },
        {
            id: "1912",
            postId : "124",
            title : "comment2",
            commentTitle : "some comment",
            user: "user22"
        },
        ...
    ], 
    commentUpvotes: [
        ...
        {
            id : 12,
            commentId : "1910",
            upvotedBy: "user91",
            upvoteDate: 1000,         
        },
        {
            id: 13,
            commentId : "1910",
            upvotedBy: "user92",
            upvoteDate: 2000
        },
        {
            id: 14,
            commentId : "1911",
            upvotedBy: "user92",
            upvoteDate: 2100
        },
        ...
    ]
}

虽然这与我的数据库无关，但原始架构与上面完全相同。所以，上面的例子是一个用户集合，我在其中存储posts用户的；comments其他用户发布的帖子，commentUpvotes存储有关谁投票的信息。不要去思考它的设计和内容的逻辑；我编造了它们，请不要建议任何其他架构。

问题：我正在寻找一种方法来查找在特定日期之后投票的帖子和评论，例如

 db.users.find("commentUpvotes.upvoteDate" : {$gte:0})

和结果：

{
    "_id" : ObjectId("539065d3cd0f2aac5f55778e"),
    "posts" : [
        {
            title : "post1",
            id : "123"
            ...
        },
        {
            title : "post2",
            id : "124"
            ...
        },
    ],
    "comments" : [
            {
            id: 1910,
            postId : "123",
            title : "comment1",
            comment : "some comment",
            user: "user13"
        },
        {
            id: 1911,
            postId : "124",
            title : "comment2",
            comment : "some comment",
            user: "user22"
        },
    ],
    "commentUpVotes" : [
            {
            id : 12,
            commentId : "1910",
            upvotedBy: "user91",
            upvoteDate: 1000,         
        },
        {
            id: 13,
            commentId : "1910",
            upvotedBy: "user92",
            upvoteDate: 2000
        },
        {
            id: 14,
            commentId : "1911",
            upvotedBy: "user92",
            upvoteDate: 2100
        }
    ]
}

NOTE: 是后题，前题可以查到here https://stackoverflow.com/questions/24059348/mongodb-1to1-relation-among-subdocuments。我想在这个中稍微扩展一下。

我让这个问题搁置了一段时间，因为我在最后一个问题 https://stackoverflow.com/q/24059348/2313887做到这一点的基本过程是什么。我还评论说$redact http://docs.mongodb.org/manual/reference/operator/aggregation/redact/不是进行此类操作的动物，除了此处的答案之外，还有两个原因需要解释。可以说您知道过滤后的值，而不仅仅是过滤它们。

正如之前所给出的，您仍然需要一些用法$unwind http://docs.mongodb.org/manual/reference/operator/aggregation/unwind/但与会导致管道中要处理的文档数量激增的传统用法不同，它只是被使用after数组内容已被过滤。这里唯一真正的区别是，我们要注意“过滤数组”实际上将包含超过one元素，所以你可以适当地处理它：

db.users.aggregate([
    { "$match": {
        "commentUpvotes.upvoteDate": { "$gte": 0 }
    }},
    { "$project": {
        "posts": 1,
        "comments": 1,
        "commentUpVotes": {
            "$setDifference": [
                { 
                    "$map": {
                        "input": "$commentUpvotes",
                        "as": "el",
                        "in": {
                            "$cond": [
                                { "$gte": [ "$$el.upvoteDate", 0 ] },
                                "$$el",
                                false
                            ]
                        }  
                    }
                },
                [false]
            ]
        }
    }},
    { "$project": {
         "posts": 1,
         "comments": 1,
         "kcommentUpVotes": "$commentUpVotes",
         "commentUpVotes": 1
    }},
    { "$unwind": "$commentUpVotes" },
    { "$project": {
        "posts": 1,
        "comments": {
            "$setDifference": [
                { 
                    "$map": {
                        "input": "$comments",
                        "as": "el",
                        "in": {
                            "$cond": [
                                { 
                                    "$eq": [ 
                                        { "$substr": [ "$$el.id", 0, 4 ] }, 
                                        "$commentUpVotes.commentId"
                                    ] 
                                },
                                "$$el",
                                false
                            ]
                        }  
                    }
                },
                [false]
            ]
        },
        "commentUpVotes": "$kcommentUpVotes"
    }},
    { "$unwind": "$comments" },
    { "$group": {
         "_id": "$_id",
         "posts": { "$first": "$posts" },
         "comments": { "$addToSet": "$comments" },
         "kcomments": { "$addToSet": "$comments" },
         "commentUpVotes": { "$first": "$commentUpVotes" }
    }},
    { "$unwind": "$comments" },
    { "$project": { 
        "posts": {
            "$setDifference": [
                { 
                    "$map": {
                        "input": "$posts",
                        "as": "el",
                        "in": {
                            "$cond": [
                                { 
                                    "$eq": [ 
                                        "$$el.id", 
                                        "$comments.postId"
                                    ] 
                                },
                                "$$el",
                                false
                            ]
                        }  
                    }
                },
                [false]
            ]
        },
        "comments": "$kcomments",
        "commentUpVotes": 1
    }},
    { "$unwind": "$posts" },
    { "$group": {
        "_id": "$_id",
        "posts": { "$addToSet": "$posts" },
        "comments": { "$first": "$comments" },
        "commentUpVotes": { "$first": "$commentUpVotes" }
    }}
])

因此，这里有一点是要准确理解每个阶段（或重复过程）正在做什么以及为什么要这样做。$unwind http://docs.mongodb.org/manual/reference/operator/aggregation/unwind/这里的操作很重要。

如果你选择第一个$project http://docs.mongodb.org/manual/reference/operator/aggregation/project/考虑到这里，返回的结果始终是一个数组。这就是“过滤”的方式$map http://docs.mongodb.org/manual/reference/operator/aggregation/map/有效，并且非常有意义，因为您期望有多个（在本例中为所有）匹配的可能性。

重要的部分发生在您尝试将这些值与文档中的另一个数组进行匹配之前，就像您查看一个数组的结构时一样。$map http://docs.mongodb.org/manual/reference/operator/aggregation/map/重点是将元素与奇异值进行比较。这就是为什么你需要$unwind http://docs.mongodb.org/manual/reference/operator/aggregation/unwind/为了获得那些“奇异”值进行比较。

因此，除了保留“过滤”数组的副本以使事情变得更干净之外，让我们跳到与“评论”数组匹配后的部分。由于“commentUpvotes”数组已“展开”，现在每个文档都有一个副本，其中包含该数组自己的过滤版本。请注意，每个结果数组只能包含一个元素。

由于这些确实是数组，为了在文档之间组合它们，您需要展开这些“单元素”数组，然后将它们重新组合在一起。请记住，虽然“commentUpvotes”有“三个”匹配，但只有“两个”评论可以匹配，但是“三个”匹配中的“两个”共享相同的评论id。这是使用分组回的地方$addToSet http://docs.mongodb.org/manual/reference/operator/update/addToSet/变得很重要，因为您不想重复该匹配的帖子。

一旦所有匹配的元素都在数组中，就可以再次进行$unwind http://docs.mongodb.org/manual/reference/operator/aggregation/unwind/并重复。

因此，总体前提与前面的示例和问题相同。事实上，这里的方法可以被认为是先前列表的“2.0 版本”，因为它将满足所有情况下的单数和“多”匹配。

这里要提到的一个“警告”是基本原则，即这些项目确实相关，并且任何数组中都不存在“孤立”细节。这样做的明显原因是，任何测试从一个数组到另一个不匹配的数组的匹配都会导致空数组。可能还有其他匹配项，但如果其中一个测试结果为空，那么您将必须处理生成的空数组。

最后一个注释的概念很简单，只需测试一下$size http://docs.mongodb.org/manual/reference/operator/aggregation/size/结果的，否则输入单个值false并在稍后阶段将其过滤掉。但出于练习的目的，我认为您的“关系”确实完好无损，并将任何额外的处理留给您自己实施。

最终结果当然是您获得所需的结果，而无需诉诸相同级别的“井喷”，只需将未过滤的数组相互展开并尝试与这些记录进行相等匹配即可。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MongoDB

aggregationframework

Mongodb子文档之间的多对多关系的相关文章

Mongodb聚合管道大小和速度问题

我正在尝试使用 mongodb 聚合查询来连接 lookup 两个集合然后对连接数组中的所有唯一值进行不同计数注意我不一定知道metaDataMap 数组中有哪些字段键我不想计算或包含地图中可能存在或不存在的字段这就是聚合查询看
如何配置 StrongLoop LoopBack MongoDB 数据源以部署到 Heroku

我正在使用 LoopBack 版本 1 6 并使用以下数据源配置运行本地 mongoDB 服务器进行开发 mongodb defaultForType mongodb connector loopback connector mongodb
如何在 Mongoose 中定义排序函数

我正在开发一个小型 NodeJS Web 应用程序使用 Mongoose 访问我的 MongoDB 数据库我的收藏的简化架构如下 var MySchema mongoose Schema content type String loca
MongoDB 更新。尝试从一个字段的属性设置另一个字段

我想做的事情非常简单但我不知道如何为一个字段赋予另一个字段的值我只想用另一个字段的字符数更新一个字段 db collection update exists true set field1 field2 length 我试过给它点符号
无法解构“undefined”或“null”的属性“user”

使用 redux 检索用户信息时出错我想从数据库获取用户信息姓名密码和头像地址然后对其进行编辑我正在使用nodejs express react redux 和jwt Actions user js import axios fr
为什么我在 Nodejs 中收到“在将标头发送到客户端后无法设置标头”错误？

我正进入状态 Cannot set headers after they are sent to the clientNodejs 中出现错误我无法弄清楚原因代码如下我正在使用 mongoose 将数据保存在 mongodb 中我
将位置数据存储在 Mongodb 文档中

在我当前的项目中我将位置数据以以下格式存储在 Mongodb 文档中 location loc lng 118 15592692 lat 34 03566804 geocode city East Los Angeles state CA
Pymongo 中的全文搜索

即将推出的 MongoDB 2 4 支持全文检索 http docs mongodb org manual release notes 2 4 text indexes 我们在 mongo shell 中使用命令来执行此操作例如 db p
mongoid 中的嵌入文档与哈希数据类型

我找不到任何讨论此问题的博客文章或文档它们嵌入式文档和哈希数据类型非常相似彼此相比有何好处或限制考虑我的架构设计 class HistoryTracker include Mongoid Document include Mong
创建永远不匹配的 mongo 表达式的最佳方法

我正在寻找的内容在某种程度上相当于在 SQL 中执行的操作 WHERE 1 0 我正在寻找这样的东西因为我正在构建一个类型安全的 DSL 来在我的域上执行查询支持连接和析取有时添加一个从不匹配任何内容的查询可能比在代码中处理它更容易
使用 python 将多个 JSON 文件插入 MongoDB

JSON文件如下a json b json z json 26个json文件每个文件的 json 格式如下 a cappella word a cappella wordset id 5feb6f679a meanings id 4920
服务器发现和监控引擎已弃用

我在 Node js 应用程序中使用 Mongoose 这是我的配置 mongoose connect process env MONGO URI useNewUrlParser true useUnifiedTopology true u
Mongoose 4.4.12 中 Schema 方法范围内的“this”为空 {}

当在 Schema 方法内记录到控制台时对象 this 为这发生在一天前我一直在阅读教程和其他堆栈溢出问题但不幸的是我没有找到原因的解决方案这是我的模型 var mongoose require mongoose var Sche
清理 MongoDB 的输入

我正在为 MongoDB 数据库程序编写 REST 接口并尝试实现搜索功能我想公开整个 MongoDB 接口我确实有两个问题但它们是相关的所以我将它们放在一篇文章中使用 Python json 模块解码不受信任的 JSON 是否
MongoDB 存储过程等效项

我有一个包含商店列表的大型 CSV 文件其中一个字段是邮政编码我有一个名为 ZipCodes 的独立 MongoDB 数据库它存储任何给定邮政编码的纬度和经度在 SQL Server 中我将执行一个名为 InsertStore 的
将 Django +1.10 与 MongoDB 连接

在过去的几个月里有人为 MongoDB 更换了 Django 1 10 中的默认数据库引擎吗我在谷歌上得到的所有信息都是六四年前的最常见的结果包括mongodb 引擎这需要Django nonrel 来自 Django 1 5 的一个
mongo BadValue 未知运算符：$or

该集合有一份文档 id ObjectId 54b513933aca242d9915a787 carriers carrier ObjectId 54b54d223aca242d9915a788 carryingInterval from I
Spring Data mongodb：添加 MongoDb 访问凭据

我的 Spring 应用程序中有以下工作配置
MongoDB Java 嵌套文档无法使用键名中的点进行访问

当在Java中使用MongoDB API时我试图检索以下值two在如下所示的文档中 data id 1234 one two three 我正在运行这个 MongoCollection
相同的单词但不同的 unicode 字符

我在 Windows 上使用 Python 构建了一个关于越南餐馆的问答应用程序要编写越南语字符我需要使用 Unicode 首先我从使用 HTML charset utf 8 的 TripAdvisor 网站克隆数据并构建我的 Mon

随机推荐

我可以检查 Bootstrap 模态是否显示/隐藏吗？

我可以检查 Bootstrap Modal 当前是否以编程方式显示隐藏吗 Like bool a if myModal shown 我需要真假 alert myModal hasClass in 如果模态打开它将返回 true
我们可以利用语法高亮功能来删除 SublimeText 源文件中的所有注释吗？

我有一堆用不同语言编写的源文件我想从源文件中删除所有注释虽然编写正则表达式当然是一种选择但根据输入文件我可能必须处理表示注释的字符出现在字符串文字内的情况还需要维护不同语言的正则表达式列表语法突出显示似乎在突出显示注释方面做得相
使用 C# 和 OleDbConnection 从特定工作表的 Excel 文件中获取列名称

到目前为止我已经设法获取整个Excel文件的列名但我想做的是获取给定表工作表的Excel文件的列名我该如何修改代码来实现这一目标我已经尝试了一段时间但没有取得积极的结果非常感谢任何帮助 public static List
关闭堆栈中较低层的 ViewController 的行为不符合预期

我正在构建一个复杂的应用程序中间有一个分支在应用程序中的某个时刻会出现一个特定的 UIViewController 我们将其称为mainViewController 缩短mainVC The mainVC通过代码呈现另一个视图控制器
尝试使用 sqlcmd（从 Ubuntu 命令行）连接到 SQL Server 时出错？

我在尝试连接时发现一些问题SQL服务器来自 Ubuntu 机器的实例使用sqlcmd 所以我安装了sqlcmd正如这里所解释的 https learn microsoft com it it sql linux sql server li
指定 PyYAML 转储部分的样式 (II)：序列

这是一个后续问题指定 PyYAML 转储部分的样式 https stackoverflow com questions 14000893 specifying styles for portions of a pyyaml dump 考虑以
如何在java中将事件插入事件调度线程队列的开头？

我已经知道怎么做了事件调度线程 http docs oracle com javase tutorial uiswing concurrency index html作品如果事件调度线程中存在如下所示的短事件和长事件则应用程序无法响应
RangeError：使用 valueChanges.subscribe 时超出最大调用堆栈大小

我正在使用带有反应式表单的 Angular 5 并且需要使用 valueChanges 来动态禁用所需的验证组件类 export class UserEditor implements OnInit public userForm For
如何将 Gradle 项目外部依赖项下载到特定文件夹？

我想将依赖项下载到构建中的特定文件夹作为构建过程的一部分例如构建库我找不到说明如何执行此操作的文档我确信我缺少一种简单的方法来执行此操作我当前缩短的 build gradle 如下该项目正确编译并执行测试 apply plu
git push 忽略 cocoapods

我开发 iOS 应用程序已有几个月了现在我想将其推送到 bitBucket 上问题是 git push 忽略与 cocoapods 相关的所有文件例如 project xcworkspace Podfile Podfile lock
在页面中多次获取相同数据的最佳方法是什么？

我想在多次从 MySQL 获取数据的页面中显示相同的数据首先我想使用MySQL从MySQL获取数据mysql fetch assoc 在 while 循环中然后将其显示为菜单第二次我想在页脚中显示与站点地图相同的数据我现在正在打电话
Ember Data：重写 Save 方法

您好 Ember 数据世界我一直在研究自定义适配器试图找出如何覆盖保存方法根据我的理解你似乎需要做这样的事情 DS RESTAdapter extend save function return this super 但是当我尝试
Bootstrap 4 多个固定顶部导航栏

Bootstrap 4 中是否可以有多个固定顶部导航栏相互显示 1 目前覆盖了另一个这不是我想要的是的这是可能的但你必须相应地定位第二个导航栏的高度约为 56 像素 fixed top 2 margin top 56px body
阿迪和苏比之间到底是什么“关系”？

我应该回答这个问题经过一番研究后发现 add 和 sub 具有相同的操作码仅在功能领域有所不同这是答案还是其他什么 Update Nios II CPU 手册中提供了它 subi subtract immediate Operatio
如何配置 jshint 才不会出现错误“之前换行错误”？

它给了我错误之前的错误换行因为我有如下代码 var one 1 two 2 three 3 如果我把在行的末尾而不是下一行的开头它不会抱怨但我想这样编码有什么办法可以让它不显示此警告吗我虽然看了JSHint 的选项 http
使用 MediaCodec 截断视频

我使用Android MediaCodec库对视频文件进行转码主要是改变分辨率示例代码在这里 https stackoverflow com questions 29943121 mediamuxer video compression
sc.textFile 之后的 zipWithIndex 会给出正确的行号吗？

说如果我这样做如下所示 val rdd sc textFile someFile txt val rddWithLines rdd zipWithIndex zipWithIndex 添加的索引是否对应于输入文件中的行号第一行当然是 0
Powershell：递归替换目录的选择子文件中的字符串

我在 Windows XP 上使用 Powershell 并尝试编写一个命令来 1 read all bat cfg and config files 2 replace a string it s actually the path th
尝试对变量列表进行所有操作组合

我有一个值列表例如 values 1 2 3 4 我想尝试此列表中的所有组合例如 1 2 1 3 1 4 1 2 1 3 1 4 1 2 3 1 2 4 1 3 4 etc 以最简洁的方式获得所有这些可能的操作组合的最直接的方法是什么
Mongodb子文档之间的多对多关系

TL DR 想象一下第一个 match 阶段给了你几个文档但你想要refine他们在里面就像 redact做但问题是你的子文档有关系而你想要 where就像他们之间的检查一样怎样才能做到这一点呢我无法 unwind 因为它会导致

Mongodb子文档之间的多对多关系

Mongodb子文档之间的多对多关系 的相关文章

随机推荐

热门标签

Mongodb子文档之间的多对多关系的相关文章