Article {
"_id" : "A",
"title" : "Hello World",
"user_id" : 12345,
"text" : 'My test article',
"comments" : [
{ 'text' : 'blah', 'user_id' : 654321, 'votes' : [987654]},
{ 'text' : 'foo', 'user_id' : 987654, 'votes' : [12345, 654321] },
...
]
}
这里的基本前提是我已经嵌套了Comments
里面的Article
. The Votes
只适用于一个Comment
,所以它们被存储为一个数组,每个Comment
。在本例中,我刚刚存储了 user_id。如果您想存储更多信息(time_created 等),那么您可以对对象数组进行投票:
... 'votes' : [ { user_id : 987654, ts : 78946513 } ] ...
如何有效地执行查询:
- 获取文章 A、对文章 A 的评论以及每个评论的投票数
db.articles.find( { _id : 'A' } )
这只需一个查询即可获取所有内容。您可能需要执行一些客户端逻辑来计算每个评论的投票数,但这非常简单。
- 获取用户 B 对所有文章的所有评论
db.articles.ensureIndex( { "comments.user_id" : 1 } )
db.articles.find( { "comments.user_id" : 987654 } ) // returns all document fields
该索引将允许有效地搜索文档中的注释。
目前无法仅从子数组中提取匹配项。该查询实际上将返回带有该用户评论的所有文章。如果这可能是太多数据,您可以进行一些修剪。
db.articles.find( { "comments.user_id" : 987654 }, { "title" : 1, "comments.user_id" : 1 })
- 获取用户 B 投票的所有评论
db.articles.ensureIndex( { "comments.votes" : 1 } )
db.articles.find( { "comments.votes" : 987654 } )
同样,这将返回所有文章,而不仅仅是评论。
这里需要做出权衡。返回文章可能看起来我们带回了太多数据。但是,当您进行查询 #3 时,您打算向用户显示什么?
获取列表“我投票赞成的评论”如果没有评论本身,它并不是很有用。当然,如果没有文章本身(或者至少只有标题),评论就不是很有用。
大多数时候,查询 #3 会转化为来自以下位置的联接:Votes
to Comments
to Articles
。既然如此,那为什么不直接把文章带回来呢?