使用 Mongoose 更新 MongoDB 中的许多记录的正确方法是什么

2024-01-25

我使用 Mongoose 从 MongoDB 中提取一些记录，将它们导入到另一个系统中，然后我想将所有这些文档的状态（文档属性）设置为processed.

我可以找到这个解决方案：通过id集更新多个文档。猫鼬 https://stackoverflow.com/questions/20096885/update-multiple-documents-by-id-set-mongoose

我想知道这是否是正确的方法，建立一个由所有文档 ID 组成的标准，然后执行更新。还请考虑到这将是很多文档的事实。

（更新查询的限制是多少？到处都找不到。官方文档：http://mongoosejs.com/docs/2.7.x/docs/updating-documents.html http://mongoosejs.com/docs/2.7.x/docs/updating-documents.html)

建立一个由所有文档 ID 组成的标准，然后执行更新的方法必然会导致潜在的问题。当您迭代文档列表并为每个文档发送更新操作时，在 Mongoose 中，您面临着服务器崩溃的风险，尤其是在处理大型数据集时，因为您在继续下一个数据集之前不会等待异步调用完成迭代。您实际上将构建一个未解决的操作的“堆栈”，直到这导致问题 - Stackoverflow。

举个例子，假设您有一个文档 ID 数组，您想要更新状态字段上的匹配文档：

const processedIds = [
  "57a0a96bd1c6ef24376477cd",
  "57a052242acf5a06d4996537",
  "57a052242acf5a06d4996538"
];

您可以在哪里使用updateMany() https://mongoosejs.com/docs/api/model.html#model_Model.updateMany method

Model.updateMany(
  { _id: { $in: processedIds } }, 
  { $set: { status: "processed" } }, 
  callback
);

或者对于非常小的数据集，您可以使用forEach() https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Array/forEach数组上的方法来迭代它并更新您的集合：

processedIds.forEach(function(id)){
  Model.update({ _id: id}, { $set: { status: "processed" } }, callback);
});

以上对于小数据集来说是可以的。但是，当您面临数千或数百万个文档需要更新时，这就会成为一个问题，因为您将在循环内重复调用异步代码的服务器。

要克服这个问题，请使用异步之类的东西eachLimit https://github.com/caolan/async/blob/master/README.md#eachLimit并迭代数组，为每个项目执行 MongoDB 更新操作，同时绝不执行超过 x 个并行更新。

最好的方法是使用批量 API，这在批量处理更新方面非常有效。与对众多文档中的每一个文档调用更新操作相比，性能上的差异在于，批量 API 不是在每次迭代时向服务器发送更新请求，而是每 1000 个请求（批量）发送一次请求。

对于猫鼬版本>=4.3.0支持 MongoDB 服务器3.2.x，您可以使用bulkWrite() https://docs.mongodb.org/manual/reference/method/db.collection.bulkWrite/用于更新。以下示例展示了如何执行此操作：

const bulkUpdateCallback = function(err, r){
  console.log(r.matchedCount);
  console.log(r.modifiedCount);
}

// Initialize the bulk operations array
const bulkUpdateOps = [], counter = 0;

processedIds.forEach(function (id) {
  bulkUpdateOps.push({
    updateOne: {
      filter: { _id: id },
      update: { $set: { status: "processed" } }
    }
  });
  counter++;

  if (counter % 500 == 0) {
    // Get the underlying collection via the Node.js driver collection object
    Model.collection.bulkWrite(bulkUpdateOps, { ordered: true, w: 1 }, bulkUpdateCallback);
    bulkUpdateOps = []; // re-initialize
  }
})

// Flush any remaining bulk ops
if (counter % 500 != 0) {
  Model.collection.bulkWrite(bulkOps, { ordered: true, w: 1 }, bulkUpdateCallback);
}

对于猫鼬版本~3.8.8, ~3.8.22, 4.x支持 MongoDB 服务器>=2.6.x，您可以使用批量 API，如下所示

var bulk = Model.collection.initializeOrderedBulkOp(),
    counter = 0;

processedIds.forEach(function(id) {
    bulk.find({ "_id": id }).updateOne({ 
        "$set": { "status": "processed" }
    });

    counter++;
    if (counter % 500 == 0) {
        bulk.execute(function(err, r) {
           // do something with the result
           bulk = Model.collection.initializeOrderedBulkOp();
           counter = 0;
        });
    }
});

// Catch any docs in the queue under or over the 500's
if (counter > 0) {
    bulk.execute(function(err,result) {
       // do something with the result here
    });
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Mongoose 更新 MongoDB 中的许多记录的正确方法是什么的相关文章

Google Analytics 服务器端授权获取页面浏览计数分析数据并将其显示在首页上的随机访问者

如何显示您网页的访问者计数而无需像 Google Analytics 那样登录或进行身份验证我正在尝试实施 Google Analytics 服务器端授权来获取页面浏览计数分析数据并将其显示给首页上的随机访问者我阅读了他们的文档并找到
$setIntersection 失败，子文档数组不在集合中

考虑以下文档 item1 a 1 b 2 item2 a b 以下查询 db test aggregate project items setIntersection item1 item2 返回预期结果 id ObjectId 57107
在 Node.js 中封装 require 可以解决相对路径调用

我正在尝试创建一个 require 包装器来加载依赖项但我发现很难让它像原始的 require 函数一样工作当路径是相对路径时包装器无法解析为正确的路径因为我的加载程序和调用程序文件不在同一文件夹中这是一个简化的描述 index
显示服务器端运行的长进程的状态

我正在基于 Node js 的 Web 应用程序中进行 CSV 导入大多数给定的 CSV 文件都有数万条记录并且需要几分钟的时间因此在导入完成之前我想向用户显示当前正在导入消息我想要创建的内容类似于 Github 的分叉屏幕
我可以使用 lambda 调用将路径参数传递给另一个 lambda 函数吗？

我正在尝试使用 lambda 调用来调用另一个 lambda 函数并获取响应问题是其他 lambda 函数需要将 id 作为路径参数或作为查询字符串发送但我在 lambda 调用中没有看到此选项如果我在有效负载中传递 id 其他函
强大的上传不起作用：“文件”未定义，没有错误

我正在尝试使用 formidable 上传文件按照中的教程进行操作节点入门书 http www nodebeginner org 按照这段代码我有一个服务器模块它通过requestrequestHandler 模块的对象主页加载带有
使用 $or 运算符时 MongoDB 查询会变慢

我正在尝试对我的收藏进行此查询Audios var querySlow palabra regex keywords options i or p pais in interested accents languageCodeTatoeba
Node.js 中的 Zip 档案

我想创建一个 zip 存档并将其解压缩到 node js 中我找不到任何节点实现 node core 内置了 zip 功能 http nodejs org api zlib html http nodejs org api zlib ht
从 HTML 表单发送数据到 Node.js 服务器

我正在学习 Node js 我的服务器中有这个 var http require http var url require url http createServer function request response response w
如何使用nodeJS SFTP客户端列出所有子目录？

有趣的节点 JS ssh2 sftp client 我想列出给定路径中的所有目录及其子目录 let sftp new ssh2SftpClient console log sftp sftp connect host xx xxx xxx
MongoDB 2dsphere 索引失败（几何格式错误？）

我目前正在尝试构建 2dsphere 索引但创建似乎失败索引创建失败的文档是有效的 geojson 根据 geojsonlint 据我所知它遵循 MongoDB 多边形规则我将不胜感激任何帮助因为我无法弄清楚为什么索引创建似乎失
在 Express 中设置客户端可访问 Cookie

我正在开发一个使用 Express 和 SocketIO 的 Node 应用程序我想在我的 Express 控制器中设置一个 cookie 然后可以从我的客户端 Javascript 代码访问该 cookie 我尝试的一切似乎都不起作用
Node.js - Async.js：并行执行如何工作？

我想知道 async js 中并行执行是如何工作的 async require async async parallel function callback for var i 0 i lt 1000000000 i Do nothing
heroku 上 phantomjs 的分页内部支持

我有一个 NodeJS 应用程序使用 PhantomJS 生成 PDF 文件我的应用程序已部署到 Heroku 并且我正在使用this https github com stomita heroku buildpack phantomj
exec 'node app' 挂在 gulp 任务中

这个 gulp 任务挂起exec node config app 线第一的exec工作正常但第二个挂起 gulp task test function cb var exec require child process exec exe
水线，在数组中查找数组

我有视频模型 module exports attributes id string tags array 我想查找带有 Hello 或 World 等标签的所有视频我可以轻松获取所有视频例如 Video find tags 你好我看
AWS S3 生成签名 URL“AccessDenied”

我正在使用 NodeJs 将文件上传到 AWS S3 我希望客户端能够安全地下载文件因此我尝试生成签名 URL 该 URL 在使用一次后就会过期我的代码如下所示上传中 const s3bucket new AWS S3 access
socket.io 自动断开套接字

当我在电子中运行 socket io 时我不断在开发者控制台中收到此错误 engine io client socket probe transport websocket failed because of error transpor
如何列出特定服务器的所有成员？

我的代码是 const list client guilds find id 335507048017952771 for user of list users console log user 1 username 这实际上没有任何作用
Node.js：从 s3 下载文件并将其解压缩为字符串

我正在编写一个AWS Lambda函数它需要从AWS S3下载文件解压缩文件并以字符串形式返回内容我正在尝试这个 function getObject key var params Bucket my bucket Key key r

随机推荐

混合运行时是可行的解决方案吗？

在我的公司我们最近从 VC9 切换到 VC10 我们迁移了我们的项目但是负责人告诉我们我们必须在我们的生产机器上保留一些用 VC9 编译的基本通用 DLL 一段时间这些 DLL 使用自定义结构其中一些包含std vector st
在 C++ 的条件或控制语句中声明和初始化变量

在斯特鲁斯特鲁普的C 编程语言特别版第 3 版 Stroustrup 写道在控制语句的条件中声明和初始化变量不仅是允许的而且是鼓励的他写道他鼓励这样做因为它将变量的范围缩小到仅需要它们的范围所以像这样的事情 if int i
依赖 Windows 句柄的类型作为指针可以吗？

Windows 句柄有时很烦人需要记得在之后进行清理使用创建的笔和画笔执行 GDI 就是一个很好的例子 RAII 解决方案很棒但是为每种不同类型的手柄制作一个完整的五规则 RAII 类真的那么好吗当然不是我能看到的最好的结果是一
为什么 gcc 4.1 + gcov 报告 100% 分支覆盖率，而较新的（4.4、4.6、4.8）报告“p = new class;”为 50%线？

当 gcc 4 1 使用 gcov 下一行时 p new Class 据报告分支覆盖率为 100 为什么使用 gcc 4 4 及更高版本同一行报告为 p new Class 50 branch coverage 我可以为较新的 gcc 版
用一个简单的句子来说，出口和引用出口有什么区别？

出口是否连接到子视图引用出口是否连接到内容是这样吗术语引用出口是指引用或指向当前对象的另一个对象中的出口举个例子假设您有一个笔尖其中有一个文件所有者和一个 UITableView 等为了使 tableview 工作它有一
如何重新排列弦方程？

我需要开发一个程序来求解线性方程节目首先读取一个整数n这是方程的数量然后程序读取n包含方程的行例如程序的输入如下 3 2x1 3x2 4x3 16 1x1 2x2 1x3 8 3x1 1x2 2x3 13 任何操作都应该首先将每个
JavaScript 碰撞检测

我正在尝试用 javascript 制作一个贪吃蛇游戏但我在碰撞检测方面遇到了困难到目前为止我已经尝试了各种方法但在绝望中我决定存储每帧片段的所有位置然后在制作下一帧动画之前检查是否有重复项不幸的是这种方法也没有被证明是成功
列表列，将列表转换为字符串作为新列

我有一个包含一列列表的数据框可以使用以下命令创建 import pandas as pd lists 1 1 2 12 6 ABC 2 1000 4 z a create test dataframe df pd DataFrame fr
我可以在redmine中创建跨项目源参考吗？

如果您有两个以某种方式连接的独立项目如何引用其他项目的来源为了引用您自己的项目的源代码您可以使用 source some file 但由于我想引用另一个项目中的代码我的想法是我可以编写如下内容 other project sourc
Kotlin 中的 IntArray 与 Array

我不确定有什么区别IntArray and an Array
C# 中的跨线程事件处理

我正在使用一个框架该框架在单独的线程中运行自己的事件调度程序该框架可能会生成一些事件 class SomeDataSource public event OnFrameworkEvent void FrameworkCallback T
log4net %属性不起作用

我有一个小型测试项目代码如下 class Program static void Main string args log4net GlobalContext Properties logFileName log txt log4net
如何使用 cURL 获取 JavaScript 加载的网页内容？

我正在尝试从网站上获取分数表问题是该网站正在使用显然加载的 javascriptdocument ready 因此我似乎没有成功获取表格我得到的只是该页面顶部的按钮关于如何解决这个问题有什么建议或想法吗 cURL 只会为您提供页面的
quarto_render 从 .bat / .cmd 文件中损坏

这有点复杂但我认为其他人也可能遇到这个问题四开本很棒但一直面临一个问题其中一个功能 quarto render 无法呈现通过 bat cmd 文件访问的脚本中的文档如果我从 RStudio IDE 运行 R 脚本没有问题但通过
Cairo 示例适用于 Python 2.7，但不适用于 Python 3

最简单的例子我们通过 Gtk 创建一个窗口添加 Gtk DrawingArea 的绘图区域并在其上通过 Cairo 绘制文本 Example usr bin env python from gi repository import G
如何获取 JSON.Net 中 JsonProperty 的名称？

我有一堂课是这样的 JsonObject MemberSerialization OptIn public class foo JsonProperty name in json public string Bar get set etc
将接口传递给 ASP.NET MVC 控制器操作方法

在我的 ASP NET MVC 应用程序中我有一个界面充当多个不同视图模型的模板 public interface IMyViewModel Client Client1 get set Client Client2 get set V
移动分配与标准复制和交换不兼容

测试新的移动语义我刚刚询问了我在使用移动构造函数时遇到的问题但正如评论中所表明的那样问题实际上是当您使用标准的复制和交换习惯用法时移动赋值运算符和标准赋值运算符发生冲突这是我正在使用的类 include
如何在 IONIC 3 中使用路由

我正在开发一个 Ionic 3 应用程序现在我正在使用NavController用于路由和切换页面 Ex this navCtrl push DetailsPage 但我现在需要使用 Angular 路由我发现类似的question h
使用 Mongoose 更新 MongoDB 中的许多记录的正确方法是什么

我使用 Mongoose 从 MongoDB 中提取一些记录将它们导入到另一个系统中然后我想将所有这些文档的状态文档属性设置为processed 我可以找到这个解决方案通过id集更新多个文档猫鼬 https stackoverf

使用 Mongoose 更新 MongoDB 中的许多记录的正确方法是什么

使用 Mongoose 更新 MongoDB 中的许多记录的正确方法是什么 的相关文章

随机推荐

热门标签

使用 Mongoose 更新 MongoDB 中的许多记录的正确方法是什么的相关文章