在 pymongo 中快速或批量更新

2024-02-19

如何在 pymongo 中进行批量更新插入？我想更新一堆条目，但一次更新一个非常慢。

几乎相同问题的答案在这里：MongoDB 中的批量更新/更新插入？ https://stackoverflow.com/questions/4444023/bulk-update-upsert-in-mongodb

接受的答案实际上并没有回答问题。它只是提供了用于执行导入/导出的 mongo CLI 的链接。

我也愿意接受有人解释为什么批量更新插入不可能/不是最佳实践，但请解释此类问题的首选解决方案是什么。

pymongo 的现代版本（高于 3.x ）将批量操作包装在一致的接口中，该接口会在服务器版本不支持批量操作的情况下降级。这在 MongoDB 官方支持的驱动程序中现在是一致的。

所以编码的首选方法是使用bulk_write() https://api.mongodb.org/python/current/api/pymongo/collection.html#pymongo.collection.Collection.bulk_write相反，当你使用UpdateOne https://api.mongodb.org/python/current/api/pymongo/operations.html#pymongo.operations.UpdateOne其他其他适当的操作动作代替。当然，现在最好使用自然语言列表而不是特定的构建器

旧文档的直接翻译：

from pymongo import UpdateOne

operations = [
    UpdateOne({ "field1": 1},{ "$push": { "vals": 1 } },upsert=True),
    UpdateOne({ "field1": 1},{ "$push": { "vals": 2 } },upsert=True),
    UpdateOne({ "field1": 1},{ "$push": { "vals": 3 } },upsert=True)
]

result = collection.bulk_write(operations)

或者经典的文档转换循环：

import random
from pymongo import UpdateOne

random.seed()

operations = []

for doc in collection.find():
    # Set a random number on every document update
    operations.append(
        UpdateOne({ "_id": doc["_id"] },{ "$set": { "random": random.randint(0,10) } })
    )

    # Send once every 1000 in batch
    if ( len(operations) == 1000 ):
        collection.bulk_write(operations,ordered=False)
        operations = []

if ( len(operations) > 0 ):
    collection.bulk_write(operations,ordered=False)

返回的结果是BulkWriteResult https://api.mongodb.org/python/current/api/pymongo/results.html#pymongo.results.BulkWriteResult其中将包含匹配和更新文档的计数器以及返回的文档_id发生的任何“更新插入”的值。

关于批量操作数组的大小存在一些误解。发送到服务器的实际请求不能超过 16MB BSON 限制，因为该限制也适用于发送到使用 BSON 格式的服务器的“请求”。

然而，这并不决定您可以构建的请求数组的大小，因为实际操作无论如何都只会以 1000 个批次的形式发送和处理。唯一真正的限制是，这 1000 个操作指令本身实际上并不会创建大于 16MB 的 BSON 文档。这确实是一个相当艰巨的任务。

批量方法的一般概念是“更少的流量”，因为一次发送许多内容并且只处理一个服务器响应。减少每个更新请求的开销可以节省大量时间。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 pymongo 中快速或批量更新的相关文章

导入错误：无法导入名称“PandasError”

我对在 Mac 上运行的 Python 3x 非常陌生当前使用 python 金融的 senddex 教程尝试运行以下脚本 import datetime as dt import matplotlib pyplot as plt fr
显示来自 mongodb 的所有数据并在 doT.js 模板引擎中渲染它

我想从 mongodb 中提取数据并将其传递给视图一切似乎都正常但我没有看到所有 10000 条记录都显示出来而是只看到了一条我觉得我非常接近解决它但我陷入困境我正在使用node mongodb native express和d
如何使用 QWebView 显示 html。 Python？

如何在控制台中显示 HTML 格式的网页 import sys from PyQt4 QtGui import QApplication from PyQt4 QtCore import QUrl from PyQt4 QtWebKit i
将字段重新格式化为列，其他字段（与先前结构中成为列的字段配对）成为新列中的字段

我的任务是清理慈善机构设计的移动应用程序中的数据在一个部分中用户问答应用程序使用会话由一行表示该部分由重复的问题答案字段对组成其中一个字段代表所提出的问题然后它旁边的字段代表相应的答案每个问题字段和答案列对一起代表一个独特的问
每个刻度标签都有不同的颜色

我正在尝试使用 matplotlib python 3 5 创建一个散点图其中 x 轴上的每个刻度都有不同的颜色这怎么可能例如假设 x 刻度为 Mo Tu We Th Fr Sa Su 现在我希望 Mo 是绿色的 Tu 是蓝色的等
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
在 python 中查找价格动量的有效方法：对列的最后 n 个条目求平均值

我正在定义价格动量是给定股票过去动量的平均值n days 反过来动量是一种分类如果当天的收盘价高于前一天则每天标记为 1 如果当天的收盘价低于前一天则标记为 1 我的库存变化百分比如下 df close in percent np
使用正则表达式检查整个字符串

我正在尝试检查字符串是否是数字因此正则表达式 d 似乎不错然而由于某种原因该正则表达式也适合 78 46 92 168 8000 这是我不想要的一些代码 class Foo rex re compile d def bar sel
argparse 更改参数的定义

我按如下方式设置参数解析器 parser argparse ArgumentParser parser add argument point help enter a point e g 2 3 4 parser parse args po
参数太少错误，同时未使用参数占位符

我尝试使用 PYODBC 在 Access 数据库中执行 SQL 查询但出现以下错误 pyodbc Error 07002 07002 Microsoft ODBC Microsoft Access 驱动程序参数太少预期为 1 301
在我的 Mac 上以 root 身份运行 pip 时出现“权限被拒绝”

我开始使用我的 Mac 来安装 Python 包就像我在工作中使用 Windows PC 一样然而在我的 Mac 上我经常遇到没有权限写入日志文件或站点包时出错于是我想到了跑步pip install
Tkinter 按钮鼠标右键和左键单击有不同的命令

我正在用 Python 制作扫雷游戏并使用 tkinter 库来创建 gui 有没有绑定到 tkinter 按钮两个命令的方法一个是右键单击按钮时的命令另一个是单击左键时的命令通常按钮仅设计用于单击但 tkinter 允许您为
更新或插入 MySQL Python

如果记录已存在我需要更新一行如果不存在我需要创建一个新记录我理解 ON DUPLICATE KEY 将使用 MYSQLdb 完成此操作但是我无法使其正常工作我的代码如下 cursor database cursor cursor
将 Selenium 与 PyCharm CE 结合使用

我正在尝试将 Selenium 与 PyCharm CE 一起使用我已经使用 pip install Selenium 安装了 Selenium 并且可以通过终端使用它但是当我尝试将它与 PyCharm 一起使用时出现导入错误 Imp
我无法设置顶级标题

我想为 TopLevel 设置标题但 TopLevel 显示 Root 的标题我认为我的下一个脚本与 TkInter 文档中的示例相对应但给了我不好的结果你能解释一下为什么我的设置master title 顶部 in 应用程序顶部
了解字典的深度

假设我们有这个字典 d a 1 b c 了解嵌套的最直接方法是什么depth of it 您需要创建一个递归函数 gt gt gt def depth d if isinstance d dict return 1 max map dept
Python：如何对数组 X 进行排序，但对 Y 进行相同的相对排序？

例如 X 5 6 2 3 1 Y 7 2 3 4 6 我对X进行排序 X 1 2 3 5 6 但我希望对 Y 应用相同的相对排序以便数字保持与以前相同的相对位置 Y 6 3 4 7 2 我希望这是有道理的通常你会做一个zip sort
使用条件在 pandas 数据框中生成新列

我有一个 pandas 数据框如下所示 portion used 0 1 1 0 1 2 0 3 2 3 0 0 3 4 0 8 我想根据以下内容创建一个新专栏used列以便df看起来像这样 portion used alert 0 1
将非方邻接矩阵导入 Networkx python

我在下面有一些 pandas 数据框形式的数据其中列代表离散技能行代表离散工作仅当工作需要该技能时才存在 1 否则为 0 skill 1 skill 2 job 1 1 0 job 2 0 0 job 3 1 1 我想使用 netwo
如何测试send_file烧瓶

我有一个小型烧瓶应用程序它需要上传一些图像并将它们转换为多页 tiff 没什么特别的但是如何测试多个文件的上传和文件下载呢我的测试客户端 class RestTestCase unittest TestCase def setUp s

随机推荐

本地化包含名称列表的字符串

我有包含名称列表的字符串如下所示约翰向金凯利李和鲍勃询问了新年计划名单中的名字数量可以非常多我如何在 Java 中本地化它我正在考虑 ResourceBundle 和 MessageFormat 我将如何在 MessageFo
如何忽略通过 http 发送的属性

我的应用程序中有一个接口用于维护我想要发送到数据库的属性以及我不发送到数据库的属性具体来说我维护一个名为state可以设置为open or null 关闭然后触发 Angular2 的动画state https angular io
RemoteActor 取消注册 actor

我正在玩 RemoteActors 现在我想知道如果我关闭 RemoteActor 会发生什么该 Actor 可通过 RemoteActor alive 和 RemoteActor register 来使用我找不到两者的逆活着和注册
如何在java中使用lucene添加自定义停用词

我正在使用 lucene 删除英语停用词但我的要求是删除英语停用词和自定义停用词下面是我使用 lucene 删除英文停用词的代码我的示例代码 public class Stopwords remove public String re
从 Mastercard/VISA 借记卡/信用卡读取 EMV 数据 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在尝试构建一个应用程序来读取编码卡上的数据如 PAN 到期日客户名称 PIN 等信息到目前为止我发现我需要发送 APDU
导航抽屉图标未显示（Sherlock 操作栏）

让导航抽屉与 sherlock 操作栏配合使用但我无法显示 3 行图标如 gmail 而不是正常的向上按钮 getSupportActionBar setIcon R drawable myIcon getSupportActionBa
“ExecuteScalar：连接属性尚未初始化。”

我是 C 新手目前在不调试的情况下运行该程序时遇到一些问题这是我的项目的登录页面我创建了一个基于服务的数据库我想连接到数据库中表 Table 中的用户名和密码数据但是我遇到了一个问题 ExecuteScalar 连接属性尚未初始
R 函数在 left_join 中进行故障恢复？

我有 20 多个不同的数据表其中的数据由相同的编码系统北美行业分类系统 NAICS 索引我想将它们连接到一个表中问题是每个表中都有不同级别的详细信息当我加入时我希望通过失败编码系统的层次结构直到找到匹配来找到最佳匹配一个常规的
如何在 VBA 中处理工作表（unicode VBA 显示和处理）中西里尔字母引起的错误（#REF）？

我想从特定的工作簿中获取数据有几十个工作簿循环部分工作正常但下面的代码不起作用因为工作表采用西里尔字母并且它们给出了值到sheet As String范围我想问如何在不打开工作簿的情况下强制重命名它无需Workbook Op
Laravel 4 Auth：尝试不起作用

我在使用 Laravel 4 Auth attempt 方法时遇到了困难遵循了正确的文档阅读了几个 SO 线程但我仍然无法让它工作 userData array email gt email protected cdn cgi l e
MySQL 使用日期时间进行选择，仅按日期分组

是否可以从 MySQL 表中选择日期时间字段并仅按日期分组我正在尝试输出多次发生的事件列表并按发生日期分组我的表数据如下所示时间戳是日期时间字段 1 2010 03 21 18 00 00 Event1 2 2010 03 21
如何使用 Perl 将字符串转换为浮点数？

有没有类似的功能int 哪个可以将字符串转换为浮点值我目前正在使用以下代码 input int substr line 1 index line 1 我需要转换返回的字符串substr浮只需使用它即可在 Perl 中看起来像数字的字
如何根据一定的标准对列表进行排序

例如我有一个清单 list word1 0 234 word2 0 2 word3 0 5 word4 0 67 我想按重要性对其进行排序重要性是指该值距 0 5 有多远排序后的列表应该是 list word2 0 2 word1 0
Windows Batch 读取文件并将行解析为标记和变量

通过搜索这个网站并学习 Windows 批处理脚本这一荒谬的语言我已经取得了很大的进展但我现在陷入了困境我有一个行数可变的文本文件每行看起来像 AA8315 United States N777AN American Airline
如果对象已经是同一或另一个状态树的一部分，则无法将对象添加到状态树

mobx state tree module js f7d3 2154 未捕获错误 mobx state tree 如果对象已经是同一或另一个状态树的一部分则无法将对象添加到状态树我只是通过过滤另一个状态来得到这个错误 const da
JsDoc命名空间

我正在使用 JsDoc 编辑 js 文件以获得干净的文档我的结构非常简单 Finds an object param string prop Property Array prototype findObject function fin
将 RGB 颜色存储在 MySQL 中。 char 还是 int 更好？

我使用 PHP 从 MySQL 数据库查询 CSS 设置然后将其回显到 CSS 样式表中示例片段如下
ClickOnce 应用程序用户设置位置

我目前正在开发一个 ClickOnce 应用程序用于转换 CSV 文件以进行数据库更新该程序要求用户能够更改数据库更改的配置文件并更改填充应用程序中下拉列表的 XML 文件现在我知道这些文件保存在 user appdata 文件夹中
为什么我的 Perl 祝福文件句柄不使用“can('print')”返回 true？

由于某种原因我无法让文件句柄与 Expect pm 一起使用log file方法我最初得到的帮助是如何将文件句柄传递给 Perl Expect 的 log file 函数 https stackoverflow com question
在 pymongo 中快速或批量更新

如何在 pymongo 中进行批量更新插入我想更新一堆条目但一次更新一个非常慢几乎相同问题的答案在这里 MongoDB 中的批量更新更新插入 https stackoverflow com questions 4444023 bul

在 pymongo 中快速或批量更新

在 pymongo 中快速或批量更新 的相关文章

随机推荐

热门标签

在 pymongo 中快速或批量更新的相关文章