使用 pymongo 读取和更新 mongodb 文档的最佳方法

2023-12-30

我试图逐个读取 mongodb 集合文档，以获取每条记录，加密记录中的一些字段并将其放回数据库。

for record in coll.find():
    #modifying record here
    coll.update(record)

这导致了一个严重的问题，即已经更新的文档被光标再次读取，并且相同的文档在循环中再次处理（相同的文档正在尝试再次更新）

希望这可能是解决问题的方法之一。

list_coll = [record for record in coll.find()]
for rec in list_coll:
   #modifying record
   coll.update(rec)

但这是最好的做法吗？即如果集合很大会发生什么？较大的list_coll会导致内存溢出吗？请建议我最好的方法。

thanks

你想要的“批量操作API” http://api.mongodb.org/python/current/examples/bulk.html来自 MongoDB。主要是随 MongoDB 2.6 引入的，因此如果您目前还没有升级，这是一个令人信服的理由进行升级。

bulk = db.coll.initialize_ordered_bulk_op()
counter = 0

for record in coll.find(snapshot=True):
    # now process in bulk
    # calc value first
    bulk.find({ '_id': record['_id'] }).update({ '$set': { 'field': newValue } })
    counter += 1

    if counter % 1000 == 0:
        bulk.execute()
        bulk = db.coll.initialize_ordered_bulk_op()

if counter % 1000 != 0:
    bulk.execute()

更好的是，您不会向服务器发送“每个”请求，而是每 1000 个请求中发送一次。 “批量 API”实际上在某种程度上为您解决了这个问题，但您实际上希望更好地“管理”它，并且不要在应用程序中消耗太多内存。

未来之路。用它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 pymongo 读取和更新 mongodb 文档的最佳方法的相关文章

使用 python requests 模块时出现 HTTP 503 错误

我正在尝试发出 HTTP 请求但当前可以从 Firefox 浏览器访问的网站响应 503 错误代码本身非常简单在网上搜索一番后我添加了user Agent请求参数但也没有帮助有人能解释一下如何消除这个 503 错误吗顺便说一句
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
将html数据解析成python列表进行操作

我正在尝试读取 html 网站并提取其数据例如我想查看公司过去 5 年的 EPS 每股收益基本上我可以读入它并且可以使用 BeautifulSoup 或 html2text 创建一个巨大的文本块然后我想搜索该文件我一直在使用
Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
YOLOv8获取预测边界框

我想将 OpenCV 与 YOLOv8 集成ultralytics 所以我想从模型预测中获取边界框坐标我该怎么做呢 from ultralytics import YOLO import cv2 model YOLO yolov8n pt
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
在 Meteor 中运行示例的问题

我正在测试 Meteor 示例这是我运行时看到的meteor在待办事项示例中 Unexpected mongo exit code 100 Restarting Unexpected mongo exit code 100 Restart
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
MongoDB：javascript执行失败：无法在 src/mongo/shell/collection.js 保存 DBQuery 对象

在 MongoDb 中当我尝试修改集合中的现有文档时它会生成以下异常 javascript execution failed can t save a DBQuery object at src mongo shell collecti

随机推荐

如何从“stdin”创建非阻塞连续读取？

我有一个进程它是这样创建的 p subprocess Popen args myapp stdin subprocess PIPE stdout subprocess PIPE universal newlines True 后来我想写信
Solr ExtractingRequestHandler 提取链接中的“rect”

我正在利用 solr ExtractingRequestHandler 来提取和索引 HTML 内容我的问题涉及它生成的提取链接部分返回的提取内容已在 HTML 源中不存在的位置插入矩形我的 solrconfig 单元配置如下
使用java在目录中的文本文件中递归搜索？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要在目录和子目录的所有文件中搜索文本有什么聪明的主意吗 Use the org apache commons io FileUt
是否可以仅使用 CSS3 来转换文本对齐方式？

是否可以使用 css3 转换文本对齐方式例如我想从左到右设置文本对齐的动画但是在文本对齐上添加过渡属性并不能解决问题 http codepen io anon full lGDwB http codepen io anon full
如何转换 RGB -> YUV -> RGB（双向）

我想要一对转换算法一个从 RGB 到 YUV 另一个从 YUV 到 RGB 它们彼此相反也就是说往返转换应保持该值不变如果愿意可以将 YUV 替换为 Y UV YUV YCbCr YPbPr 这样的事情存在吗如果是这样那是什么
验证本地计算机上的用户凭据

我有一个 Windows 服务作为本地系统用户运行除了检查用户是否属于 WSMA 组之外还需要根据用户名和密码验证用户我当前的代码是这样的 var pc new PrincipalContext ContextType Machin
SVG 和 RevealJS 中的鼠标位置

我正在使用 RevealJS 创建演示文稿并希望合并一些使用 D3 创建的交互式 SVG 可视化效果我以前曾多次毫无困难地完成此操作但这次遇到了一些困难经过一番调试后我将问题追溯到以下内容由于某种原因当整个内容包含在 Reve
StreamReader 和可移植类库

我正在使用可移植类库编写一个 ConfigManager 类 PCL支持StreamReader and StreamWriter我想要使用的类但这些类的 PCL 版本不支持在构造期间传入字符串 PCL 也不支持reader Close
如何在 Angular 7 中禁用目标 cdkDropList 中的元素移位/移动

我有 2 个列表左侧的首都城市和右侧的国家地区我希望能够将首都移至国家列表中并允许用户将首都移至该国家地区问题是国家地区列表元素开始移动移动以允许插入大写字母但我只想放在顶部如果匹配请提供一条消息并从两个列表中删除城
JSF 2.1 重定向保留错误消息

我有以下命令按钮操作方法处理程序 public String reject Do something addMessage null rejectAmountInvalid FacesMessage SEVERITY ERROR redir
*(int*)NULL = 1 导致线程崩溃；有问题吗？

我在多线程 C 应用程序中发现了这个作者评论说它用于在自定义断言函数中造成线程崩溃 GCC 对此没有问题但 clang 发出以下警告 note consider using builtin trap or qualifying poin
按多个字段对对象列表进行排序[重复]

这个问题在这里已经有答案了我有一个 Java 对象列表我想根据多个字段对其进行排序 public class graduationCeremony String campus String faculty String building
声纳跑步者 404 本地主机

我正在尝试让 Sonar 在 OS X 机器上本地工作以进行一些概念验证工作我已经下载了以下内容声纳库 4 5 6 声纳跑步者 2 4 Sonarqube 配置为 sonar web host localhost sonar web c
如何使用外键从2个表中获取所有数据

这是将单个表分成两部分的结果 Table users user id pk ai email password last login Table data user id fk to users user id data 1 data 2
Linux中通过perf为未列出的函数添加动态跟踪点

我正在尝试跟踪功能zap pte range来自 mm memory c 使用perf 但功能并未在其中列出perf probe F 那么有没有办法动态追踪这个函数呢 IE 显式添加跟踪点并重新编译内核 perf probe a zap p
创建具有不同行尺寸的表

假设我有一张这样的表 data lt c 1 2 3 6 5 6 9 LC LC HC HC LC HC ALL attr data dim lt c 7 2 data 1 2 1 1 LC 2 2 LC 3 3 HC 4 6 HC 5 5
如何对向量中的每个项目进行操作并引用 Clojure 中的先前值？

Given def my vec a foo b 10 a bar b 13 a baz b 7 如何迭代每个元素以打印该元素的 a 以及到该点的所有 b 的总和那是 foo 10 酒吧 23 巴兹 30 我正在尝试这样的事情但无济于事
如何解决-无法在AWS lambda控制台中的模块外部使用导入语句

我正在 AWS lambda 控制台中尝试此操作我已经在终端上安装了 npm install aws sdk client kinesis 并使用压缩文件并创建了一个具有 client kinesis 的 lambda 层如果使用以下内
selenium.common.exceptions.WebDriverException：消息：尝试使用 Selenium 和 Python 单击元素时无法将数据转换为对象

我登录后尝试单击页面上的按钮该按钮是以下 HTML div div
使用 pymongo 读取和更新 mongodb 文档的最佳方法

我试图逐个读取 mongodb 集合文档以获取每条记录加密记录中的一些字段并将其放回数据库 for record in coll find modifying record here coll update record 这导致了一个严

使用 pymongo 读取和更新 mongodb 文档的最佳方法

使用 pymongo 读取和更新 mongodb 文档的最佳方法 的相关文章

随机推荐

热门标签

使用 pymongo 读取和更新 mongodb 文档的最佳方法的相关文章