如何在第一个文档处恢复 MongoDB ChangeStream，而不仅仅是开始监听后的更改

2024-01-31

我对此应用程序的目标是创建监视数据库的逻辑，并在将文档添加到数据库时触发操作（例如发送电子邮件）。但是，由于首次填充数据库时可能无法启动此应用程序，因此我如何手动创建一个指向添加到集合中的第一个文档的 ResumeToken，以便在第一次运行时，我可以从头开始并迭代更改，直到到达终点。我认识到我需要存储来自 lastChangeStreamDocument 的 ResumeToken 以便将来重新启动，但我对“首次运行”场景感兴趣。我虽然enumerator.Reset();是正确的选项，但它引发了一个异常，表明它不受支持。

我已经按照中提供的测试进行了操作https://github.com/mongodb/mongo-csharp-driver/blob/master/tests/MongoDB.Driver.Examples/ChangeStreamExamples.cs https://github.com/mongodb/mongo-csharp-driver/blob/master/tests/MongoDB.Driver.Examples/ChangeStreamExamples.cs并已使用以下代码成功配置了更改流

mongoClient = mongoClient ?? new MongoClient(ConnectionString);  //Create client object if it is null
IMongoDatabase sandboxDB = mongoClient.GetDatabase("SandboxDB");

var collection = sandboxDB.GetCollection<BsonDocument>("CollectionToMonitor");

try
{
    var cursor = collection.Watch();
    var enumerator = cursor.ToEnumerable().GetEnumerator();

    enumerator.MoveNext();  //Blocks until a record is UPDATED in the database
    var lastChangeStreamDocument = enumerator.Current;
    enumerator.Dispose();
    //lastChangeStreamDocument.FullDocument.Should().Be(document);

}
catch( Exception ex)
{
    Logger.WriteException(ex);
}

但是，使用此代码， enumerator.MoveNext() 行会阻塞，直到文档被更新，因此我只能在设置更改流后获取对更新文档的引用。

我的想法是搜索 local.oplog 数据库并获取插入到集合中的第一个文档的 UUID，并且成功了，但是，我没有找到一种方法可以将此引用转换为我可以提供的 ResumeToken 对象观看方法。

Update:

ResumeToken 似乎存储为 Base64，其中包含时间戳、o._id ObjectID 以及 oplog 条目中的 ui UUID。我需要再遍历一下代码，但从这个源代码中可以看出（https://github.com/mongodb/mongo/blob/c906f6357d22f66d58e3334868025069c62bd97b/src/mongo/db/pipeline/resume_token_test.cpp https://github.com/mongodb/mongo/blob/c906f6357d22f66d58e3334868025069c62bd97b/src/mongo/db/pipeline/resume_token_test.cpp）有不同格式的简历令牌。有了这些信息，希望我可以构建自己的简历令牌以匹配数据库期望的格式。

更新#2：

经过更多研究，我偶然发现了解析 a 的代码key_string在蒙戈github.com/mongodb/mongo/src/mongo/db/storage/key_string.cpp https://github.com/mongodb/mongo/blob/b58afd1e34aedcd1c1df4f2b5613c60668eaaad4/src/mongo/db/storage/key_string.cpp。该文件包含 CType 的定义。我将 Base64 解码为字节数组，然后通过 CType 枚举定义，我能够更多地了解如何构建自己的 ResumeToken。

考虑以下示例：更新文档后，我在 ChangeStream 上捕获了 ResumeToken。

glp9zsgAAAABRmRfaWQAZFp9zH40PyabFRwB/ABaEAQESw1YexhL967nKLXsT5Z+BA==

解码为字节数组：

82 5a 7d ce c8 00 00 00 01 46 64 5f 69 64 00 64 5a 7d cc 7e 34 3f 26 9b 15 1c 01 fc 00 5a 10 04 04 4b 0d 58 7b 18 4b f7 ae e7 28 b5 ec 4f 96 7e 04

我决定成为：

//Timestamp (of oplog entry??)
82    //CType::TimeStamp
5a 7d ce c8 00 00 00 01   //It appears to be expecting a 64b number
//I'm not sure why the last byte 0x01 unless it has something to do with little/bit endian
//Matching oplog doc has { ts: TimeStamp(1518194376, 1) }
//  that integer converts to 0x5A7DCEC8

//Unknown Object
46    //CType::Object
64 5f 69 64     //Either expecting a 32b value or null terminated
00    //Null terminator or divider

//Document ID
64    //CType::OID
5a 7d cc 7e 34 3f 26 9b 15 1c 01 fc  //o._id value from oplog entry
00    //OID expecting null terminated

//UUID
5a    //CType::BinData
10    //Length (16b)
04    //BinDataType of newUUID (from bsontypes.h)
04 4b 0d 58 7b 18 4b f7 ae e7 28 b5 ec 4f 96 7e  //UUID value from oplog entry
04    //Unknown byte. Perhaps end of ResumeToken, or end of UUID mark?

我现在遇到的问题是，如果我有很多 oplog 条目作为一个集合，并且我使用 oplog 中第一个条目中的 ts、ui 和 o._id 值来构建我自己的 ResumeToken（对未知值进行硬编码）0x4664 5f69 6400块和结局0x04字节，然后服务器在设置时接受它作为有效的 ResumeTokencollection.Watch。但是， enumerator.moveNext() 调用返回的文档始终返回第三个 oplog 条目，而不是第二个！

在不知道 12Byte 块的用途，也不知道为什么我指向第三个而不是第二个条目的情况下，我在生产中依赖于此感到紧张。

更新#3：

这些有问题的字节块：

46 64 5f 69 64 00

0x46 = CType::Object
0x64 = d
0x5F = _
0x69 = i
0x64 = d
0x00 = NULL

以下字节块描述了受影响文档的 ObjectId，或者它的“_id”键。那么“d”字符的意义是什么？

在解决这个问题时，我一直在用附加信息更新这个问题，现在我已经成功地将它拼凑起来，这样它就可以工作了。

下面是我创建的代码：

在 local.oplog 集合中查找命名空间的第一个条目
从该 oplog 文档生成 ResumeToken（因此我们在第二个条目上恢复）
测试这些功能的示例。

希望此代码对尝试执行相同操作的其他人有所帮助。

/// <summary>
/// Locates the first document for the given namespace in the local.oplog collection
/// </summary>
/// <param name="docNamespace">Namespace to search for</param>
/// <returns>First Document found in the local.oplog collection for the specified namespace</returns>
internal static BsonDocument GetFirstDocumentFromOpLog(string docNamespace)
{
    mongoClient = mongoClient ?? new MongoClient(ConnectionString);  //Create client object if it is null
    IMongoDatabase localDB = mongoClient.GetDatabase("local");
    var collection = localDB.GetCollection<BsonDocument>("oplog.rs");

    //Find the documents from the specified namespace (DatabaseName.CollectionName), that have an operation type of "insert" (The first entry to a collection must always be an insert)
    var filter = MongoDB.Bson.Serialization.BsonSerializer.Deserialize<BsonDocument>("{ $and: [ { 'ns': '" + docNamespace + "'}, { 'op': 'i'}] }");

    BsonDocument retDoc = null;
    try //to get the first document from the oplog entries
    {       
        retDoc = collection.Find<BsonDocument>(filter).First();
    }
    catch(Exception ex) { /*Logger.WriteException(ex);*/ }
    return retDoc;
}

/// <summary>
/// Takes a document from the OpLog and generates a ResumeToken
/// </summary>
/// <param name="firstDoc">BsonDocument from the local.oplog collection to base the ResumeToken on</param>
/// <returns>A ResumeToken that can be provided to a collection watch (ChangeStream) that points to the firstDoc provided</returns>
private static BsonDocument GetResumeTokenFromOpLogDoc(BsonDocument firstDoc)
{
    List<byte> hexVal = new List<byte>(34);

    //Insert Timestamp of document
    hexVal.Add(0x82);   //TimeStamp Tag
    byte[] docTimeStampByteArr = BitConverter.GetBytes(firstDoc["ts"].AsBsonTimestamp.Timestamp); //Timestamp is an integer, so we need to reverse it
    if (BitConverter.IsLittleEndian) { Array.Reverse(docTimeStampByteArr); }
    hexVal.AddRange(docTimeStampByteArr);

    //Expecting UInt64, so make sure we added 8 bytes (likely only added 4)
    hexVal.AddRange(new byte[] { 0x00, 0x00, 0x00, 0x01 }); //Not sure why the last bytes is a 0x01, but it was present in observed ResumeTokens

    //Unknown Object observed in a ResumeToken
    //0x46 = CType::Object, followed by the string "d_id" NULL
    //This may be something that identifies that the following value is for the "_id" field of the ObjectID given next
    hexVal.AddRange(new byte[] { 0x46, 0x64, 0x5F, 0x69, 0x64, 0x00 }); //Unknown Object, expected to be 32 bits, with a 0x00 terminator

    //Insert OID (from 0._id.ObjectID)
    hexVal.Add(0x64);   //OID Tag
    byte[] docByteArr = firstDoc["o"]["_id"].AsObjectId.ToByteArray();
    hexVal.AddRange(docByteArr);
    hexVal.Add(0x00);   //End of OID

    //Insert UUID (from ui) as BinData
    hexVal.AddRange(new byte[] { 0x5a, 0x10, 0x04 });   //0x5A = BinData, 0x10 is Length (16 bytes), 0x04 is BinDataType (newUUID)
    hexVal.AddRange(firstDoc["ui"].AsByteArray);

    hexVal.Add(0x04);   //Unknown marker (maybe end of resumeToken since 0x04 == ASCII 'EOT')

    //Package the binary data into a BsonDocument with the key "_data" and the value as a Base64 encoded string
    BsonDocument retDoc = new BsonDocument("_data", new BsonBinaryData(hexVal.ToArray()));
    return retDoc;
}


/// <summary>
/// Example Code for setting up and resuming to the second doc
/// </summary>
internal static void MonitorChangeStream()
{
    mongoClient = mongoClient ?? new MongoClient(ConnectionString);  //Create client object if it is null
    IMongoDatabase sandboxDB = mongoClient.GetDatabase("SandboxDB");
    var collection = sandboxDB.GetCollection<BsonDocument>("CollectionToMonitor");

    var options = new ChangeStreamOptions();
    options.FullDocument = ChangeStreamFullDocumentOption.UpdateLookup;

    try
    {
        var pipeline = new EmptyPipelineDefinition<ChangeStreamDocument<BsonDocument>>().Match("{ operationType: { $in: [ 'replace', 'insert', 'update' ] } }");  //Works

        //Build ResumeToken from the first document in the oplog collection
        BsonDocument resumeTokenRefDoc = GetFirstDocumentFromOpLog(collection.CollectionNamespace.ToString());
        if (resumeTokenRefDoc != null)
        {
            BsonDocument docResumeToken = GetResumeTokenFromOpLogDoc(resumeTokenRefDoc);
            options.ResumeAfter = docResumeToken;
        }

        //Setup the ChangeStream/Watch Cursor
        var cursor = collection.Watch(pipeline, options);
        var enumerator = cursor.ToEnumerable().GetEnumerator();

        enumerator.MoveNext();  //Blocks until a record is UPDATEd, REPLACEd or INSERTed in the database (thanks to the pipeline arg), or returns the second entry (thanks to the ResumeToken that points to the first entry)

        ChangeStreamDocument<BsonDocument> lastChangeStreamDocument = enumerator.Current;
        //lastChangeStreamDocument is now pointing to the second entry in the oplog, or the just received entry
        //A loop can be setup to call enumerator.MoveNext() to step through each entry in the oplog history and to also receive new events

        enumerator.Dispose();   //Be sure to dispose of the enumerator when finished.
    }
    catch( Exception ex)
    {
        //Logger.WriteException(ex);
    }
}

如果有人对代码改进有任何建议，请提出建议。我还在学习。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在第一个文档处恢复 MongoDB ChangeStream，而不仅仅是开始监听后的更改的相关文章

为什么我应该使用内联代码？ [复制]

这个问题在这里已经有答案了我是一名 C C 开发人员这里有几个始终困扰我的问题常规代码和内联代码之间有很大区别吗主要区别是什么内联代码只是宏的一种形式吗选择内联代码时必须进行什么样的权衡 Thanks 表现正如之前的答案
C语言实现延时函数

我想使用空循环实现延迟函数但是完成一次循环所需的时间取决于编译器和机器我希望我的程序自行确定时间并将程序延迟指定的时间谁能给我任何想法如何做到这一点注意有一个名为delay 的函数可以将系统暂停指定的毫秒是否可以在不使用此功能的
值类型如何实现引用类型

我遇到了一个值类型正在实现 ref 的场景类型只是想知道这怎么可能幕后发生了什么结构体是值类型接口是引用类型但结构可以实现接口而不会出现任何错误有什么想法吗提前致谢实际上它同时以两种不同的方式进行首先任何值类型都可以
C++ 并行任务的开销

我有以下简单的功能 include
C 链表销毁函数

我正在尝试学习 C 和很多人一样我对指针有点困惑无论如何我创建了一个递归函数来销毁我的链表但是正如我调试的那样当我从函数返回时列表的头部不应该为空所以我猜这是对指针的一些基本误解这是函数 void destroy struc
_MM_TRANSPOSE4_PS 在 GCC 中导致编译器错误？

我第一次在 GCC 而不是 MSVC 中编译我的数学库并经历了所有的小错误我遇到了一个根本没有意义的错误 Line 284 error lvalue required as left operand of assignment 284号
编译器消息“警告：格式‘%s’需要类型‘char *’，但参数 2 具有类型‘char (*)’”

我正在尝试运行一个简单的 C 程序但收到此错误警告格式 s 需要类型 char 但参数 2 的类型为 char 20 我在跑步Mac OS X v10 8 https en wikipedia org wiki OS X Mounta
Cookie 在 ASP.net 中失去价值

我有以下设置 cookie 的代码 string locale DropDownList this LoginUser FindControl locale SelectedValue HttpCookie cookie new HttpC
FFplay成功移入我的Winform中，如何设置它无边框？

用这个代码在 C 应用程序中显示 tcp 视频流来自 FFPLAY FFMPEG https stackoverflow com questions 14201894 show a tcp video stream from ffpla
使用 FromBase64Transform 解码 base64 文件流

The example https msdn microsoft com en us library system security cryptography frombase64transform 28v vs 110 29 aspx从M
将旧的 Unity 代码升级到 Unity 5

在触发按钮上播放动画的代码似乎不起作用我在 Youtube 上看到了一个视频内容很简单animation Play 它可以在该视频上运行但我无法让它在我的计算机上运行我做错了什么还是团结改变了它请帮助我在网上找不到解决方案所有
WCF 服务中的缓冲区大小

我们有一个 WCF 服务它执行某些存储过程并将结果返回给 silverlight 客户端某些存储过程最多返回 80K 行下面给出的是 web config 中服务的设置
我的代码哪里有泄漏？

下面是我的代码它打开一个 XML 文件 old xml 过滤无效字符并写入另一个 XML 文件 abc xml 最后我将再次加载 XML abc xml 当执行以下行时出现异常表示 xml 文件被另一个进程使用 xDoc Load
Rx 在不同的线程上生产和消费

我试图通过此处的示例代码来简化我的问题我有一个生产者线程不断地输入数据并且我尝试在批次之间添加时间延迟来对其进行批处理以便 UI 有时间渲染它但结果并不如预期生产者和消费者似乎在同一个线程上我不希望批处理缓冲区在正在生成的线程上
使用 DataGridViewCheckboxCell 真正禁用 DataGridView 中的复选框

有谁知道如何使用 DataGridViewCheckboxCell 禁用 DataGridView 中的复选框我可以将其设置为只读并设置背景颜色但我无法让复选框本身显示为禁用状态有什么想法吗 Guess 你必须自己画 http so
小数精度

我使用小数类型进行高精度计算货币但我今天遇到了这个简单的划分 1 1 37 这应该再次得到 37 http www wolframalpha com input i 1 2F 281 2F37 29 http www wolframal
SMTP 客户端在 C# 应用程序中显示错误“未采取请求的操作”

我正在尝试使用 hotmail 帐户设置电子邮件发送应用程序代码如下所示 MailMessage mail new MailMessage from to mail Subject Proba email mail Attachments
如何使用实体框架设置连接字符串

我将 EF6 与 MySQL 结合使用并有一个用于多个数据库的模型我希望能够在我的表单中设置连接设置如何以编程方式设置模型的连接字符串你应该使用EntityConnectionFactory这就是您所需要的 public strin
为什么 Mongohint 可以使查询运行速度提高 10 倍？

如果我使用explain 从shell运行mongo查询获取所使用的索引的名称然后再次运行相同的查询但使用hint 指定要使用的相同索引解释计划中的 millis 字段是显着下降例如没有提供任何提示 gt gt db event
从其对象获取结构体字段的名称和类型

例如我有一个类似这样的结构 struct Test int i float f char ch 10 我有一个该结构的对象例如 Test obj 现在我想以编程方式获取字段名称和类型obj 是否可以顺便说一句这是 C 你正在要求C

随机推荐

ASP.Net Core 类库的 Entity Framework Core 迁移

我一直在尝试遵循 Ben Cull 的建议 http benjii me 2016 06 entity framework core migrations for class library projects http benjii me
C++ 项目中 NuGet 包的 PackageReference

我参与了一个项目我们在 Visual Studioe 中使用 packages config 文件作为 NuGet 包然后通过Import我们的项目文件中的声明如果您总是想要这些包那么这种方法很好但是如果开发人员不需要不想要它们
如何实现flutter web推送通知

我想知道是否可以在 flutter web 中实现推送通知我发现我可以使用以下命令为移动应用程序创建推送通知firbase messaging但可以将它用于网络应用程序吗或任何其他替代方案来实现它我认为您已经建立了一个 flutter
document.addEventListener 与 $(document).on

我不知何故发现向文档添加事件侦听器的行为有点奇怪虽然向 HTMLElements 添加侦听器工作正常但向文档添加侦听器不起作用但奇怪的是使用 jQuery 就可以了那么有人可以解释一下为什么这两个函数没有做完全相同的事情 cus
perl 客户端 SSL 警告：对等证书未验证

我在使用 Perl 屏幕抓取程序访问 HTTPS 站点时遇到问题在调试过程中我运行了以下命令 print res gt headers as string 在输出中我有以下行 Client SSL Warning Peer certi
我们如何解决 flutter 应用程序中的 firebase 函数内部异常？

我正在使用 firebase firestore 和 firebase 函数开发一个 flutter 应用程序我一次又一次地收到此异常 ERROR flutter lib ui ui dart state cc 177 Unhandled
如何回滚临时上下文的更改？

我创建一个这样的临时上下文 let temporaryContext NSManagedObjectContext concurrencyType PrivateQueueConcurrencyType temporaryContext p
如何在android中使用HttpURLConnection上传包含其他字符串数据的文件？

我想使用 HttpURLConnection 在一个请求中将包含其他字符串数据的文件上传到服务器不使用 MultiPartEntityBuilder 目前我可以发送文件但不能发送其他字符串数据这是我当前将文件发送到服务器的代码 Htt
找到轮廓曲线中距离最远的点

我有一些x y我使用以下方法获得高斯核密度估计器 KDE 的数据scipy stats gaussian kde http docs scipy org doc scipy reference generated scipy stats g
触发 Apollo 查询并导致 URL 更改时 useContext 重新渲染

发生重新渲染的 GIF https gyazo com 20ba4879eacba9f9027886937fe723f0 我不知道如何继续正如您所看到的标头的状态通过上下文传递正在从用户的数据 gt 未定义 gt 同一用户的数据切换
为什么 npm 的所有操作都需要 sudo ？

我不知道我是如何做到的但 npm 似乎需要sudo对于绝对的每个命令甚至npm help没有 sudo 就无法工作如果我使用没有的命令sudo 我没看到EACCESS错误但我的终端会话挂起然后关闭该选项卡我在 Mac 上使用 i
Angular 2（Ionic 2）：拦截ajax请求

使用 Angular 1 x 可以使用以下代码拦截所有 ajax 请求 httpProvider interceptors push interceptRequests var app services angular module app
我可以使用外键引用 SQL Server 视图中的列吗？

在 SQL Server 2008 中并给出 TableA A ID A Data TableB B ID B Data ViewC A or B ID A or B Data 是否可以定义TableZ A or B ID Z Data 这
使用 mybatis 进行 spring boot 的 spring 模拟 mvc 测试需要属性“sqlSessionFactory”或“sqlSessionTemplate”

演示项目位置 https github com soliders mockmvctest ofspringboot withmybatismapper https github com soliders mockmvctest ofspri
在调试模式下运行程序非常慢

最近在 Eclipse Galileo 中以调试模式运行程序的速度要慢得多我不知道有任何变化你知道可能是什么原因吗正常运行是没有问题的另一种调试中断是使用方法入口出口断点您是否尝试删除all断点定义一次有时我认为 Ecl
从 Firestore 返回名称？

我尝试在 Firestore 上获取名称后返回该名称但由于某种原因它不起作用这是我的代码 func getName gt String var name db collection users whereField email isEq
python - 如何将输入字符串拆分为数组？ [复制]

这个问题在这里已经有答案了我正在尝试创建一个非常简单的程序来平均数字其中一部分涉及将输入字符串转换为数组 E g average input 平均值变成你好世界这是一根绳子然后我需要将它分成一个数组如下所示 average He
Java7拒绝信任信任存储中的证书

我有一个奇怪的问题供应商使用 TLS SSLv3 以及自签名客户端和服务器证书这对于 Java1 5 和 Java1 6 来说不是问题只需将客户端证书和私钥导入到密钥库中并将服务器公共证书导入到信任库中即可一切正常然而对于 J
同时声明并赋值多个字符串变量

我声明了一些空字符串这样以后就不会抛出错误我读到这是正确的方法 string Camnr Klantnr Ordernr Bonnr Volgnr Omschrijving Startdatum Bonprioriteit Matsoo
如何在第一个文档处恢复 MongoDB ChangeStream，而不仅仅是开始监听后的更改

我对此应用程序的目标是创建监视数据库的逻辑并在将文档添加到数据库时触发操作例如发送电子邮件但是由于首次填充数据库时可能无法启动此应用程序因此我如何手动创建一个指向添加到集合中的第一个文档的 ResumeToken 以便在第一次运行

如何在第一个文档处恢复 MongoDB ChangeStream，而不仅仅是开始监听后的更改

如何在第一个文档处恢复 MongoDB ChangeStream，而不仅仅是开始监听后的更改 的相关文章

随机推荐

热门标签

如何在第一个文档处恢复 MongoDB ChangeStream，而不仅仅是开始监听后的更改的相关文章