在连接之间共享事务

2024-03-07

我有一个 FileShare 爬虫（获取权限并将其放在某处以供以后审核）。目前，它正在启动多个线程来抓取同一文件夹（以加快进程）。

在 C# 中，每个SqlConnection对象有自己的SqlTransaction，由SqlConnection.BeginTransaction() call.

这是当前解决方案的伪代码：

获取文件夹列表
对于每个文件夹获取子文件夹列表
对于每个子文件夹启动一个线程来收集文件共享
每个线程都会将收集到的数据保存到数据库中
对数据库运行审核报告

当子文件夹线程之一失败时就会出现问题。我们最终得到了“无法轻易检测到”的部分文件夹扫描。主要原因是每个线程都在单独的连接上运行。

我希望每个文件夹都在同一事务中提交，而不是进行不完整的扫描（当前情况，当某些线程失败时）。没有实施交易概念，但我正在评估这些选项。

根据评论这个答案 https://stackoverflow.com/a/23942409/837623，生产者/消费者队列将是一个选项，但不幸的是内存是有限的（由于启动线程的数量）。如果生产者/消费者空间被提交到磁盘以克服 RAM 限制，则执行时间将会增加（由于与内存 I/O 相比，磁盘 I/O 非常有限）。我想我陷入了记忆/时间的妥协。还有其他建议吗？

可以使用过时的绑定事务功能在与 SQL Server 的多个连接上共享同一事务。我从未使用过它，也不会基于它进行新的开发。这里似乎也没有必要。

难道不能让所有生产者使用相同的连接和事务吗？在它周围放一把锁。这显然会成为该过程的瓶颈，但它可能仍然足够快。

你说你执行INSERT声明。对于批量插入，您可以使用SqlBulkCopy类的速度要快得多。对行进行批处理，仅当缓冲了 >>1000 行时才执行批量插入。

我什至不认为这里需要生产者/消费者。它确实可以通过将生产与消耗进行管道化来提高性能，但它也引入了更复杂的线程。如果你想走这条路，你可能应该给IEnumerable<SqlDataRecord> to the SqlBulkCopy类直接将已生成的所有行流式传输到其中，无需中间缓冲。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在连接之间共享事务的相关文章

如何在进入新活动之前终止线程和处理程序

大家好在我尝试清理处理程序时这段代码可能有点混乱因为我一直在尝试追踪崩溃发生的位置我有一个对话框活动显示密码输入进度条由线程和处理程序动画显示似乎当我试图查看进度条是否完成并尝试终止线程时当我尝试进入新活动时我这样做的方式
为什么大多数 C 开发人员使用 Define 而不是 const？ [复制]

这个问题在这里已经有答案了在许多程序中 define与常量具有相同的用途例如 define FIELD WIDTH 10 const int fieldWidth 10 我通常认为第一种形式优于另一种形式它依赖于预处理器来处理基本上是
32 位应用程序的特征最大矩阵大小

所以我正在寻找Eigen http eigen tuxfamily org index php title Main Page当我尝试声明大于 10000x10000 的矩阵时包崩溃我需要声明一个像这样的矩阵可靠地大约有 13000
POCO HTTPSClientSession 发送请求时遇到问题 - 证书验证失败

我正在尝试使用 POCO 库编写一个向服务器发出 HTTPS 请求的程序出于测试目的我正在连接到具有自签名证书的服务器并且我希望允许客户端进行连接为了允许这种情况发生我尝试安装InvalidCertificateHandler这是
当前的 c++ 工作草案与当前标准有何不同

通过搜索该标准的 PDF 版本我最终找到了这个链接C 标准措辞草案 http www open std org jtc1 sc22 wg21 docs papers 2012 n3376 pdf从 2011 年开始我意识到我可以购买最终
如何从网站下载 .EXE 文件？

我正在编写一个应用程序需要从网站下载 exe 文件我正在使用 Visual Studio Express 2008 我正在使用以下代码 private void button1 Click object sender EventArgs
C 语言中 =+（等于加）是什么意思？

我碰到与标准相反今天在一些 C 代码中我不太确定这里发生了什么我在文档中也找不到它 In ancientC 版本相当于它的残余物与最早的恐龙骨头一起被发现例如 B 引入了广义赋值运算符使用x y to add y to x
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
如何重置捕获像素的值

我正在尝试创建一个 C 函数该函数返回屏幕截图位图中每四个像素的 R G 和 B 值这是我的代码的一部分 for int ix 4 ix lt 1366 ix ix 4 x x 4 for int iy 3 iy lt 768 iy i
为什么我不应该对不是由 malloc() 分配的变量调用 free() ？

我在某处读到使用它是灾难性的free删除不是通过调用创建的对象malloc 这是真的为什么这是未定义的行为永远不要尝试它让我们看看当您尝试时会发生什么free 自动变量堆管理器必须推断出如何获取内存块的所有权为此它要么必须使
是否有一种更简单的方法可以并行运行命令，同时在 Windows PowerShell 中保持高效？

此自我回答旨在为那些受困于 Windows PowerShell 并由于公司政策等原因而无法安装模块的用户提供一种简单且高效的并行替代方案在 Windows PowerShell 中 built in可用的替代方案local并行调用是St
尚未处理时调用 Form 的 Invoke 时出现 ObjectDisposeException

我们得到一个ObjectDisposedException从一个电话到Invoke在尚未处理的表格上这是一些演示该问题的示例代码 public partial class Form2 Form void Form2 Load object
g++ 对于看似不相关的变量“警告：迭代...调用未定义的行为”

考虑以下代码strange cpp include
有没有一种简单的方法可以让 Visual Studio 2015 使用特定的 ToolsVersion？

使用特定版本构建项目或解决方案时msbuild我可以使用以下命令选择早期的 net 工具链 toolsversion or tv switch C Program Files x86 MSBuild 14 0 bin msbuild tv
当前的 x86 架构是否支持非临时加载（来自“正常”内存）？

我知道有关此主题的多个问题但是我没有看到任何明确的答案或任何基准测量因此我创建了一个处理两个整数数组的简单程序第一个数组a非常大 64 MB 第二个数组b很小无法放入 L1 缓存程序迭代a并将其元素添加到相应的元素中b在模块化
为什么拆箱枚举会产生奇怪的结果？

考虑以下 Object box 5 int int int box int 5 int nullableInt box as int nullableInt 5 StringComparison enum StringComparison
什么是 __declspec 以及何时需要使用它？

我见过这样的例子 declspec在我正在阅读的代码中它是什么我什么时候需要使用这个构造这是 Microsoft 对 C 语言的特定扩展它允许您使用存储类信息来赋予类型或函数属性文档 declspec C https learn
Googletest：如何异步运行测试？

考虑到一个包含数千个测试的大型项目其中一些测试需要几分钟才能完成如果按顺序执行整套测试需要一个多小时才能完成通过并行执行测试可以减少测试时间据我所知没有办法直接从 googletest mock 做到这一点就像 async选项
实例化 Microsoft.Office.Interop.Excel.Application 对象时出现错误：800700c1

实例化 Microsoft Office Interop Excel Application 以从 winforms 应用程序生成 Excel 时出现以下错误这之前是有效的但突然间它停止工作了尽管代码和 Excel 版本没有变化我
使用 Crypto++ 获取 ECDSA 签名

我必须使用 Crypto 在变量中获取 ECDSA 签名我在启动 SignMessage 后尝试获取它但签名为空我怎样才能得到它你看过 Crypto wiki 吗上面有很多东西椭圆曲线数字签名算法 http www cryptop

随机推荐

如何将 valgrind 与 Python C++ 扩展一起使用？

我在 C 类上实现了 Python 扩展我没有用于运行 valgrind 的 C 目标我想使用 valgrind 进行内存检查我可以将 valgrind 与 Python 一起使用吗是的您可以使用valgrind使用Python
viewDidUnload 中有效的内容应该移至 didReceiveMemoryWarning 吗？

在新的 iOS 6 中 viewDidUnload已弃用我们已被指示使用didReceiveMemoryWarning相反管理 UIViewController 实例和子类中的对象将 nils 分配给内部的 UIView 类型是否同样
Angular AOT 组件中的相对路径

我在这里问是因为我在网上找不到完整的文档这个例子here https angular io docs ts latest cookbook aot compiler html太简单了我有一个包含多个组件和一些模块的应用程序用ngc编译
在 IIS 5.1 (Windows XP) 上部署 ASP.NET MVC

好吧部署 ASP NET MVC 似乎很痛苦我想在 Windows XP IIS 5 1 上部署 ASP NET MVC 应用程序但似乎找不到如何执行此操作当我在网络浏览器地址栏中输入应用程序名称时我收到一条网站不可用消息有
ES6数组初始化

ES6 非常新在 ES5 中我可能会做这样的事情 function newArray var data for var i 0 i lt 5 i data i test data i return data x newArray 在 ES
Tensorflow 中的反向传播（随时间）代码

在哪里可以找到 Tensorflow python API 中的反向传播通过时间代码或者使用其他算法例如当我创建 LSTM 网络时 TensorFlow 中的所有反向传播都是通过自动区分网络前向传递中的操作并添加显式操作来计算网
在 Android 版 PhoneGap 上捕获返回按键

我正在使用 PhoneGap 进行 Android 应用程序开发但我一直在捕获设备上的后退键按下我尝试了其他线程和官方维基页面中的所有内容但似乎都不起作用我可以使用 keyEvent menuTrigger 和 keyEvent s
如何以编程方式读取 PDF 书签

我正在使用 PDF 转换器来访问 PDF 中的图形数据一切工作正常除了我没有得到书签列表是否有可以读取 PDF 书签的命令行应用程序或 C 组件我找到了 iText 和 SharpPDF 库目前正在浏览它们你曾经做过这样的事吗
是否可以使用 stdout 作为 fluidd 源来捕获特定日志以写入elasticsearch？

我对 fluidd 和 elasticsearch 都是菜鸟我想知道 fluidd 是否可以从 stdout 捕获特定日志在本例中为我们的应用程序生成的自定义审核日志使用 stdout 作为源并将它们写入到elasticsearch
合并两个具有相同键的字典

我有以下 2 本字典想要合并我想合并相同的键并且我想保留两个字典的值我用了dict1 update dict2 但这替换了第二个到第一个字典中的值 u dict1 160 u na u na 162 u test u qq u wds
Kitkat (API 19) 中使用 setGroup() 的堆栈通知不起作用

我有一个问题找不到答案我已经尝试过 AndroidDeveloper 教程我已经在 stackoverflow 和 google 上进行了搜索但要么我的搜索技能太棒了要么没有答案我认为可以回答我的问题当有多条消息时我想将所有新
当计时器触发作业时，如何在 Jenkins 中获取 BUILD_USER？

我想在工作后电子邮件中向触发 Jenkins 工作的用户显示这可以通过使用插件来实现构建用户变量插件和环境变量BUILD USER 但是当调度程序触发作业时该变量不会被初始化我们怎样才能做到这一点我知道我们有一个名为 EnvInje
如何使用opengl函数在c中制作用于绘制3D点的3D窗口？

我可以制作 2D 窗口并绘制点线等我想制作 3D 窗口以便可以通过绘制 3D 点线来绘制 3D 对象例如 glVertex3d x y z 如 2D glVertex2d x y 但我无法制作 3D 窗口我只想制作一个 3D 窗
String.indexOf 函数出现意外结果？

我真的对这个感到抓狂情况是这样的我有两个 JavaScript 字符串如下所示 dsName Test 1 replacementString Test 我正在尝试查看 dsName 是否以 replacementString 开头
防止在线棋牌游戏作弊？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案在许多在线国际象棋大厅中我见过引擎的实例其中作弊者会在主游戏窗口的同时打开国际象棋程序然后他会进行设置以便将对手的动作传送
使用正则表达式的 jQuery 验证插件自定义方法

我需要为 jQuery Validator 创建一个新方法但不知道从哪里开始我希望它检查输入的电子邮件是否包括 specifieddomain com 但这也是输入的最后一部分例如 specificdomain comChris 就不
ISO 8601 格式的当前时间

出于记录目的 R 脚本如何获取 UTC 时区中的当前日期和时间作为以下格式的 ISO 8601 字符串 2015 12 31T14 26 56 600374 00 00 as POSIXlt似乎是解决方案并且文档声称它接受格式参数但我
访问 SQL 创建一对多关系，无需强制引用完整性

我有这个关系我必须暂时销毁它才能使用 SQL 命令更改 salID 字段的大小 ALTER TABLE Adressen DROP CONSTRAINT ChildTableMainTable 如何使用 SQL 命令重新创建相同的关系类型
如何快速验证区分大小写的文件名是否确实存在

我必须制作一个与unix兼容的windows delphi例程以确认文件系统中是否存在文件名与想要的完全相同的情况例如 John txt 在那里而不是 john txt 如果我检查 FileExists john txt 由于 win
在连接之间共享事务

我有一个 FileShare 爬虫获取权限并将其放在某处以供以后审核目前它正在启动多个线程来抓取同一文件夹以加快进程在 C 中每个SqlConnection对象有自己的SqlTransaction 由SqlConnection

在连接之间共享事务

在连接之间共享事务 的相关文章

随机推荐

热门标签

在连接之间共享事务的相关文章