TPL 数据流与普通信号量

2024-01-27

我需要制定一个可扩展的流程。该进程主要有 I/O 操作和一些次要的 CPU 操作（主要是反序列化字符串）。该流程在数据库中查询 url 列表，然后从这些 url 中获取数据，将下载的数据反序列化为对象，然后将部分数据保存到 crm 动态以及另一个数据库中。之后我需要更新第一个处理 url 的数据库。部分要求是使并行度可配置。

最初，我想通过一系列带有等待的任务来实现它，并使用信号量限制并行性 - 非常简单。然后我读了 @Stephen Cleary 的一些帖子和答案，其中建议使用 TPL Dataflow，我认为它可能是一个很好的候选者。然而，我想确保我通过使用数据流来“复杂化”代码是为了一个有价值的事业。我还得到了使用的建议ForEachAsync 扩展方法 https://blogs.msdn.microsoft.com/pfxteam/2012/03/05/implementing-a-simple-foreachasync-part-2/这也很容易使用，但是我不确定它是否会因为它对集合进行分区的方式而导致内存开销。

对于这种情况，TPL Dataflow 是一个不错的选择吗？它比 Semaphore 或 ForEachAsync 方法更好 - 如果我通过 TPL DataFlow 实现它而不是其他每个选项（Semaphore/ForEachASync），我实际上会获得什么好处？

该进程主要有IO操作和一些次要的CPU操作（主要是反序列化字符串）。

这几乎只是 I/O。除非那些字符串是huge，反序列化不值得并行化。您正在执行的 CPU 工作类型将被淹没在噪音中。

因此，您需要关注并发异步。

SemaphoreSlim正如您所发现的，这是标准模式。
TPL Dataflow 还可以实现并发（异步和并行形式）。

ForEachAsync可以采取多种形式；请注意，在博客文章 https://blogs.msdn.microsoft.com/pfxteam/2012/03/05/implementing-a-simple-foreachasync-part-2/你提到的，有5该方法有不同的实现，每种实现都是有效的。 “迭代可能有许多不同的语义，每种语义都会导致不同的设计选择和实现。”出于您的目的（不希望 CPU 并行化），您不应该考虑使用Task.Run或分区。在异步并发世界中，任何ForEachAsync实现只是隐藏它实现的语义的语法糖，这就是我倾向于避免它的原因。

这给你留下了SemaphoreSlim vs. ActionBlock。我通常建议人们从SemaphoreSlim首先，如果他们的需求变得更加复杂（他们似乎会从数据流管道中受益），请考虑转向 TPL 数据流。

例如，“部分要求是使并行度可配置。”

您可以从允许一定程度的并发开始 - 被限制的事物是单个整体操作（从 url 获取数据、将下载的数据反序列化为对象、持久保存到 crm 动态和另一个数据库中，以及更新第一个数据库）。这是哪里SemaphoreSlim将是一个完美的解决方案。

但是您可能决定要拥有多个旋钮：例如，一个用于下载 URL 数量的并发度，一个用于持久化的单独并发度，以及一个用于更新原始数据库的单独并发度。然后，您还需要限制这些点之间的“队列”：内存中只有这么多反序列化对象等 - 以确保具有慢速数据库的快速 url 不会导致您的应用程序使用过多的问题记忆。如果这些是有用的语义，那么您已经开始从数据流的角度来处理问题，这就是您可能会更好地使用像 TPL Dataflow 这样的库的服务。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TPL 数据流与普通信号量的相关文章

实体框架：ObjectSet 及其（泛型）方差

我使用 EntityFramework POCO 事情是这样的 public interface IBaseType int Id get set public class BaseType IBaseType public virtual
Monitor.TryEnter(object) 和 Monitor.TryEnter(object, ref bool) 之间存在什么重要区别？

这些代码片段的行为似乎应该相同 1 Monitor TryEnter 对象 if Monitor TryEnter lockObject try DoSomething finally Monitor Exit lockObject 2 M
SQL Server批量上传策略

我使用以下函数将数据从 CSV 上传到 SQL 表有更好的方法吗我现在担心连接长时间保持因此需要减少 public bool SaveProxyBulkUploadData List
堆内存问题

有一个 WCF 自托管服务必须在 99 的时间内正常工作有时我们会遇到这样的记忆问题但问题发生后服务一切正常我们该如何处理这个问题任何关于提供能够在不同情况下生存的强大服务的提示和要点都非常受欢迎我不太确定问题出在哪里但内存泄
ODP.NET 可以重新分发吗？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Oracle ODP NET 库是否可重新分发例如我是否可以简单地将 Oracle DataAccess dll 包含在我的应用程序中
C# 组件事件？

我正在尝试编写一个将公开事件的 C 组件该组件将由非托管 C 应用程序导入根据一些教程我想出了这段代码针对 C 端 namespace COMTest ComVisible true Guid 02271CDF BDB9 4cfe
String.Format - 它如何工作以及如何实现自定义格式字符串

With String Format 例如可以格式化DateTime对象以许多不同的方式每次我寻找所需的格式时我都需要在互联网上搜索我几乎总能找到一个可以使用的例子例如 String Format 0 MM dd yyyy Date
如何将当前用户信息传递到 DDD 中的所有层

类似的问题以前曾被问过但不完全相同除非我错过了我想通过我的服务域域事件域事件处理程序传递 IUserInfo 类实例什么是最好的方法我是不是该通过注册使用 IoC 注入它针对 Httpcontext Current se
如何使 sgen.exe 保留程序集的版本？

我想为我的程序集创建一个序列化程序集 sgen做得很好但我不知道如何让它为序列化程序集分配与源程序集相同的版本有任何想法吗 sgen似乎默认采用源程序集版本这是相当合理的这是我的运行方式没有什么特别的 PathToSDK Micr
对象 xml 反序列化问题？

我的对象具有父子关系每个子对象都有一个Parent指向其容器的属性当这个对象在应用程序中创建时它就被设置了因此没有问题此 Parent 属性标记有 XmlIgnore 属性因为它需要设置为其运行时父实例那么在对象反序列化后初
运行 C# exe 文件

复制为什么我的 NET 应用程序在从网络驱动器运行时会崩溃 https stackoverflow com questions 148879 why does my net application crash when run from
调试WCF时无法自动单步进入服务器

我得到了可怕的无法自动进入服务器无法调试远程过程这通常表明服务器上尚未启用调试现在我一直在读我需要添加
西班牙语单词的正则表达式是什么？

正则表达式语言使用 B 来包含 A Z a z 0 9 和并且 b 被定义为单词边界如何编写匹配所有有效西班牙语单词包括诸如等字符的正则表达式我正在使用 NET 使用西班牙语区域设置并使您的正则表达式区域设置敏感
如何将外部程序集的类型添加到工具箱控件？（WPF）

我正在尝试在我的 WPF 应用程序中执行类似的操作 ToolboxControl ctrl new ToolboxControl Assembly assembly Assembly LoadFile file var category n
使用 C# .NET 从操纵杆获取输入

我在谷歌上搜索了这个但我想到的唯一的东西已经过时并且不起作用有人知道如何使用 C NET 获取操纵杆数据吗由于这是我在研究 C 中的操纵杆游戏手柄输入时在 google 上获得的最高点击次数因此我认为我应该发布一个回复供其他人查看
在 foreach 循环中启动一个新线程

我有一个对象列表我想循环该列表并启动一个新线程传入当前对象我写了一个我认为应该这样做的例子但它不起作用具体来说线程似乎在每次迭代中都被覆盖但这对我来说并没有什么意义因为我每次都会创建一个新的 Thread 对象这是我写的测
如何在公共交通中记录失败的消息？

我正在寻找一个好的解决方案来在超出重试限制后立即记录失败消息而无需处理错误队列到目前为止我发现了什么我可以继承InMemory入站消息跟踪器并覆盖是否超出重试限制但此时除了 id 之外没有关于消息本身的信息我可以实施IInbou
通过 TCP/.NET SSLStream 发送文件很慢/无法正常工作

我正在编写一个与 SSL 配合使用的服务器客户端应用程序通过SSLStream 它必须做很多事情不仅仅是文件接收发送目前它的工作原理是只有一个连接我总是使用从客户端服务器发送数据SSLStream WriteLine 并使
.NET：EventHandler 竞争条件修复如何工作？

以下模式用于在引发事件时避免竞争条件以防另一个线程取消订阅 MyEvent 使其为空 class MyClass public event EventHandler MyEvent public void F EventHandler h
从 DataGridColumn 中绑定到 DataContext 属性

财产Foo在我的DataContext ViewModel Visibility Foo 但我不知道如何访问Foo里面一个Column 在这种情况下我认为它可能正在寻找Foo在任何绑定到的对象中DataGrid ItemsSource

随机推荐

knitr kable：RNW 的 PDF 中的文本颜色为灰色

当我使用创建表时knitr kableRNW 文件中的函数 PDF 中表格项目的文本颜色显示为灰色我想把它改成黑色我怎样才能做到这一点 documentclass article begin document lt lt gt gt k
“and”如何与奇数和偶数相关？在JS中

我的任务是弄清楚如何确定奇数和偶数我无法使用我使用是因为我在互联网上找到了它但我找不到适合它工作方式的方法 N A 我创建的样本是 if 22 1 0 return true else return false 返回真按位运算符的
动态嵌套 React.js 组件

我想创建一个灵活动态可以使用 React js 呈现的 JSX 表单格式此格式必须包含嵌套组一个组可以包含其他组以及问题 var Group React createClass render function return field
如何从 Datareader 获取多行

这是我的代码它工作正常但只返回一行正如您在 SQL 语句中看到的我需要在表单中使用的数据网格中返回 2 行虽然该过程读取 2 行但它只显示一行 NameAddrmark 是字段的构造函数 public NameAddrmark
向用户发送激活电子邮件

我该如何检查电子邮件是否确实存在无法理解明星如何发送带有唯一链接的邮件用户单击该链接以验证他是电子邮件的所有者创建 2 个名为激活密钥的新列并激活并存储一些随机字符串发送包含激活密钥的电子邮件并更新与该激活链接匹配的用户已激活
在特定时间和日期调用 iOS 应用程序

我希望我的 iOS 应用程序能够准确无误地知道特定日期和时间何时到达现在这个时间可能是几天几周几个月我的应用程序可能处于 backgorund 或终止状态所以有以下几种选择 A 本地通知但当我的应用程序处于后台时它不会通知 b
Chrome 中的 CSS 动画棘手错误

我有以下 CSS webkit keyframes fade out from opacity 1 to opacity 0 webkit keyframes fade in from opacity 0 to opacity 1 intr
如何避免Core Motion控制的SceneKit相机滚动？

我正在将 SceneKit 相机设置为当前CMDeviceMotion使用的态度CMDeviceMotion 扩展 https gist github com travisnewby 96ee1ac2bc2002f1d480在此描述的ans
Google Analytics 报告大量 Internet Explorer 7 流量

对于我们的网站 Google Analytics 报告的 Internet Explorer 7 用户数量过高 40 当我们进一步深入研究数据时我们发现大部分 IE7 点击量都来自 Windows 7 等较新的操作系统而 IE7 从来都
带有生成列的 PostgreSQL 查询

我有一个如下所示的架构我想运行一个查询在输出中为每一行获取一列points table 所以对于每个usage我想乘以行amount使用次数的amount对于引用的points id 然后总结并按人分组因此对于示例数据我希望输出如
如何在 Gluon Mobile 中将 RoboVM 编译器版本更改为 2.3.10-SNAPSHOT

我在 iPadOS 13 3 上运行 JavaFX Gluon 移动应用程序时遇到问题实际上这里描述了类似的问题 Gluon 示例应用程序在 iOS 设备上失败 https stackoverflow com questions 5938
python 从列表中选择特定元素

是否有一种 Pythonic 方法可以从列表中仅获取某些值类似于此 perl 代码 my one four ten line split 1 4 10 使用列表理解 line 0 1 2 3 4 5 6 7 8 9 10 lst line
dataTables - 无法获得水平滚动和固定列来完成其工作。似乎到处渲染都不同。我究竟做错了什么？

我花了几个小时试图解决这个问题我需要制作一张与此链接中显示的表格几乎相同的表格 https datatables net extensions fixedcolumns https datatables net extensions fi
无法在嵌入消息的标题中标记成员discord.py

我的不和谐机器人应该在包含 GIF 的嵌入中标记人员我使用以下代码来提及 embed discord Embed title f member mention I m sorry 但是我没有标记成员而是获取 ID 截屏 https i
通过理解避免将重复项插入到 Python 列表中

我有一本字典 XY dict 1 12 55 13 55 2 14 55 15 57 3 14 55 15 58 4 14 55 16 55 我想找出哪些键具有唯一的值元组不存在于任何其他键的值中从示例字典中键 1 是唯一的因为两者
非阻塞套接字上的 select()、recv() 和 EWOULDBLOCK

我想知道下面的场景是不是真实的非阻塞 TCP 套接字上的 select RD 表示套接字已准备好尽管调用了 select 但后面的 recv 仍将返回 EWOULDBLOCK For recv 你会得到EAGAIN而不是EWOULDBL
IE11 上的 Flexbox：图像无故拉伸？

我在 IE11 上遇到了 Flexbox 问题虽然我知道有很多已知问题但我一直无法找到解决方案 div class latest posts div
使用 OpenGL，结果取决于安装的硬件或驱动程序吗？

我按照此处的说明使用 OpenGL 遮挡进行渲染 https developer download nvidia com books HTML gpugems gpugems ch29 html https developer downlo
导航器只能包含“Screen”、“Group”或“React.Fragment”作为其直接子级
TPL 数据流与普通信号量

我需要制定一个可扩展的流程该进程主要有 I O 操作和一些次要的 CPU 操作主要是反序列化字符串该流程在数据库中查询 url 列表然后从这些 url 中获取数据将下载的数据反序列化为对象然后将部分数据保存到 crm 动态以及另

TPL 数据流与普通信号量

TPL 数据流与普通信号量 的相关文章

随机推荐

热门标签

TPL 数据流与普通信号量的相关文章