并行框架和避免错误共享

2024-04-27

最近，我回答了一个关于优化可能的并行方法来生成任意基数的每个排列的问题。我发布了类似的答案并行化，实施不佳代码块列表，有人几乎立即指出了这一点：

这几乎肯定会给你带来错误的共享，并且可能会慢很多倍。（归功于gjvdkamp https://stackoverflow.com/users/65747/gjvdkamp)

他们是对的，那就是death慢的。也就是说，我研究了这个话题，发现了一些有趣的材料和建议 http://download.microsoft.com/download/3/a/7/3a7fa450-1f33-41f7-9e6d-3aa95b5a6aea/MSDNMagazine2008_10en-us.chm（仅存档 MSDN 杂志，.NET 问题：错误共享）来对抗它。如果我理解正确的话，当线程访问连续内存时（也就是说，可能支持该内存的数组）ConcurrentStack），可能会出现虚假共享。

对于水平线下方的代码，aBytes is:

struct Bytes {
  public byte A; public byte B; public byte C; public byte D;
  public byte E; public byte F; public byte G; public byte H;
}

对于我自己的测试，我希望获得此运行的并行版本并且真正更快，因此我根据原始代码创建了一个简单的示例。6 as limits[0]对我来说这是一个懒惰的选择——我的电脑有 6 个核心。

单线程块 平均运行时间：10s0059ms

  var data = new List<Bytes>();
  var limits = new byte[] { 6, 16, 16, 16, 32, 8, 8, 8 };

  for (byte a = 0; a < limits[0]; a++)
  for (byte b = 0; b < limits[1]; b++)
  for (byte c = 0; c < limits[2]; c++)
  for (byte d = 0; d < limits[3]; d++)
  for (byte e = 0; e < limits[4]; e++)
  for (byte f = 0; f < limits[5]; f++)
  for (byte g = 0; g < limits[6]; g++)
  for (byte h = 0; h < limits[7]; h++)
    data.Add(new Bytes {
      A = a, B = b, C = c, D = d, 
      E = e, F = f, G = g, H = h
    });

并行化，实施不佳 平均运行时间：81s729ms，约 8700 次争用

  var data = new ConcurrentStack<Bytes>();
  var limits = new byte[] { 6, 16, 16, 16, 32, 8, 8, 8 };

  Parallel.For(0, limits[0], (a) => {
    for (byte b = 0; b < limits[1]; b++)
    for (byte c = 0; c < limits[2]; c++)
    for (byte d = 0; d < limits[3]; d++)
    for (byte e = 0; e < limits[4]; e++)
    for (byte f = 0; f < limits[5]; f++)
    for (byte g = 0; g < limits[6]; g++)
    for (byte h = 0; h < limits[7]; h++)
      data.Push(new Bytes {
        A = (byte)a,B = b,C = c,D = d,
        E = e,F = f,G = g,H = h
      });
  });

并行化，??执行 平均运行时间：5s833ms，92 次争用

  var data = new ConcurrentStack<List<Bytes>>();
  var limits = new byte[] { 6, 16, 16, 16, 32, 8, 8, 8 };

  Parallel.For (0, limits[0], () => new List<Bytes>(), 
    (a, loop, localList) => { 
      for (byte b = 0; b < limits[1]; b++)
      for (byte c = 0; c < limits[2]; c++)
      for (byte d = 0; d < limits[3]; d++)
      for (byte e = 0; e < limits[4]; e++)
      for (byte f = 0; f < limits[5]; f++)
      for (byte g = 0; g < limits[6]; g++)
      for (byte h = 0; h < limits[7]; h++)
        localList.Add(new Bytes {
          A = (byte)a, B = b, C = c, D = d,
          E = e, F = f, G = g, H = h
        });
      return localList;
  }, x => {
    data.Push(x);
  });

我很高兴我得到了一个比单线程版本更快的实现。我预计结果接近 10 秒/6 左右，即 1.6 秒左右，但这可能是一个天真的期望。

我的问题是对于实际上比单线程版本更快的并行实现，是否可以对操作应用进一步的优化？我想知道与并行化相关的优化，而不是用于计算值的算法的改进。具体来说：

我知道存储和填充的优化struct代替byte[]，但它与并行化无关（或者是吗？）
我知道所需的值可以使用纹波进位加法器进行延迟计算，但与struct优化。

首先，我最初的假设是Parallel.For() and Parallel.ForEach()错了。

糟糕的并行实现很可能有 6 个线程都试图写入单个线程CouncurrentStack()立刻。使用线程局部变量（下面将详细解释）的良好实现每个任务仅访问共享变量一次，几乎消除了任何争用。

使用时Parallel.For() and Parallel.ForEach(), you cannot只需在线替换for or foreach和他们一起循环。这并不是说它不能是盲目的改进，但如果不检查问题并对其进行检测，使用它们就会在问题上投入多线程，因为它可能会使问题变得更快。

**Parallel.For() and Parallel.ForEach()具有重载，允许您为Task他们最终在每次迭代执行之前和之后创建并运行一个表达式。

如果您有一个并行操作Parallel.For() or Parallel.ForEach()，使用此重载可能是个好主意：

public static ParallelLoopResult For<TLocal>(
    int fromInclusive,
    int toExclusive,
    Func<TLocal> localInit,
    Func<int, ParallelLoopState, TLocal, TLocal> body,
    Action<TLocal> localFinally
)

例如，调用For()将 1 到 100 之间的所有整数相加，

var total = 0;

Parallel.For(0, 101, () => 0,  // <-- localInit
(i, state, localTotal) => { // <-- body
  localTotal += i;
  return localTotal;
}, localTotal => { <-- localFinally
  Interlocked.Add(ref total, localTotal);
});

Console.WriteLine(total);

localInit应该是一个初始化本地状态类型的 lambda，该类型被传递给body and localFinally拉姆达。请注意，我不建议使用并行化来实现 1 到 100 的求和，而只是举一个简单的示例来简化示例。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

并行框架和避免错误共享的相关文章

在 C/C++ 中获得正模数的最快方法

通常在我的内部循环中我需要以环绕方式索引数组因此例如如果数组大小为 100 并且我的代码要求元素 2 则应该给它元素 98 高级语言例如 Python 可以简单地使用my array index array size 但由于某
有没有快速创建集合的方法？

目前我正在创建一个像这样的新集 std set a s s insert a1 s insert a2 s insert a3 s insert a10 有没有办法创建s在一行 int myints 10 20 30 40 50 std s
FileStream 构造函数和默认缓冲区大小

我们有一个使用 NET 4 用 C 编写的日志记录类我想添加一个构造函数参数该参数可以选择设置文件选项 WriteThrough http msdn microsoft com en us library system io fileo
ASP.NET Web API 客户端 ProgressMessageHandler Post 任务卡在 WinForm 应用程序中

我在用着HttpClient and ProgressMessageHandler来自MS ASP NET Web API 客户端库 http nuget org packages Microsoft AspNet WebApi Clien
防止 boost::asio::io_context 在空轮询调用时停止

此代码调用发布的句柄 boost asio io context ioc boost asio post ioc std cout lt lt lol lt lt std endl ioc poll 而这并没有 boost asio io
找不到 assimp-vc140-mt.dll ASSIMP

我已经从以下位置下载了 Assimp 项目http assimp sourceforge net main downloads html http assimp sourceforge net main downloads html Ass
时间：2019-03-17 标签：c#ThreadSafeDeepCopy

我一直在阅读很多其他问题以及大量谷歌搜索但我一直无法找到明确的解决方案根据我读过的一些最佳实践类的静态方法应该创建线程安全的并且实例成员应该将线程安全留给消费者我想为该类实现深度复制方法该类本身还有其他引用类型成员有没有什么方
动态生成的控件 ID 返回为 NULL

我可以在 Page PreInit 函数中创建动态控件如何检索控件及其 ID 我的 C 代码用于创建动态控件之一 var btn new WebForms Button btn Text btn ID Addmore btn Click
fprintf() 线程安全吗？

我正在为野人就餐问题的某些变量编写一个 C 解决方案现在我创建线程每个线程都将 FILE 获取到同一个调试文件在线程内我正在使用 fprintf 进行一些打印打印的语句不受任何类型的互斥锁等保护我没有在调试文件中观察到任何交错行
vs2008 c#：Facebook.rest.api如何使用它来获取好友列表？

如何在此基础上取得进一步的进步获取好友列表的下一步是什么 string APIKey ConfigurationManager AppSettings API Key string APISecret ConfigurationManag
如何获取 QTableView 的标题列表？

我有一个QTableView我的对话框中的对象我需要访问该表的水平标题并将它们放入QStringList object 尽管进行了大量搜索但我在 Qt 文档中找不到如何获取此标头列表编辑我发现的最接近的地方是this https w
单例模式和 std::unique_ptr

std unique ptr唯一地控制它指向的对象因此不使用引用计数单例确保利用引用计数只能创建一个对象那么会std unique ptr与单例执行相同单例确保只有一个实例属于一种类型 A unique ptr确保只有一个智能指针到
如何通过 JsonConvert.DeserializeObject 在动态 JSON 中使用 null 条件运算符

我正在使用 Newtonsoft 反序列化已知的 JSON 对象并从中检索一些值如果存在关键在于对象结构可能会不断变化因此我使用动态来遍历结构并检索值由于对象结构不断变化我使用 null 条件运算符来遍历 JSON 代码看起来像这
每个租户的唯一用户名和电子邮件

我正在使用以下代码编写多租户应用程序ASP NET Core 2 1 我想覆盖默认的与用户创建相关的验证机制目前我无法创建多个具有相同的用户UserName My ApplicationUser模型有一个名为TenantID 我想要实现的
ASP.NET MailMessage.BodyEncoding 和 MailMessage.SubjectEncoding 默认值

很简单的问题但我在 MSDN 上找不到答案查找 ASP NET 将用于的默认值 MailMessage BodyEncoding and MailMessage SubjectEncoding 如果你不在代码中设置它们 Thanks F
在 EnvDTE 中调试时捕获 VS 局部变量

是否可以使用 EnvDTE 进行 vsix Visual Studio 扩展来捕获本地和调试窗口使用的调试数据或者可以通过其他方法吗我想创建一个自定义的本地窗口我们可以修改它以根据需要显示一些较重的内容而无需为高级用户牺牲原始的本地
IEnumerable.Except 不起作用，那么我该怎么办？

我有一个 linq to sql 数据库非常简单我们有 3 个表项目和用户有一个名为 User Projects 的连接表将它们连接在一起我已经有了一个获得的工作方法IEnumberable
QFileDialog::getSaveFileName 和默认的 selectedFilter

我有 getSaveFileName 和一些过滤器我希望当用户打开保存对话框时选择其中之一 Qt 文档说明如下可以通过将 selectedFilter 设置为所需的值来选择默认过滤器我尝试以下变体 QString selFilte
使我的 COM 程序集调用异步

我刚刚赢得了在当前工作中维护用 C 编码的遗留库的特权这个dll 公开使用 Uniface 构建的大型遗留系统的方法除了调用 COM 对象之外别无选择充当此遗留系统与另一个系统的 API 之间的链接在某些情况下使用 WinFo
ASP.NET Core MVC 视图组件搜索路径

在此处的文档中 https learn microsoft com en us aspnet core mvc views view components view aspnetcore 2 2 https learn microsoft

随机推荐

设置快捷方式以替换 VIM 中轻松选择的字符串

我有很多 php html 文件其中包含许多应该使用 gettext 国际化的字符串因此我必须遍历每个文件找到消息字符串并将每个字符串替换为 I use vim and would like to setup a shortcu
单击 libGDX 中的 Actor

我的游戏中有一个覆盖层其中包含屏幕图像和屏幕上的一组按钮截屏 My Screen有一个Stage The Stage有一组Group对象我将其视为图层第一组具有背景中间的组具有游戏元素最前面的组具有屏幕覆盖覆盖层由一个Im
如何找出 Kubernetes 中可用的端口？

我想在 kubernetes 集群中的不同端口上运行多个服务并且想知道如何检查哪些端口可用并且不会与我的服务产生任何冲突我还想知道每个端口上的服务名称以便我可以更好地理解我的配置有类似的问题涉及验证哪个NodePorts已经在使用中
Rails 4 中的“find_all_by_id”相当于什么

我有一个 id 数组我想使用活动记录查询从数据库中查找它们各自的记录例如 ids 2 3 1 现在对于我来说要查找 id 是数组中的其中之一的特定模型的所有记录在较低版本的 Rails 中我想我可以执行以下操作 Model fi
使用滚动视图通过 Swift 放大图像

我正在从 Apple 的 Swift 应用程序开发中学习 Swift 我遇到了约束问题特别是在第 593 页的 I Spy 实验室它基本上希望您创建一个滚动视图其中包含图像视图并使其可以放大图像并滚动它例如当您打开照片时在照
通过调用 shell 脚本设置 ant 属性？

有没有办法通过捕获 shellscript 的输出来设置 ant 属性或另一个蚂蚁任务像这样的事情
宏扩展忽略了 MSVC 中的一些标记

我在 msvc 编译器中遇到宏扩展问题我希望将以下代码扩展为F x 它在 gcc 和 clang 上执行但 msvc 将其扩展为F忽略x令牌这里发生了什么 define S s s define F define M S S F x
如何在文本文件中找到最长的 N 行并将其打印到标准输出？

第一行包含数字 N 的值后跟多行我可以按照n 2算法的顺序解决它有人可以建议一个更好的吗您可以使用最小堆并在 O n log N 中完成 heap new Min Heap N foreach line in text if len
如何将字节数组转换为任何类型

好的我看到有人问如何将字节数组转换为int string Stream等等答案各不相同我个人还没有找到任何令人满意的答案这里有一些我们想要将字节数组转换成的类型 UnityEngine Font可以吸收ttf data UnityE
Google Inceptionism：按类别获取图像

在著名的 Google Inceptionism 文章中 http googleresearch blogspot jp 2015 06 inceptionism going deeper into neural html http goo
将另一个类添加到 div

我有一个函数可以检查表单提交的年龄然后根据年龄在 div 中返回新内容现在我只是使用 getElementById 来替换 HTML 内容但我认为如果我也可以向 div 添加一个类那对我来说会更好例如我有 if under cer
SceneKit 绘制曲线

我想用 SceneKit 画一条贝塞尔曲线并认为这可行 func drawCurvedLine let scene SCNScene let scnView self view as SCNView scnView scene scene
共享对象发送方法

在 FMS 中我想使用共享对象在聊天应用程序中发送消息因为它是实时的我的问题是如何使用共享对象在实时聊天应用程序中向用户来回发送消息这需要服务器端脚本客户端还是两者都需要您只需要在服务器端编写一些特定功能的代码例如安全功能
如何声明返回函数指针的函数指针

如何声明一个函数指针该指针指向具有相同参数的函数并返回一个指向具有相同参数的函数的指针 i e funcPtr指着func1 int a int b and func1返回指向另一个函数的指针func2 int a int b func
无法获取POST参数

我正在使用 WebApp2 作为框架在 Python 中开发一个 Web 应用程序我无法获取通过填写表单提交的http POST请求参数这是我创建的表单的 HTML 代码
使用 Passport-facebook 的 Facebook OAuth 安全性

我目前正在使用客户端 React 组件让用户通过我的应用程序中的 OAuth 登录 Facebook 在服务器端我使用 npm 包护照 Facebook 令牌 https github com drudge passport facebo
无法将“Windows.UI.Xaml.Controls.ItemsControl”类型的对象强制转换为“Windows.UI.Xaml.Controls.Image”类型

我在此项目控件中放置了一个点击事件以便在点击图像时查看图像但是当我这样做时我收到此错误我该如何修复它我尝试更改为项目图像但不存在 XAML 代码
如何获取用星号定义的 WPF 网格列来剪辑内容？

我有一个使用星号比例的网格控件例如
如何在Python中使用x和y坐标验证ES384 JWT签名

我有一个 JWT 如下 Authorization Bearer eyJhbGciOiJFUzM4NCIsInR5cCI6IkpXVCIsImtpZCI6IjQ0ODIzZjNkLTBiMDEtNGE2Yy1hODBlLWI5ZDNlOGE
并行框架和避免错误共享

最近我回答了一个关于优化可能的并行方法来生成任意基数的每个排列的问题我发布了类似的答案并行化实施不佳代码块列表有人几乎立即指出了这一点这几乎肯定会给你带来错误的共享并且可能会慢很多倍归功于gjvdkamp https stac

并行框架和避免错误共享

并行框架和避免错误共享 的相关文章

随机推荐

热门标签

并行框架和避免错误共享的相关文章