矢量化和尴尬并行之间有什么关系？

2024-04-07

这个问题说明了一切。在我看来，矢量化与令人尴尬的并行问题密切相关。换句话说，所有可矢量化的程序都必须是极其并行的程序。它是否正确？

对令人尴尬的并行性的快速总结：

一个代码是尴尬地平行如果代码可以毫不费力地并行化，特别是处理数据依赖性。请注意，令人尴尬的并行性仅意味着代码将毫不费力地安全地并行化；它不保证任何最佳性能。

一个简单的例子是两个向量的求和。

// A, B, and C are all distinct arrays.    
for (int i = 0; i < N; ++i)
  C[i] = A[i] + B[i];

这段代码是令人尴尬的并行，因为没有数据依赖C。该代码可以简单地并行化，例如，通过使用 OpenMP：

#pragma omp parallel for 
for (int i = 0; i < N; ++i)
  C[i] = A[i] + B[i];

矢量化是实现并行性的一种特殊形式。特别是，矢量化主要在使用 x86 SSE/AVX 和 ARM NEON 等专用指令的处理器中使用专用 SIMD 执行硬件单元。编译器可以自动矢量化您的代码，或者您可以使用内部函数和直接汇编代码手动矢量化。

我不认为矢量化一定意味着要矢量化的代码必须是令人尴尬的并行。但实际上，大多数可向量化代码都是令人尴尬的并行，因为几乎所有 SIMD 指令都这么假设。我找不到任何允许数据相关操作的 SIMD 指令。从这个意义上说，是的，你可以说可矢量化程序需要高度并行。

然而，从广义上讲，矢量化可以包含 GPGPU 式的 SIMD 编程，例如 Nvidia 的 CUDA 和英特尔的 MIC 架构。它们通过处理数据相关的操作和分支来实现更灵活的 SIMD 操作。

总而言之，在矢量化的狭义定义中，即传统 CPU SIMD 操作的矢量化，我认为可矢量化程序应该是高度并行的。然而，SIMD/矢量化的高级形式可以实现数据相关的操作和任意分支。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

parallelprocessing

矢量化和尴尬并行之间有什么关系？的相关文章

IPython 中带多个参数的并行映射函数

我正在尝试使用 IPython 的并行环境到目前为止它看起来很棒但我遇到了问题假设我有一个在库中定义的函数 def func a b 当我想要评估 a 的一个值和 b 的一组值时我会使用它 func myA b for b in
如何同时加入 multiprocessing.Process() 列表？

Given a list 跑步的multiprocessing Process 实例我怎样才能加入所有实例并在其中一个实例退出时立即返回而没有Process join 超时和循环 Example from multiprocessing
如何在并行进程（python）中将项目追加到列表中？

这是我正在使用的更复杂代码的一个非常简单的版本问题是我想将 method 函数中计算的项目附加到稍后可以显示的某个列表中但是当运行此代码时列表对象为空而结果数组已满 import multiprocessing as mp glo
了解 C++ 内存模型：不同运行时的不同值

下面的代码有什么问题我预计消费者 1 和消费者 2 会生成 10 个但有时会看到 1 include
在 R 中快速计算 > 10^6 余弦向量相似度

我得到了约 1600 个文档 x 约 120 个单词的文档术语矩阵我想计算所有这些向量之间的余弦相似度但我们正在谈论约 1 300 000 次比较 n n 1 2 我使用了 parallel mclapply 和 8 但它仍然需要很长时
使用 Fortran (CLFORTRAN) 在 OpenCL 中将两个选项作为参数传递

当我的主机程序采用 C 语言时我可以传递两个选项作为 OpenCL 函数的参数例如我可以通过两个标志到clCreateBuffer像这样的函数 clCreateBuffer context CL MEM READ ONLY CL M
Haskell 中的简单合并排序并行化没有加速

注这篇文章于2011 06 10完全重写感谢彼得帮助我另外如果我不接受一个答案请不要生气因为这个问题似乎是相当开放式的但是如果你解决了它当然你会得到复选标记另一位用户发布了有关并行化合并排序的问题我以为我会写一个简单的
打破parallel.foreach？

我怎样才能摆脱困境并行 for http msdn microsoft com en us library system threading tasks parallel for aspx loop 我有一个非常复杂的声明如下所示 Par
使用 openmp 优化 N-queen

我正在学习 OPENMP 并编写以下代码来解决 n 皇后问题 Full Code https github com Shafaet Codes blob master OPENMP Parallel 20N Queen 20problem
并行处理 vec：如何安全地进行，或者不使用不稳定的功能？

我有一个巨大的向量我希望能够并行加载操作例如在一个线程中加载前十万个索引然后在另一个线程中加载下一个索引依此类推由于这将是代码中非常热门的部分因此我提出了以下概念验证不安全代码来在不使用 Arcs 和互斥体的情况下执行此操作
Julia：如何让多个工作人员访问模块中的函数？

我有以下测试模块 MyMod jl 来在 Julia 中存储一些测试函数一些核心函数是串行编写的其他函数并行调用核心函数 module MyMod export Dummy distribute data getfrom recombi
带有 return 语句的 Julia @parallel for 循环

如何在满足条件时立即返回所有工作人员的函数中编写并行 for 循环 IE 像这样的东西 function test n sync parallel for i in 1 1000 statement if condition return
线程与并行处理

Microsoft NET 4 0 为其框架引入了新的并行增强功能我想知道使用标准 System Threading 函数与新的并行增强功能创建应用程序之间有什么区别并行扩展和常规线程之间最重要的区别可能是控制流一个线程使用创建n
fork() 不并行运行

我对编程过程很陌生我的基本程序并没有真正按照我的预期工作我在 Oracle VM 上的 Ubuntu 18 04 上运行此代码这是代码 include
python 线程是如何工作的？

我想知道 python 线程是并发运行还是并行运行例如如果我有两个任务并在两个线程中运行它们它们是同时运行还是计划同时运行我知道GIL并且线程仅使用一个 CPU 核心这是一个复杂的问题需要大量解释我将坚持使用 CPython
使用 Scoop 编程 DEAP

我在 python 中使用 DEAP 库来解决多目标优化问题我想使用多个处理器来完成这项任务但是我遇到了一些麻烦为了提供一些背景信息我将 networkx 与 DEAP 结合使用我还定义了适应度函数交叉和变异函数由于某些原因
单机Octave并行计算——包和示例

我想在单台机器而不是集群上并行化 Octave 中的 for 循环前段时间我问了一个关于Octave并行版本的问题Octave并行计算 https stackoverflow com questions 7047840 paralle
从 foreach 循环赋值

我想并行化一个循环例如 td lt data frame cbind c rep 1 4 2 rep 1 5 rep 1 10 2 names td lt c val id res lt rep NA NROW td for i in l
如何在 Emgu CV 项目中利用 OpenCL

我是使用 Emgu CV 的新手并开始创建小型示例项目例如面部检测眼睛检测等如果我可以利用 OpenCL 来加速使用 GPU 的过程那就太好了否则当我降低scaleFactor时它会导致大量的CPU利用率我怎样才能做到这一
是否可以在 OpenCL 中并行运行求和计算？

我是 OpenCL 的新手不过我了解 C C 基础知识和 OOP 我的问题如下是否可以以某种方式并行运行求和计算任务理论上可能吗下面我将描述我尝试做的事情任务例如是 double values new double 1000 l

随机推荐

当返回自定义对象列表时，RxJava 突出显示错误但编译

我正在进行 RxJava 调用我订阅的最终结果是预订列表代码工作正常但我得到了这个恼人的亮点演员阵容在这里不起作用因为我无法演员阵容List
为什么 Linux 重定向会截断文件？

我有一个名为 test txt 的文件如下所示 hello world 它只是一个 hello world 字符串如果我使用 perl 正则表达式 perl pe s hello bye g test txt it says bye w
使用 itextsharp 使用数据库中的图像创建 pdf

我有一个过程其中 html 与图像链接存储在数据库中图像也存储在数据库中我创建了一个从数据库读取图像的控制器操作我生成的路径是这样的 File Image path Root test jpg 该图像路径嵌入在 html 的 img
使用自定义配置在调试模式下运行 sbt 项目

我想使用特殊配置在我的 sbt 0 11 项目中引入调试模式我尝试使用以下代码来实现这一点但不幸的是它似乎没有按预期工作我正在启动debug run但运行并未按预期暂停 object Test extends Build lazy
如何在 Windows 10 上解锁詹金斯

我使用下载的 msi 在我的 Windows 10 机器上安装了 jenkins 它安装得很好现在启动了浏览器提示我使用初始管理员密码解锁詹金斯我在任何地方都找不到这个文件我查看了安装目录 C Program Files x86 J
在 ControllerAdvice 之前捕获反序列化异常

这是一个问题我有一个采用输入模型的控制器可以说 public class AppUserUpdateData NotNull Size min 1 max 50 protected String login JsonDeserializ
处理 String.getBytes("UTF-8") 中的 UnsupportedEncodingException 的推荐方法

建议的处理方式是什么不支持的编码异常 http docs oracle com javase 6 docs api java io UnsupportedEncodingException html在库方法中调用 String getByt
如何更改 Paginator 的页面名称？

Current Paginator正在使用 page N 但我想用别的东西我怎样才能改变成这样 sida N反而我看过Illuminate Pagination Environment并且有一个方法 setPageName 在那里改变它
从浏览器调用 Android 应用程序

我一直在尝试从浏览器调用我的应用程序安卓 3 1 蜂窝这些是我尝试过的链接但没有一个有效 a href click me 1 a a href click me 2 a a href click me 3 a 对于第一个和第二
鼠标悬停/悬停效果在 IE8 上缓慢

我注意到在 IE8 中当在包含许多行本例中为 100 行的表上使用鼠标悬停事件时性能会出现奇怪的情况我尝试了很多不同的方法但我似乎找不到任何方法来按照我喜欢需要的速度获得它如果我在每个事件上切换类则所有 IE 版本的性能都
为什么 JavaScript 在普通浏览器中没有自己的线程？

JavaScript 不是多线程还不够显然 JavaScript 甚至没有自己的线程而是与大量其他东西共享一个线程即使在大多数现代浏览器中 JavaScript 通常也与绘画更新样式和处理用户操作处于同一队列中这是为什么根据我的
使用 Joda Time 进行 Grails 控制器单元测试

当我有一个带有 Joda LocalDateTime 字段的域对象时一些生成所有创建的控制器测试失败 grails create app bugdemo cd bugdemo grails create domain class Item
立即返回弹簧网通量

我正在尝试创建应该返回 201 响应的框架当向 API 发出请求时我想立即发回响应并在后台处理该请求 Flux fromIterable request getApiRequests log flatMap item gt WebCli
正确的 Javascript 继承

我想知道是否可以在javascript中继承构造函数在下面的例子中我想要Moveable分派x and y论点this x and this y分别如我所定义Sprite 另外在不创建祖先实例的情况下定义原型的最佳方法是什么但仍然简
Django 无法加载静态文件

对 django 来说是全新的在我的 settings py 文件中我有 STATIC URL static INSTALLED APPS django contrib admin django contrib auth django
如何将我的 Sqlite 数据库移植到 GAE？

我的本地硬盘中有一个 SQLite 格式的数据库我希望将数据库升级到 GAE 以便我可以使用它来创建某些很酷的网络应用程序我已经四处浏览寻找一种方法来做到这一点然而大多数可用的项目都是将GAE中的数据库备份到我的本地硬盘是否有现有
将 Clojure 函数作为 java.util.Function 传递

正如在主题中一样我想使用一个以 Function 作为参数的 Java 方法并为其提供一个Clojure函数无论是匿名函数还是常规函数任何人都知道如何做到这一点 java util function Function是一个接口您需
如何向 jfreechart 创建的图表添加缩放功能

我使用 jfree 绘制了 XY 图表现在我想为其添加缩放功能这必须使用图表底部的滑块来完成如何添加 Windows 照片查看器中提供的缩放功能另外当用户将鼠标悬停在绘制的线上时我想将图表的当前 Y 值显示为工具提示我没有得到
redirect_uri 不属于应用程序

类似的问题和答案都没有解决我的问题我有两个 Facebook 应用程序一个是另一个的测试版本因此它们几乎相同我测试时没有任何问题但在实时应用程序上我收到 redirect uri 不属于应用程序错误这个申请就是一个很好的例子
矢量化和尴尬并行之间有什么关系？

这个问题说明了一切在我看来矢量化与令人尴尬的并行问题密切相关换句话说所有可矢量化的程序都必须是极其并行的程序它是否正确对令人尴尬的并行性的快速总结一个代码是尴尬地平行如果代码可以毫不费力地并行化特别是处理数据依赖性请注意

矢量化和尴尬并行之间有什么关系？

矢量化和尴尬并行之间有什么关系？ 的相关文章

随机推荐

热门标签

矢量化和尴尬并行之间有什么关系？的相关文章