了解 numba 并行化中的竞争条件

2024-01-06

Numba 文档中有一个关于并行竞争条件的示例

import numba as nb
import numpy as np
@nb.njit(parallel=True)
def prange_wrong_result(x):
    n = x.shape[0]
    y = np.zeros(4)
    for i in nb.prange(n):
        y[:]+= x[i]
    return y

我已经运行了，它确实输出了异常结果，例如

prange_wrong_result(np.ones(10000))
#array([5264., 5273., 5231., 5234.])

然后我尝试将循环更改为

import numba as nb
import numpy as np
@nb.njit(parallel=True)
def prange_wrong_result(x):
    n = x.shape[0]
    y = np.zeros(4)
    for i in nb.prange(n):
        y+= x[i]
    return y

它输出

prange_wrong_result(np.ones(10000))
#array([10000., 10000., 10000., 10000.])

我读过一些竞争条件的解释。但我还是不明白

为什么第二个例子没有赛车条件？有什么区别y[:]= vs y=
为什么第一个例子中四个元素的输出不一样？

在第一个示例中，您有多个线程/进程共享同一数组并读取+分配给共享数组。这y[:] += x[i]大致相当于：

y[0] += x[i]
y[1] += x[i]
y[2] += x[i]
y[3] += x[i]

事实上+=只是读取、加法和赋值操作的语法糖，所以y[0] += x[i]事实上是：

_value = y[0]
_value = _value + x[i]
y[0] = _value

循环体由多个线程/进程同时执行，这就是竞争条件出现的地方。维基百科上关于竞争条件的示例适用于此处：

这就是返回的数组包含错误值以及每个元素可能不同的原因。因为它根本不确定哪个线程/进程何时运行。因此，在某些情况下，一个元素上存在竞争条件，有时没有，有时多个元素上存在竞争条件。

然而，numba 开发人员在不发生竞争条件的情况下实现了一些受支持的减少。其中之一是y +=。这里重要的是它是变量本身，而不是变量的切片/元素。在这种情况下，numba 会做一些非常聪明的事情。它们为每个线程/进程复制变量的初始值，然后对该副本进行操作。并行循环完成后，它们将复制的值相加。以您的第二个示例为例，假设它使用 2 个进程，则它大致如下所示：

y = np.zeros(4)
y_1 = y.copy()
y_2 = y.copy()
for i in nb.prange(n):
    if is_process_1:
        y_1[:] += x[i]
    if is_process_2:
        y_2[:] += x[i]
y += y_1
y += y_2

由于每个线程都有自己的数组，因此不可能出现竞争条件。为了让 numba 能够推断出这一点，你必须遵守他们的限制。文档指出 numba 创建无竞争条件的并行代码+=关于标量和数组 (y += x[i]), but 不在数组元素/切片上 (y[:] += x[i] or y[1] += x[i]).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

了解 numba 并行化中的竞争条件的相关文章

Cython 回调适用于函数，但不适用于绑定方法

我正在实现一个基于 cython 的 C 库接口我实现了一个回调系统它可以与普通函数一起使用但在传入绑定方法时会奇怪地失败这是我的 cython 代码的一部分 cdef extern from VolumeHapticTool h
xlsxwriter 错误：AttributeError：“工作簿”对象没有属性“add_format”

我正在使用 xlsxwriter 进行一些简单的条件格式化但是当我运行下面的代码时出现此错误 AttributeError Workbook object has no attribute add format 我已经更新了 xlsxwr
如何并行安装/编译 pip 要求（使 -j 等效）

我的 pip 要求中有很多软件包需要安装我想并行处理它们我知道例如如果我想要n并行作业来自make我必须写make j n 是否有满足 pip 要求的等效命令 Thanks 有时 pip 使用 make 来构建依赖项如果在开始之前
Python 的 pack("

我不太了解 python 但从文档中可以看出代码 str AAAA str pack

无法启动 Windows 快捷方式

我正在尝试使用 python 启动 Windows 我已经尝试了 os system subprocess call os startfile 等多种方法但总是收到错误消息指出路径不存在我知道路径是正确的因为我尝试在 CMD EXE
Python Twisted 与 Cmd 模块集成

我喜欢Python的Twisted http twistedmatrix com and Cmd http docs python org library cmd html 我想一起使用它们我已经完成了一些工作但到目前为止我还没有弄清楚
获取每行最后 150 行中所有正值的计数 - pandas

我有以下数据集其中有列Date and Values对于每一行它两者都有 ve and ve价值观我必须计算最后 150 行的所有正值在每一行因此前 150 行将具有空值然后以下行将具有最后 150 行的计数 ve行类似地
Python 中 Matlab 'fscanf' 的等价物是什么？

Matlab函数fscanf 似乎很强大 python 或numpy 中是否有相同的等效项具体来说我想从文件中读取矩阵但我不想迭代每一行来读取矩阵类似的东西来自 matlab 用于读取 2D 1000x1000 矩阵 matrix
字段“id”期望一个数字，但得到“natsu”django

我想创建一个 user posts 视图其中包含与特定用户相关的所有帖子假设有用户 Natsu 撰写的博客帖子那么登录用户 Testuser 将能够查看所有帖子由该用户发布即用户 Natsu 的所有帖子 blog models py
使用unittest时如何知道每次测试花费的时间？

Unittest 仅显示运行所有测试所花费的总时间但不单独显示每个测试所花费的时间使用unittest时如何添加每个测试的计时我想目前不可能 http bugs python org issue4080 http bugs pyth
如何在Python Selenium中获取WebElement的类名？

我使用 Selenium WebDriver 来抓取从网页中获取的用 JavaScript 编写的表格我正在迭代表行列表每行可能属于不同的类别我想获取此类的名称以便我可以为每一行选择适当的操作 table body table f
mclapply 用户时间大于已用时间

我正在尝试使用mclapply的功能parallel封装在R 该函数通过计算对数似然距离将值分配给序列矩阵这是一个 CPU 密集型操作所结果的system time价值观令人困惑 gt system time mclapply work
在Python中将数组的元素从科学记数法转换为十进制记数法

我有一个 numpy 数组其元素采用科学格式我想将它们转换为十进制格式我的 numpy 数组如下所示 array 93495052 96955582 98555123 06146193 array 1 00097681e 09 9 9
如何重写一个列表列表，使值的“孤岛”彼此唯一？

假设我有一个列表列表或更概念上准确的二维数组 list 1 1 0 0 0 1 1 2 0 0 0 2 2 2 0 0 0 0 2 0 0 0 0 1 0 我想识别具有相同值的不同区域并重写列表以便每个区域都有唯一的值如下所示 lis
如何将 bisect.insort_left 与键一起使用？

文档缺少示例你如何使用bisect insort left 基于密钥尝试根据键插入 bisect insort left data brown 7 将插入放在data 0 从文档 bisect insort left a x lo 0
如何使用 python 在 XML 声明后添加注释

import xml etree ElementTree as ET def addCommentInXml fileXml C Users Documents config xml tree ET parse fileXml root t
如果出现重复，则主键取正值

我有一个数据框df Key1 Key2 Value K11 K21 V1 K11 K21 V1 K13 K23 V2 K13 K23 V2 现在例如对于相同的键 K11 K21 组合我们有 2 个值一负一正如何从此 df 中仅获取正
具有默认参数的Python类构造函数[重复]

这个问题在这里已经有答案了可能的重复 Python 中的最不令人惊讶可变默认参数 https stackoverflow com questions 1132941 least astonishment in python the m
使用 Pandas 来“applymap”来访问索引/列？

解决以下 pandas 问题的最有效方法是什么这是一个简化的示例其中包含数据框中的一些数据 import pandas as pd import numpy as np df pd DataFrame np random randint
子进程调用，它们是并行完成的吗？

我一直在谷歌搜索这个问题的答案但似乎没有一个答案谁能告诉我如果subprocess模块是否并行调用 Python 文档建议它可用于生成新进程但没有提及它们是否并行如果它们可以并行完成您能否给我举一个例子或将我链接到一个例子这取决

随机推荐

如何开发适用于手机和平板电脑的 Xamarin 表单应用程序

1 在Android Java 中手机和平板电脑有不同的文件夹 Layout布局大布局 xlarge 2 在 iOS 中使用通用设置我还没有尝试过以 Xamarin 形式我需要一些帮助如果该应用程序适用于手机和平板电脑我需要做
Pyinstaller：找不到 PyQT5 Web 应用程序的 QtWebEngineProcess.exe

我正在开发一个显示 folium 地图的 Web 应用程序该网络应用程序有 3 个选项卡每个选项卡都有一个QWeb引擎视图小部件添加到其中我正在尝试为我的 Web 应用程序创建一个独立的 exe 文件因此我使用 Pyinstall
SuSE 上的 rpmlib(FileDigests) 依赖性错误

Doing a 百胜安装A 3 6 0在 SuSE 11 2 64 位和 CentOS 5 8 64 位上都会弹出以下安装要求错误 error Failed dependencies rpmlib FileDigests lt 4 6
Dataframe 写入 Postgresql 性能不佳

在 postgresql 中工作我有一个笛卡尔连接生成约 400 万行连接需要约 5 秒写回数据库需要约 1 分 45 秒这些数据需要在 python 中使用特别是在 pandas 数据框中因此我正在尝试在 python 中复
使用入口点定义的命令强制执行 python 解释选项

我想强制使用 python S 运行脚本我使用 setup py 中的entry points 定义脚本有这个选择吗 Thanks 我认为 setuptools 中没有这样的选项您可以创建一个存根脚本并在scripts而是使用 dis
Angular2 路由器 - 辅助路由

我确实有一个默认加载的延迟加载模块LazyLoadedComponent当我去 lazy 到目前为止还可以该组件包含 2 个 router outlet
“选择”元素的顺序是否有所不同？

我正在使用如图所示声明的对象 DataCollection
应该如何编写 binding.gyp 来使用 OpenNI 构建 Node.js 插件？

我正在尝试构建一个使用 OpenNI 的 Node js 插件我之前没有使用过 Node gyp 所以我尝试设置 binding gyp 文件以便它包含 OpenNI 库作为构建的一部分我实际编译的代码只是你好世界示例 http no
如何限制struts/Java中按钮的双击？

我创建了一个网络表单单击按钮时将触发数据库查询问题是当用户单击按钮两次时查询将被触发两次我想阻止这种情况发生有什么帮助吗看一看here http struts apache org 2 0 14 docs token htm
通过 IDAS 注册设备时 Orion CB 实体缺少属性

我在进行练习时遇到了一些麻烦无法获得预期的结果http www slideshare net FI WARE io t basicexercisesdevelopersweek http www slideshare net FI WAR
删除注释，同时保留绘图

我正在生成一系列散点图其中我在每个图之间保留了大部分图除了散点图之外这样做是这样的在 matplotlib 中的图之间保持地图重叠 https stackoverflow com questions 42298469 keeping
什么时候使用扩展，什么时候使用接口？

我们可以扩展一个类但不能实现一个类我们可以实现一个接口但不能扩展一个接口在什么情况下我们应该使用扩展 extends用于任一扩展基类 class ClassX extends ClassY or 扩展接口 interface Int
MySQL 葡萄牙语排序规则

MySQL 有没有办法按照葡萄牙语对字符进行排序同样还有 utf8 spanish ci 或西班牙语或者有没有办法添加新的排序规则有以下人物 Gon alves Guimar es Sim es T nger P rto Gouv
如何在我的网站上实施 Mozilla readability.js？

https github com mozilla readability https github com mozilla readability readability js用于创建网页的阅读视图如何在此测试网页中实现 readabil
处理数据库中的空字符串的最佳实践（Java 中）

在我的数据库应用程序中我有时必须处理null数据库中的字符串在大多数情况下这很好但是当涉及到以 Swing 组件的形式显示数据时使用JTextField例如无法处理空字符串 setText null fails EDIT 我刚刚
向我的 RESTful API(Python-Flask) 发送 POST 请求，但收到 GET 请求

我正在尝试以包含 JSON 的 POST 请求的形式向 Zapier Webhook 发送触发器如果我只是通过本地 python 脚本发送 POST 请求它就可以正常工作我想要做的是创建一个 RESTful API 当调用 creat
MATLAB Mex 函数可以同时接受单精度和双精度吗？

我有一个接受双精度矩阵作为输入的 mex 函数但我刚刚意识到该函数所使用的代码也可以具有单精度矩阵是否可以允许该函数接受其中任何一个或者如果没有有什么替代方法可以解决这个问题简单的解决方案是将 MATLAB 中的输入转换为一致的类
有什么理由不向每个页面添加“Cache-Control: no-transform”标头？

我们最近修复了我们网站上的一个烦人的错误类似于如何阻止沃达丰代理的 JavaScript 注入 https stackoverflow com questions 4113268 how to stop javascript inject
Opencart 致命错误：在非对象上调用成员函数 get()

尝试从本地主机移动到新服务器全新安装运行良好没有任何问题当我上传文件时 mydomain com admin 出现白屏并且 mydomain com 产生以下错误致命错误在第 103 行对 home4 pawpostc publ
了解 numba 并行化中的竞争条件

Numba 文档中有一个关于并行竞争条件的示例 import numba as nb import numpy as np nb njit parallel True def prange wrong result x n x shape

了解 numba 并行化中的竞争条件

了解 numba 并行化中的竞争条件 的相关文章

随机推荐

热门标签

了解 numba 并行化中的竞争条件的相关文章