为什么程序（全局）作用域变量必须是 __constant？

2024-03-25

我是 OpenCL 新手，对这个限制感到非常困惑。例如，如果我想写一个LCG，我必须使状态字可以修改为rand() and srand()。在 ANSI C 中，我将使用以下方法来做到这一点：

/* ANSI C */
static unsigned long _holdrand = 1; /* Global! */

unsigned long rand(){
    _holdrand = _holdrand * 214013L + 2531011L;
    return (_holdrand >> 16) & 0x7FFF; 
}
void srand( unsigned long seed ){
    _holdrand = seed;
}

但 OpenCL 限制所有全局范围变量__constant。我可以移动_holdrand进入函数作用域，并从该函数返回它的指针。

/* OpenCL C */
uint* holdrand(){
    __private static uint _holdrand = 1;
    return &_holdrand;
}

uint rand(){
    *holdrand() = *holdrand() * 214013L + 2531011L;
    return (*holdrand() >> 16) & 0x7FFF; 
}
void srand( uint seed ){
    *holdrand() = seed;
}

它工作正常，我不知道这是否是一个好的解决方案。这个限制毫无意义，我只是通过添加更多奇怪的代码来避免它。

__private uint _holdrand = 1;
/* It should be the same thing... Why this is not allowed? */

由于返回静态指针方式的行为与 ANSI C 中的全局范围变量方法完全相同，因此我无法理解该限制的含义。有人可以解释为什么吗？我错过了什么吗？我应该做什么才能使_holdrand在这个例子中可以在两个不同的函数中修改吗？

简而言之 - OpenCL 程序生命周期和内存布局与 C 程序不同。在 OpenCL 中，没有堆栈、堆等。常量内存（通常）非常快且片上内存量很少，IO 操作与寄存器操作相比具有相同的性能顺序。因此，它对工作项的写入操作可能有限制。

每个 NDRange（通常）中都有数千个工作项 (WI)。想象一下，如果 512 个线程正在读取/写入同一变量，您可以实现什么性能。这就是为什么你有 4 个地址空间：

__private对于每一个WI
__local对于工作组内的所有 WI
__global适用于 NDRange 内的所有 WI
__constant对于全局只读变量

If your rand() & srand()函数是 WI 特定的，您应该使用私有内存。另一种方法是在全局地址空间中包含所需的变量。但在这种情况下要非常小心竞争条件。

OpenCL 可以在各种各样的设备上运行，这就是为什么某些限制看起来太严格的原因。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

globalvariables

opencl

为什么程序（全局）作用域变量必须是 __constant？的相关文章

GPU 显存带宽理论与实际

作为在 GPU 上运行的算法分析的一部分我觉得我正在达到内存带宽的要求我有几个复杂的内核执行一些复杂的操作稀疏矩阵乘法归约等和一些非常简单的操作当我计算每个内核读取写入的总数据时似乎所有重要的都达到了约 79GB s 的
OpenCL 产生错误的计算

我一直尝试使用openCL做一些计算但结果不正确我输入了三个 float3 如下所示 300000 0 0 300000 300000 0 300000 300000 300000 进入这个内核 kernel void gravitat
OpenCL 编译器预处理定义？

我正在 Snow Leopard 上开发 OpenCL 代码并且了解 OpenCL 即时编译是由 Clang LLVM 完成的是否使用了 C 预处理器有没有办法使用编译器设置预处理定义存在哪些定义我希望代码知道它是为 CPU 还是
OpenCL clGetPlatformIDs 异常

我使用此包安装附带的示例中的 HelloWorld 示例 AMD 套件 http developer amd com tools and sdks heterogeneous computing amd accelerated parall
Laravel 5.5：如何定义可在所有控制器中使用的全局变量？

开发人员和编码人员您好我的问题是如何定义一个全局变量可以在 Laravel 中的所有控制器我定义了一个变量 company in AppServiceProviders的启动方法我在所有刀片视图中使用它但我无法在控制器文件中使用它
在 OpenCL 内核中动态创建本地数组

我有一个 OpenCL 内核需要将一个数组作为多个数组进行处理其中每个子数组总和都保存在本地缓存数组中例如想象一下捕鸟数组 1 2 3 4 10 30 1 23 每个工作组都有一个数组在示例中我们有 2 个工作组每个工作项处理两
OpenCl 代码可以在一台机器上运行，但我在另一台机器上收到 CL_INVALID_KERNEL_ARGS

我有以下代码它在一台机器上运行良好但是当我尝试在另一台具有更好显卡的机器上运行它时我收到错误 global 0 512 global 1 512 local 0 16 local 1 16 ciErrNum clEnqueueNDRa
CUDA PTX 代码 %envreg<32> 特殊寄存器

我尝试使用 CUDA 驱动程序 API 运行由 cl 内核生成的 PTX 汇编代码我采取的步骤是这些标准 opencl 程序 1 加载 cl内核 2 JIT编译 3 获取编译好的ptx代码并保存到目前为止一切都很好我注意到 ptx
多个 OpenCl 内核

我只是想问是否有人可以提醒我在相继使用几个简单内核时要注意什么我可以用同样的吗CommandQueue 我可以跑几次吗clCreateProgramWithSource cl program与不同的cl program 我忘记了什么 T
正确实施全局配置

我的目标是在我正在开发的 C 游戏中拥有全局常量以表示一些图形信息等我当前的实现是将它们全部放在 h 中并将它们包含在各处这是可行的只是每次我更改设置时都必须重新编译整个代码库所以我的下一个想法是将它们放入一些配置 txt 文
使用 $& 全局变量的编程别名方法

我正在尝试给一个使用 Ruby 特殊方法的方法起别名返回最后一个正则表达式匹配 http jimneath org 2010 01 04 cryptic ruby global variables and their meanings h
如何避免全局常量的“多重定义”错误？

我正在使用 Windows API 编写 C 程序每个主要函数都有自己的文件并且有一个用于原型和包含内容的标头 Headers global constants pragma once define WIN32 LEAN AND MEA
存储值以便在以后的函数中使用的最佳方法是什么？我听说全局变量很邪恶

所以我使用的代码位于http jsfiddle net 8j947 10 http jsfiddle net 8j947 10 它为变量 isLive 返回 true 或 false 值如何在稍后的函数中使用变量 onLive 我在以下位
静态局部变量和静态全局变量有什么区别？

C 入门说每个局部静态变量在第一次之前都会被初始化执行通过对象的定义本地静态数据是函数结束时不会被销毁当程序运行时它们被销毁终止局部静态变量与全局静态变量有什么不同吗除了申报地点不同之外还有什么不同呢 void foo
请描述您在尽量减少使用全局变量方面的挣扎[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 OpenCL 或其他 GPGPU 框架在现代 x86 硬件上的 CPU 和 GPU 之间共享数据

AMD Kaveri 的 hUMA 异构统一内存访问和 Intel 第四代 CPU 证明了 CPU 和 GPU 硬件的不断统一应该允许 CPU 和 GPU 之间进行无副本的数据共享我想知道最新的 OpenCL 或其他 GPGPU 框
在不同的翻译单元中启动全局变量（涉及链接器）

最近在复习C 这是我的问题请参阅中的代码file1 cpp and file2 cpp 文件1 cpp int x1 1 int y1 x1 2 文件2 cpp include necessary headers extern int y
杀死 OpenCL 内核

有没有办法通过 OpenCL API 终止正在运行的 OpenCL 内核我在规范中没有找到任何内容我能想到的唯一解决方案是 1 定期检查内核中主机希望内核停止时写入的标志或 2 在单独的进程中运行内核并终止整个进程我认为这两个都不是
如何在 Ruby 中使用全局变量或常量值？

我有一个看起来像这样的程序 offset Point new 100 200 def draw point pointNew offset point drawAbsolute point end draw Point new 3 4 指某
反应。如何将 props 从 onClick 传递到 function

我是反应新手我正在尝试创建一个应用程序在其中我可以单击按钮并且函数将运行倒计时器但是如果我从 onClick 传递道具来开始像这样的函数 onClick begin props subject 该函数将在我点击之前运行如果我在不带

随机推荐

如何查看 linq 查询生成的 sql

只是试图获取由 linq 查询生成的 sql 使用 Linq2Sql dc GetCommand query CommandText see http msdn microsoft com en us library system data
如何从字符串中解析 ODataQueryOptions？

我必须在符合 OData 规范的 ASP NET API 上为 EF6 实体提供一些读取端点实体检索基于接受实体的函数而工作良好System Web Http OData Query ODataQueryOptions
并行运行异步任务

在 RxJS 中当您想要按顺序运行 http 请求时您可以将它们链接起来但我不清楚如何并行运行请求我在例子中看到http reactive extensions github io learnrx http reactive ext
如何在Python中使用lambda排序

我正在尝试按属性对某些值进行排序如下所示 a sorted a lambda x x modified reverse True 我收到此错误消息
向下滚动 Instagram 框中的关注者/关注列表

你好我一直在寻找一种解决方案来向下滚动 Instagram Box 中的关注者关注者列表我所做的步骤如下打开用户A的IG资料点击关注者按钮 IG 框中会出现一个包含 12 个关注者列表的框一旦关注者列表显示出来当我使用以下
Grails hasOne 和 hasMany 相同的域

我有这样的域名 class Team hasOne leader Person hasMany member Person class Person belongsTo team Team 但是生成表后 team表中并没有leader id
NSGA-II（非支配排序算法）

我研究过非支配排序算法 nsga II 此链接给出了算法 http church cs virginia edu genprog images 2 2f Nsga ii pdf http church cs virginia edu gen
“无法初始化代理 - 无会话”且有可用的打开会话

我使用 JSF 2 MyFaces 2 1 7 和 Primefaces 3 4 2 CDI Weld servlet 1 1 10 JPA 2 Hibernate 4 1 7 和 Lombok 0 11 2 所有这些都在 Tomcat 6
为什么在使用 setScaleX() 时，motionEvent.getX() 返回不一致的值？

我的子视图驻留在 ViewGroup 中我想用捏来缩放缩放孩子我正在使用 setScaleX Y 来缩放孩子比例是在 OnTouch 中根据 2 个指针之间的距离计算的但是当我设置子级的比例时它会使motionEvent ge
绘制多个类别的 ROC 曲线

我正在按照此链接绘制多个类别的 ROC 曲线的文档 http scikit learn org stable auto examples model selection plot roc html http scikit learn org
如何在Chip Material组件中显示进度drawable动画？

据官方称Action Chips 的设计文档 https material io design components chips html action chips 我们应该能够为芯片添加进度状态可悲的是开发文档 https mater
如何返回正则表达式子匹配组，同时忽略空格？

我正在寻找一些有关正则表达式的帮助我拥有的数据是由逗号分隔的 5 个数字组成的组那么可能会有这样的数据不带逗号的单个组 12345 任意数量的组 12345 54321 56789 09876 12345 54321 56789 或
如果事件在 .NET 中作为委托实现，那么 .event IL 部分的意义何在？

我在 Stack Overflow 上看到了一些非常好的问题涉及委托事件以及这两个功能的 NET 实现特别提出一个问题 C 事件在幕后如何工作 https stackoverflow com questions 213638 how
CalendarView getDate 方法返回当前日期，而不是选定日期...我做错了什么？

我的 calendarView 无法返回所选日期而是返回一些始终指向今天的默认日期我当然正在更改日历中选择的日期并且它确实显示为已更改我尝试在调试模式下检查视图但没有发现任何内容我在模拟器中运行它而不是在真正的手机上我应该修
获取testng中@BeforeMethod和@AfterMethod中当前执行的@Test方法名

我想打印当前正在执行的测试方法的名称 BeforeMethod and AfterMethod using testng Like public class LoginTest Test public void Test01 LoginPa
python 删除二叉搜索树中的节点

下面的代码是我的二叉搜索树的实现我想实现删除方法来删除节点下面是我的实现但是当我执行时 bst BSTRee bst insert 5 bst insert 11 bst insert 3 bst insert 4 bst inser
为什么 XML 反序列化不会触发 OnDeserialization？

我有一个问题在三个小时的大部分时间里我一直在努力解决这个问题我几乎可以肯定我错过了一些非常明显的事情我有一个简单的 XML 文件
更改 ViewController 时如何保持 UISwitch 状态？

当我从一个视图控制器移动到另一个视图控制器时第一个控制器上的开关会自行重置并且不保留其状态在查看其他控制器后返回时如何使其保存状态以及如何让它在关闭应用程序后保存其状态我查看了各种 stackOverflow 问题和回复以及苹果文档
节点上的 jwt - 客户端如何将令牌传回服务器

okay 我认为我未能理解基于令牌的身份验证的基本部分我正在使用带有express的节点并使用jwt来阻止您尚未登录时访问我的网站我可以在登录页面上创建一个令牌然后我可以将其发送回客户端并将其存储在localStorage cook
为什么程序（全局）作用域变量必须是 __constant？

我是 OpenCL 新手对这个限制感到非常困惑例如如果我想写一个LCG 我必须使状态字可以修改为rand and srand 在 ANSI C 中我将使用以下方法来做到这一点 ANSI C static unsigned long

为什么程序（全局）作用域变量必须是 __constant？

为什么程序（全局）作用域变量必须是 __constant？ 的相关文章

随机推荐

热门标签

为什么程序（全局）作用域变量必须是 __constant？的相关文章