在 OpenCL 内核中使用 _ 常量限定符

2024-04-26

我在使用时遇到问题__持续的我的 OpenCL 内核中的限定符。我的平台是雪豹。

我尝试在 GPU 上初始化 CL 只读内存对象,将常量数组从主机复制到其中。然后我设置内核参数就像__global内存参数,但这不起作用,但我没有看到任何错误或警告。我还尝试直接在 clSetKernelArg 函数中使用数据,就像float and int类型,它都不起作用。

我是否犯了任何错误,或者苹果的实施有问题吗?我希望看到如何完成此操作的任何工作示例,包括 OpenCL(GPU)和主机代码。


我怀疑苹果的实施是否存在如此根本的错误。我用了以下OpenCL Hello World 示例 http://developer.apple.com/mac/library/samplecode/OpenCL_Hello_World_Example/index.html应用程序让我了解基础知识。

在这个例子中我替换了__global float* input with __constant float* input效果很好。您还需要确保您的缓冲区是CL_MEM_READ_ONLY,使用类似的东西clCreateBuffer(context, CL_MEM_READ_ONLY, sizeof(float) * count, NULL, NULL).

通过阅读规范,我认为 __constant => __global + CL_MEM_READ_ONLY。

我在 MBP 15" 上运行 Snow Leopard。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 OpenCL 内核中使用 _ 常量限定符 的相关文章

  • 内存复制速度对比 CPU<->GPU

    我现在正在学习 boost compute openCL 包装库 我的复制过程非常慢 如果我们将 CPU 到 CPU 的复制速度调整为 1 那么 GPU 到 CPU GPU 到 GPU CPU 到 GPU 复制的速度有多快 我不需要精确的数
  • 使用 GPU PyOpenCL 优化 python 代码的不同方法:内核 GPU/PyOpenCL 内的 extern 函数

    我使用以下命令来分析我的 Python 代码 python2 7 m cProfile o X2 non flat multiprocessing dummy prof X2 non flat py 然后 我可以全局可视化不同贪婪函数的重新
  • OpenGL-OpenCL 互操作传输时间 + 位图纹理

    两部分问题 我正在开展一个学校项目 使用生命游戏作为实验 gpgpu 的工具 我使用 OpenCL 和 OpenGL 进行实时可视化 目标是让这个东西尽可能大 更快 经过分析 我发现帧时间主要由 CL 获取和释放 GL 缓冲区决定 并且时间
  • CMake找不到NVIDIA的opencl sdk

    我刚刚安装了 NVIDIA CUDA 工具套件 用它在 Windows 8 1 上开发 OpenCL 应用程序 我遇到了一些问题 1 FinedOpenCl cmake 不起作用 因为 Nvidia 工具包未设置 opencl dir cm
  • Mac OS X(雪豹)上的 NI VISA + pyVisa

    有人使用 NI GPIB 模块在 Snow Leopard 上成功运行 pyVisa 吗 根据我在 NI 网站上阅读的所有论坛 NI VISA 和 pyVisa 的组合似乎无法在 Max OS X 上完成 麻烦的是 NI 网站有 NI VI
  • 如何使用 Grand Central Dispatch 并行化数独求解器?

    作为编程练习 我刚刚编写了一个使用回溯算法的数独求解器 请参阅维基百科 http en wikipedia org wiki Algorithmics of sudoku Example of a brute force Sudoku so
  • OpenCL 产生错误的计算

    我一直尝试使用openCL做一些计算 但结果不正确 我输入了三个 float3 如下所示 300000 0 0 300000 300000 0 300000 300000 300000 进入这个内核 kernel void gravitat
  • 如何解决 OpenSSL::Cipher::Cipher#encrypt 的弃用警告

    我刚刚将 Mac 升级到 Snow Leopard 并启动并运行了 Rails 环境 除了 OSX 之外 与我之前安装的唯一区别是我现在正在运行ruby 1 8 7 2008 08 11 patchlevel 72 universal da
  • CUDA PTX 代码 %envreg<32> 特殊寄存器

    我尝试使用 CUDA 驱动程序 API 运行由 cl 内核生成的 PTX 汇编代码 我采取的步骤是这些 标准 opencl 程序 1 加载 cl内核 2 JIT编译 3 获取编译好的ptx代码并保存 到目前为止 一切都很好 我注意到 ptx
  • 多个 OpenCl 内核

    我只是想问 是否有人可以提醒我在相继使用几个简单内核时要注意什么 我可以用同样的吗CommandQueue 我可以跑几次吗clCreateProgramWithSource cl program与不同的cl program 我忘记了什么 T
  • boost::计算流压缩

    如何使用 boost compute 进行流压缩 例如 如果您只想对数组中的某些元素执行繁重的操作 首先 生成掩码数组 其中包含与要执行操作的元素相对应的元素 mask 0 0 0 1 1 0 1 0 1 然后对掩码数组进行排它扫描 前缀和
  • OpenCL 内置函数“选择”

    我不清楚内置 OpenCL 函数的目的是什么select 有人可以澄清一下吗 来自 OpenCL 规范 功能选择 基因型a 基因型b 基因型c 返回 对于向量类型的每个分量 结果 i 如果设置了 c i 的 MSB b i a i 在这种情
  • 制作 AppleScript 程序来侦听系统范围内的快捷方式

    我想创建某种后台进程来侦听所有击键事件并相应地执行操作 例如 如果在 Finder app 中按下 CMD A 或更复杂的事情 例如创建快捷方式的序列 则执行一些操作 如emacs 但是我如何在 SnowLeopard 上监听系统范围内的按
  • 雪豹上的 Java5

    我需要 Java 5 不是 6 但 Snow Leopard 仅附带 Java 6 有 System Library Frameworks JavaVM framework Versions 1 5 但这仅仅指向1 6 0 ls la Sy
  • 有一个不错的 OpenCL 入门套件吗? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我有一些经验OpenGL它是可编程管道 我愿意给OpenCL不过 尝试一下 有人可以提出一个很好的集成套件来使用OpenCL 我只知道石英作曲家看起来
  • 空的 openCL 程序抛出弃用警告

    我下载了 AMD APP 3 0 SDK 一旦包含 include
  • 如何在 Windows 上的 nvidia GPU 的 Visual Studio 2010 中配置 OpenCL?

    我在华硕笔记本电脑上的 Wwindows 7 操作系统上使用 NVIDIA GeForce GTX 480 GPU 我已经为 CUDA 4 2 配置了 Visual Studio 2010 如何在 Visual Studio 2010 上为
  • 使用 OpenCL 或其他 GPGPU 框架在现代 x86 硬件上的 CPU 和 GPU 之间共享数据

    AMD Kaveri 的 hUMA 异构统一内存访问 和 Intel 第四代 CPU 证明了 CPU 和 GPU 硬件的不断统一 应该允许 CPU 和 GPU 之间进行无副本的数据共享 我想知道 最新的 OpenCL 或其他 GPGPU 框
  • OpenCL 矩阵乘法应该更快?

    我正在尝试学习如何使 GPU 优化 OpenCL 内核 我以使用本地内存中的方形图块进行矩阵乘法为例 然而在最好的情况下 我只得到了约 10 倍的加速 约 50 Gflops 与 numpy dot 相比 5 Gflops 它使用的是 BL
  • 如何在 pyopencl 中创建可变大小的 __local 内存?

    在我的 C OpenCL 代码中我使用clSetKernelArg创建 可变尺寸 local我的内核中使用的内存 OpenCL 本身不提供该内存 看我的例子 clSetKernelArg clKernel ArgCounter sizeof

随机推荐