opencl

OpenCL C/C++ 动态绑定库（win32 及更多）

我正在尝试 OpenCL 为了将其投入生产我希望能够动态绑定到 OpenCL DLL 在 Windows 下以便优雅地处理没有 OpenCL 的情况安装在主机上是否有任何可用的库或代码片段可以在 C 或 C 中处理这种动态绑定

c dll opencl dynamiclinking

GPGPU：普通 PC 陷入困境的后果

我在一本书中读到在波前或扭曲中所有线程共享一个公共程序计数器那么它的后果是什么呢为什么这很重要 NVIDIA GPU 一次执行 32 个线程扭曲 AMD GPU 一次执行 64 个线程波前控制逻辑读取和数据路径的共享减少了面

CUDA opencl GPGPU programcounter

OpenCL 编译器预处理定义？

我正在 Snow Leopard 上开发 OpenCL 代码并且了解 OpenCL 即时编译是由 Clang LLVM 完成的是否使用了 C 预处理器有没有办法使用编译器设置预处理定义存在哪些定义我希望代码知道它是为 CPU 还是

osxsnowleopard opencl

有多少线程（或工作项）可以同时运行？

我是 GPGPU 编程新手正在研究 OpenCL 的 NVIDIA 实现我的问题是如何计算 GPU 设备的限制线程数据我了解有许多工作组相当于 CUDA 中的块其中包含许多工作项 cuda 线程如何获取我的卡上存在的工作组数

opencl GPGPU

为什么 AMD GCN 使用非零 NULL？

这次提交 https reviews llvm org rL289252 says In amdgcn https en wikipedia org wiki Graphics Core Next目标全局常量和通用地址空间中的空指针取值

c opencl LLVM amdgcn

OpenCL 产生错误的计算

我一直尝试使用openCL做一些计算但结果不正确我输入了三个 float3 如下所示 300000 0 0 300000 300000 0 300000 300000 300000 进入这个内核 kernel void gravitat

python opencl GPGPU

GPU 显存带宽理论与实际

作为在 GPU 上运行的算法分析的一部分我觉得我正在达到内存带宽的要求我有几个复杂的内核执行一些复杂的操作稀疏矩阵乘法归约等和一些非常简单的操作当我计算每个内核读取写入的总数据时似乎所有重要的都达到了约 79GB s 的

CUDA opencl linearalgebra GPGPU Bandwidth

OpenCL - 将树复制到设备内存

我用 C 代码实现了二叉搜索树我的每个树节点如下所示 typedef struct treeNode int key struct treeNode right struct treeNode left treeNode t 宿主建造的树

c Tree opencl binarytree

OpenCL 在线编译：从 cl::program 或 cl::kernel 获取程序集

我正在使用 OpenCL 运行内核基准测试我知道我可以使用 OpenCL 供应商提供的各种工具离线编译内核即ioc64 or poclcc 问题是我得到的性能结果无法用这些工具的汇编 OpenCL 运行时开销或类似的来解释我想看到由我

Assembly Compilation opencl

高清处理器显卡 (HD4000) 无法作为英特尔 OpenCL SDK 中的设备加载

我使用 i7 3770K Ivy Bridge 和 HD 4000 并且我已经安装了最新的驱动程序和最新的OpenCL SDK http software intel com en us articles vcsource tools op

opencl intel

OpenCL：头文件的附加目录

OpenCL 规范中写道5 6 3 构建选项 5 6 3 1 预处理器选项 I dir Add the directory dir to the list of directories to be searched for header f

opencl specifications

OpenCL 双精度与 CPU 双精度不同

我正在 Linux 中使用 GeForce GT 610 卡进行 OpenCL 编程我的CPU和GPU双精度结果不一致我可以在这里发布部分代码但我首先想知道是否有其他人遇到过这个问题当我运行多次迭代的循环时 GPU 和 CPU 双精

opencl

OpenCL clBuildProgram 缓存源代码，如果 #include 源代码发生更改，则不会重新编译

我用opencl实现了一个项目我有一个包含内核函数的文件内核使用的函数包含在单独的头文件中但是当我更改包含的文件时有时会应用更改有时则不会这让我很困惑应用程序是否有错误我检查了 stackoverflow 中的其他帖子发现

opencl

CMake找不到NVIDIA的opencl sdk

我刚刚安装了 NVIDIA CUDA 工具套件用它在 Windows 8 1 上开发 OpenCL 应用程序我遇到了一些问题 1 FinedOpenCl cmake 不起作用因为 Nvidia 工具包未设置 opencl dir cm

c CMake opencl

OpenCL 内核是异步执行的吗？

对于 CUDA 我知道它们是在向默认流空流发出启动命令后异步执行的那么在 OpenCL 中又如何呢示例代码如下 cl context context cl device id device id cl int err cl kern

c Asynchronous opencl GPGPU

如何在 OpenCL 中验证波前/扭曲大小？

我使用的是 AMD Radeon HD 7700 GPU 我想使用以下内核来验证波前尺寸是否为 64 kernel void kernel test warpsize global T dataSet uint size size t id

opencl

opencl中的时钟()

我知道CUDA中有一个函数clock 你可以在其中放入内核代码并查询GPU时间但我想知道OpenCL中是否存在这样的东西有没有办法查询OpenCL中的GPU时间我正在使用 NVIDIA 的工具包 OpenCL 没有直接查询时钟周期的方

CUDA opencl GPU

OpenCL 本地内存大小和计算单元数量

每个 GPU 设备 AMD NVidea 或任何其他都分为多个计算单元多处理器每个计算单元都有固定数量的内核顶点着色器流处理器所以一个人有 Compute Units x VertexShaders compute unit

opencl

工作组之间的 OpenCL 同步

是否可以同步 OpenCL 工作组例如我有 100 个工作组每个工作组只有一个项目不要问我为什么这是一个例子我需要对每个工作项设置障碍以确保所有工作组都会在这 100 个工作组中的每个工作项达到此障碍点后继续不你不能您可

synchronization opencl

OpenCL 动态并行/GPU 生成的线程？

CUDA 5 刚刚被释放 http nvidianews nvidia com Releases NVIDIA Releases CUDA 5 Making Programming With World s Most Pervasive P

CUDA opencl GPGPU