Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
OpenCL:SIMT执行模型的基本问题
SIMT 架构的一些概念和设计我仍然不清楚 根据我所看到和阅读的内容 不同的代码路径和 if 一起是一个相当糟糕的主意 因为许多线程可能会同步执行 那么这究竟意味着什么呢 怎么样 kernel void foo int flag if fl
opencl
parallelprocessing
GPU
GPGPU
std::vector 和 C 风格数组
我正在尝试OpenCL http www khronos org opencl 提高我们软件的速度 我们经常使用映射 为了简化 将映射表示为 std vector OpenCL API 采用原始 C 风格指针作为参数 例如上述情况中的 in
c
STL
opencl
libOpenCL.so 使用 VFP 寄存器参数,输出不
目前我正在尝试为 ARM 架构构建 Buddhabrot 但当我收到以下错误时 我陷入了困境 我希望有人能提供帮助 libOpenCL so uses VFP register arguments output does not libGA
c
arm
opencl
OpenCl 清理导致段错误
我使用网络上的不同来源构建了自己的 Opencl 小示例 实际的内核可以工作 并且我得到了我想要的输出 但是我在其中一个示例中发现的清理功能导致了段错误 我做错了什么 include
memorymanagement
segmentationfault
opencl
在 AMD GPU 中使用 Python+Theano 和 OpenCL
我正在尝试将 Python 与 Theano 结合使用 以通过 OpenCL 加速某些代码 我安装了libgpuarray and pygpu按照指示 我认为 并且没有错误 安装检测到已安装 OpenCL 运行时 我只是无法运行 OpenC
python
opencl
Theano
CUDA/OpenCL 中的现实死锁示例
对于我正在编写的教程 我正在寻找一个 现实 且简单的示例 说明由于不了解 SIMT SIMD 而导致的死锁 我想出了这个片段 这似乎是一个很好的例子 任何意见将不胜感激 int x threadID 2 if threadID gt x v
synchronization
CUDA
parallelprocessing
opencl
SIMD
clGetKernelWorkGroupInfo - CL_KERNEL_WORK_GROUP_SIZE 是 OpenCL 在 clEnqueueNDRange 内核中未指定时使用的大小吗?
我读到 当将内核排队时未指定工作组大小时 OpenCL 会为我选择一个 e g don t know which workgroup size OpenCl will use clEnqueueNDRangeKernel queue ker
opencl
在不使用 OpenCL 的情况下对 Intel IGP(例如 Iris Pro 5200)硬件进行编程
台式机 i7 4770k 4GHz 的内核峰值 GFLOPS 为 4GHz 8 AVX 4 FMA 4 个内核 512 浮点运算 https stackoverflow com questions 15655835 flops per cy
opencl
GPU
intel
如何将结构体中的数组传递给内核?
我需要向内核输出一个结构数组 其中将有一个数组 但最终 数据有点正确 但在某种程度上存在错误 我在主机上有这个代码 struct myStruct int a double b double c 5 myStruct result new
c
opencl
OpenCL™规范 3.2.3设备侧队列
3 2 3 Device side enqueue 3 2 3设备侧队列 Device side enqueue is missing before version 2 0 2 0版本之前缺少设备端队列 Algorithms may nee
opencl
OpenCL™规范 3.2.3设备侧队列
3 2 3 Device side enqueue 3 2 3设备侧队列 Device side enqueue is missing before version 2 0 2 0版本之前缺少设备端队列 Algorithms may nee
opencl
OpenCL 中的障碍
在 OpenCL 中 我的理解是你可以使用barrier 同步工作组中线程的函数 我 通常 确实了解它们的用途以及何时使用它们 我还知道工作组中的所有线程都必须遇到障碍 否则会出现问题 然而 到目前为止 每次我尝试使用屏障时 似乎都会导致我
opencl
Barrier
OpenCL™规范 3.2.2内核实例的执行
3 2 2 Execution of kernel instances 3 2 2内核实例的执行 The work carried out by an OpenCL program occurs through the execution
opencl
OpenCL 上 __constant 内存的访问性能与 __global 内存相同吗
我所知 CUDA 上的常量内存是一种特定的内存 而且它比全局内存更快 但在 OpenCL 的规范中 我得到以下的话 The constant或常量地址空间名称用于描述在全局内存中分配的变量 这些变量在内核内部作为只读变量进行访问 So th
opencl
如何通过 IDE(Netbeans、Eclipse)中的 optirun (Bumblebee) 运行使用图形驱动程序的构建?
有谁知道如何通过在IDE中调用optirun bumblebee 来使eclipse或netbeans使用optimus笔记本电脑中的显卡 以便只需使用IDE中的运行按钮即可在IDE中的显卡中运行程序 以最简单的形式 我只希望 IDE 执行
eclipse
netbeans
opencl
videocard
什么是银行冲突? (进行Cuda/OpenCL编程)
我一直在阅读 CUDA 和 OpenCL 的编程指南 但我无法弄清楚银行冲突是什么 他们只是深入研究如何解决问题 而不详细说明主题本身 有人能帮我理解吗 如果帮助是在 CUDA OpenCL 的背景下 或者只是计算机科学中一般的银行冲突 我
Multithreading
CUDA
opencl
NVIDIA
bankconflict
«
1 ...
3
4
5
6
7
8
9
»