使用在Cuda出现访问冲突问题(opengcl正常):
af::convolve(I * I, kernel);
报错:
0x00007FFC6443ADAC (af.dll)处(位于 XXXX.exe 中)引发的异常: 0xC0000005: 读取位置 0xFFFFFFFFFFFFFFFF 时发生访问冲突
官方解释:
我之前说的是对的,CUDA后端对二维空间卷积有以下限制:
只允许使用 5 到 17 号的方形内核/过滤器
非方形内核/过滤器在任何维度上最多可以有 5 个大小
我认为这些是基于共享内存使用和性能问题决定的。
我建议您选择此类尺寸的频域。
注意:
opengcl不受此限制,但不能使用cuda加速了
参考网站:
Issues · arrayfire/arrayfire · GitHub
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)