我在主机代码中使用 cuFFT 库调用,它们工作正常,但我想从内核调用 cuFFT 库。早期版本的 CUDA 没有这种支持,但是有了动态并行性,这可能吗?
如果有任何关于如何实现这一目标的示例,那就太好了。
尽管在 Kepler (cc 3.5) 卡上引入了动态并行性,但 cuFFT 仍然是一个主机 API,目前无法使用 cuFFT 在设备代码中创建或执行 FFT 运算。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)