我知道如何生成.ptx
文件来自.cu
以及如何生成.cubin
文件来自.ptx.
但我不知道如何获得最终的可执行文件。
更具体地说,我有一个sample.cu
文件,编译为sample.ptx
。然后我使用 nvcc 来编译sample.ptx
to sample.cubin
。然而,这.cubin
如果没有主机代码,文件无法直接执行。我怎样才能链接.cubin
文件到我原来的.cu
文件来生成最终的可执行文件?
您应该能够使用 cuModuleLoadDataEx 直接从 cuda 驱动程序 api 运行 ptx 代码。有一个例子here http://developer.download.nvidia.com/compute/cuda/3_0/docs/NVIDIA_FermiCompatibilityGuide.pdf第 5 页
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)