这个CUDA工程包括了三个文件,一个是makefile;一个是vector_add.cu,用于联系主机端与设备端;最后是vector_add_kernel.cu,这个就是设备端要执行的真正的CUDA程序。
首先看看makefile:
上述文件中指定了一个vector_add.cu作为要用nvcc编译的源文件,而生成的可执行文件名是zenny_basic。
下面看看vector_add_kernel.cu文件:
上述代码很清楚,是将vecA与vecB的元素相加后,将结果给outC。
下面看看vector_add.cu: