cuda提供强大的矩阵计算库cuBlas,但cuBlas没法进行特征值、逆矩阵等高级的运算,要解决这个问题,要么自己写算法(太难),要么调用线性代数运算库,而线性代数运算库中Eigen是最简便易用的一个。
当我想把这两个库放在一起编译的时候,出现了严重问题:用VS编译无法通过!!!
用google查了一下,似乎不少人都遇到过这个问题,对于linux系统,这个问题是可以解决的,gcc4.7 以上是可以解决这个问题的(参看http://eigen.tuxfamily.org/dox-devel/TopicCUDA.html,需翻墙)
但对于windows的vs,这个问题暂时无解。
后来看有人提出一个解决思路,就是把Host部分的代码和Device部分的代码分开编译。原因是:eigen库的语法过于复杂,以至于cuda的编译器无法解析。分开编译的话,两部分代码使用不同的编译器,就解决了这个问题,然后封装一些接口,解决两个部分相互调用的问题。但文中只是提供了一个思路,没有讲具体实现方法。(参看http://stackoverflow.com/questions/21216359/member-has-already-been-declared-error-with-cuda-and-eigen)
我马上学习了编译多个源文件的知识,进行尝试,终于解决cuda与Eigen不兼容的问题。
我的解决思路是这样的:
把程序的主体部分(包括Eigen)都放在.cpp下。
把cuda需要用到的代码放在.cu下。
在vs中,project->add new item ,将上面那个.cpp文件添加进去
在.cpp文件和.cu中都声明一个命名空间 cuda_functions,将接口函数的声明放进去,然后这些函数在.cu文件中实现,例如:
<cuda_functions.h>
namespace cuda_functions{
void malloc(void ** p, size_t size);//cudaMalloc的接口函数
void free(void * p);//cudaFree的接口函数
};
<test.cu>
#include <cuda_runtime.h>
#include "cublas_v2.h"
#include "cuda_functions.h"
void cuda_functions::malloc(void ** p,size_t s){//实现接口函数cudaMalloc
cudaMalloc(p,s);
};
void cuda_functions::free(void * p){//实现接口函数cudaFree
cudaFree(p);
};
<test.cpp>
#include <iostream>
#include <Eigen/Dense>
using namespace Eigen;
using namespace std;
#include "cuda_functions.h"
void main(){
float * p;
cuda_functions::malloc((void **)& p,sizeof(float)*10000);
cuda_functions::free((void *) p);
while(1);
}
上面这段代码实现在.cpp文件中,开辟和释放显存空间。