错误记录:
在使用GPU跑程序时,前面加载数据是没问题的,后面relu()开始报错,错误为:
RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)
多处参考解决方案,发现应该是CUDA、torch、torchvision、python等版本兼容问题。这里给出各版本官方对应图:
官方链接:https://pytorch.org/get-started/previous-versions/
问题解决:
按照图上方法去完成对环境的配置:
① 使用conda下载相关库:
官方链接:https://pytorch.org/get-started/previous-versions/
#例如
conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0 -c pytorch
pytorch: pytorch版本号为1.2.0
torchvision: torchvision版本号为0.4.0
cudatoolkit: cuda工具版本号为10.0
注!如果大家使用的是清华源无法对软件包进行下载的话,可以把官方源加入到软件源中,方法自行搜索。
提醒:这里不推荐CUDA安装最新版本跑程序,由于版本过于新,导致许多程序不支持,或者兼容性差的问题。
② 使用pip下载相关库:
官方链接:https://pytorch.org/get-started/previous-versions/
#例如:
pip install torch==1.2.0 torchvision==0.4.0
pytorch: pytorch版本号为1.2.0
torchvision: torchvision版本号为0.4.0
③ 如果觉得使用命令慢的话,可以使用离线安装下载相关库文件:
链接:https://download.pytorch.org/whl/torch_stable.html
cu101: CUDA版本10.1
torch-1.4: torch版本1.4.0
cp37: python版本3.7
按照这个安装自己的对应版本。
可以使用命令:
pip install torch-1.4.0-cp37-cp37m-linux_x86_64.whl
也可以通过其他下载软件下载文件,后本地安装:
如:https://download.pytorch.org/whl/cu101/torch-1.4.0-cp37-cp37m-linux_x86_64.whl 在迅雷或者浏览器下载;
本地安装命令:
pip install torch-1.4.0-cp37-cp37m-linux_x86_64.whl 自己存放的路径
最后,一定要注意版本之间的搭配,不同版本会导致代码报错和不兼容,引发各种问题!!!
有问题可以在评论区留言,看到将会及时解决!谢谢。