nvcc -V
nvidia-smi
vim ~/.bashrc # 在最后一行加上 export TORCH_CUDA_ARCH_LIST="8.0"
# 历史版本会给出conda安装和pip安装 conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=11.0 -c pytorch # 建议用pip安装,但是会出现超时,还有可能会出现没有这个版本的问题 pip install torch==1.7.0+cu110 torchvision==0.8.0+cu110 torchaudio==0.7.0 -f https://download.pytorch.org/whl/torch_stable.html # 最后运行了上面的命令,但是出现了超时错误,从网上找到相关的包,然后上传到服务器上,下面是安装命令 pip install ./torchaudio-0.7.0-cp37-cp37m-manylinux1_x86_64.whl -i https://mirrors.aliyun.com/pypi/simple/
# 可能有疑问,为啥torch1.7.1,我也不清楚为啥,CPU版本很多包都没有,只有这个能安装成功,可能小版本没有影响吧 pip install torch==1.7.1+cpu torchvision==0.8.2+cpu torchaudio==0.7.0 -f https://download.pytorch.org/whl/torch_stable.html
# 服务器上安装 git clone https://github.com/NVIDIA/apex cd apex # 会经过漫长等待,因为要编译,最后会安装成功 pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
# 这个参数就是添加的,如果不加--mask_entity默认值就是False,如果加上值就变成True parser.add_argument('--mask_entity', action='store_true',)
补充问题:包的问题,一般从网上下载的代码,一般都可能会有包依赖问题,就是package包引入的时候会报错,所以一定不要建和项目相同的文件夹,直接从git上clone下来,或者就copy到一个空闲的目录下