最近由于电脑配置和经济的问题,想训练模型,无奈只能选择在平台上训练了,我使用的是AutoDL这个平台,感觉还行,还是挺划算,感兴趣或者需要的老铁可以点击蓝色字体进去尝试一下。接下来我把近期遇到的情况记录一下,因为我是第一次在平台上跑代码,所以花了好久才运行起来。
我是用的平台镜像的系统,选择的框架的还是pytorch1.7,(为了和Libtorch对应),接下来会让你选择python,然后是CUDA。这都是很正常的一些步骤,一般不会出现叉子。
我们把训练的数据集上传到服务器之后就可以开始在终端里面训练我们自己的模型了。
先用cd 切换到train.py所在的目录,然后是参数的配置,yaml文件中的参数,我上一篇文章记载了具体怎么配置的。这里一定要注意yaml文件的路径,我被它坑了好久,气死人。
配置好之后就可以正常运行了,如果报缺少xxx,那就用pip install+xxx下载,一直到它不再报错为止喽。
如果所有的文件都下载了,但是还是报下边的这个错误:
load() missing 1 required positional argument: 'Loader'
那就是yaml这个库的版本过高,要把版本降下来,pip install pyyaml==5.4.1
,我使用的是这个版本的,然后就可以运行了,高兴!
注意:一定要把所有的路径给找好,要以train.py文件所在的路径为起点,该向下找的向下找,该向上找的向上找。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)