Caffe 快照:.solverstate 与 .caffemodel

2024-02-17

训练网络时,每 N 次迭代拍摄的快照有两种形式。一个是 .solverstate 文件,我想它就像它听起来的那样,存储损失函数和梯度的状态等。另一个是 .caffemodel 文件,我知道它存储训练后的参数。

如果您想要预训练的模型,.caffemodel 是您需要的文件,所以我想如果您要测试网络,它也是您需要的文件。

.solverstate 有什么用?在本教程 http://caffe.berkeleyvision.org/gathered/examples/imagenet.html#resume-training看起来您可以从中重新开始训练,但这与使用 .caffemodel 有什么不同? .solverstate 是否也包含与 .caffemodel 相同的信息?换句话说,.caffemodel 只是 .solverstate 的子集吗?


顾名思义,solverstate 文件存储求解器的状态,而不存储与分类结果相关的任何信息。该模型保存为 caffemodel 文件,您可以使用它来获取数据的分类结果。如果您想微调网络,您可以使用预先训练的 caffemodel 文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果您当前的训练由于断电或意外重启而需要停止,您可以从解算器状态的先前快照恢复训练。使用solverstate和caffemodel文件之间的区别在于,前者允许您以预先确定的方式完成训练,而后者可能需要更改某些训练参数,例如最大迭代次数。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Caffe 快照:.solverstate 与 .caffemodel 的相关文章

随机推荐