我有一个完全卷积神经网络 U-Net,可以在下面阅读。
https://arxiv.org/pdf/1505.04597.pdf https://arxiv.org/pdf/1505.04597.pdf
我想用它来对图像进行像素分类。我的训练图像有两种尺寸:512x512 和 768x768。我在初始步骤中在前者中使用大小为 (256,256,256,256) 的反射填充,在后者中使用大小为 (384,384,384,384) 的反射填充。我在卷积之前进行连续填充,以获得输入大小的输出。
但由于我的填充取决于图像/输入的大小,因此我无法构建通用模型(我正在使用 Torch)。
在这种情况下如何进行填充?
我是深度学习的新手,任何帮助都会很棒。谢谢。
您的模型将只接受第一层大小的图像。在将它们转发到网络之前,您必须对所有这些进行预处理。为此,您可以使用:
image.scale(img, width, height, 'bilinear')
img
将是按比例缩放的图像,width
and height
模型第一层的大小(如果我没记错的话是 572*572),'bilinear'
是用于缩放图像的算法。
请记住,可能需要提取图像的平均值或将其更改为 BGR(取决于模型的训练方式)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)