动画来自here https://github.com/vdumoulin/conv_arithmetic。我想知道为什么扩张卷积声称可以保持分辨率。显然,蓝色的输入是 7x7,绿色的输出是 3x3。
EDIT:
解决分辨率损失的一种方法是用当前感受野大小的大约一半来填充输入,但是
- 这本质上破坏了扩张卷积不会失去分辨率的说法,因为它是保留分辨率的填充。为了获得与输入相同的输出大小,传统的卷积需要更少的填充。
- 由于填充呈指数级增长,相对不小的膨胀因子将导致输入图像被大量填充。想象一下 1024x1024 输入经过 10 倍膨胀,它将变成大约 2048x2048(如果我错了,请告诉我)。这是原始大小的 4 倍,这意味着大部分卷积是在填充区域而不是真实输入上完成的。就我个人而言,这对我来说似乎非常违反直觉。
这确实是一个带有 5x5 滤波器的扩张卷积。如果您将动画的蓝色部分想象为 0 填充的 3x3 图像,它会保留分辨率。
关于您的编辑,重点实际上在于您链接的帖子中的这一声明:扩张卷积支持感受野的指数扩展,而不会损失分辨率或覆盖范围
进行填充是为了保持分辨率。那是对的。
我们真正想要的是扩大感受野的大小。在您链接的文章中,通过 3 个 3x3 扩张卷积以不断增加的扩张,我们已经在特征图中实现了 15x15 的感受野。
为了达到与 3x3 卷积相同的效果没有失去承保范围 and 没有分辨率损失,我们可以用 3 的步幅(4 会导致覆盖范围的损失)和极重的填充(就像你所说的那样,用大部分填充的零进行卷积)来完成。然而,我们需要 4 个 3x3 卷积,步长为 3 而不是 3,才能实现 15x15 的感受野。
最重要的是,与扩张卷积情况相比,正常卷积会具有更多没有意义的卷积。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)