图像分类与基础视觉模型
卷积神经网络
AlexNet(2012)
- 第一个成功实现大规模图像的模型,在 ImagNet 数据集上达到 ~85% 的 top-5 的准确率
- 5 个卷积层,3 个全连接层,共有 60M 个可学习参数
- 使用 ReLU 激活函数,大幅提高收敛速度
- 实现并开源了 cuda-convnet ,在 GPU 上训练大规模神经网络在工程上成为可能。
Going Deeper(2012~2014)
VGG(2014)
将大尺寸的卷积拆解为多层 3×3 的卷积
相同的感受野、更少的参数量、更多的层数和表达能力
GoogLeNet(Inception v1,2014)
精度退化问题
模型层数增加到一定程度后,分类正确率不增反降
实验的反直觉
猜想:虽然深层网络有潜力达到更高的精度,但常规的优化算法难以找到这个更优的模型。即,让新增加的卷积层拟合一个近似恒等映射,恰好可以让浅层网络变好一点。
残差学习的基本思路
残差网络ResNet(2015)
ResNet 中的两种残差模块
ResNet 是深浅模型的集成
等同于多模型集成残差网络有
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)