还有半个月就要过年啦,提前给大伙拜个年哈哈,快放假了又进入了划水的阶段啥都不太想干,但是就算是划水也不能中断思考啊,谁让咱是搞技术的呢,过去的几个月里把语义分割,目标检测和图像分类都稍微了解了一下,因为是入门阶段所以聊得东西都比较简单,这篇博客就聊一聊这几个任务在全连接层上的不同。
首先讲一下图像分类,我们都知道分类是所有深度学习任务的基础,就拿vgg16这个网络打个比方,当输入图像的crop_size是227的时候,batchsize是32,fc6层的output是4096时,那么fc6层的输出向量纬度是4906*512*7*7,512是pool5层的输出向量纬度,就是输出了512个特征图每个特征图的大小是7*7.
再讲一下目标检测,就以faster rcnn为例子,faster rcnn先检测出最优的300个目标窗口,然后fc层就将这300个目标作为300个图像再进行图像分类。
最后讲一下语义分割,比如说deeplab和FCN语义分割呢是像素级别的分割,简单说就是将每一个像素作为一个图像进行分类。
就先这样啦,再有多的理解再补充