卷积神经网络(Convolutional Neural Network,简称CNN),是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理。卷积神经网络包括卷积层和池化层。 在影像处理中,一张图片会被处理成三维矩阵(图片的长宽和3(RGB3中颜色))
对于影像辨识的类神经网络的神经来说,一般是根据图片的特征来判断图片的内容(就像下面中发现了鸟嘴,鸟的眼睛和脚可以判断这是一只鸟的图片) 我们设置一个神经元来观察局部范围的图片,该神经元将这个333矩阵的向量变成一个长的向量输入到这个神经元中,将该输出送入下一层的神经元。这个局部范围的大小由自己决定,多个神经元可以重叠,同一个范围可以由多个神经元(一般一个范围有一组神经元)。 一般情况下范围会被设置成333,设置俩个范围之间的重叠间隔stride(可以自己设置),图片不够的地方可以padding(补值),不断的扫过图片的每一个角落。通过这种方法来寻找图片的特点。 因为同一种类型的图片中,不同的图片特点位置不在同一个地方,而我们未每个范围区域都配置了一组神经元,用来监测在该范围内是否出现特点部位,所以每组神经元都有共享的参数(不同范围的神经元的参数的对应相同的)。