卷积神经网络详解

2023-11-08

卷积神经网络(Convolutional Neural Networks, CNN)是应用最多、研究最广的一种神经网络，卷积神经网络（以下简称CNN）主要用于图片分类，自动标注以及产品推荐系统中。以CNN实现图片分类为例，图像经过多个卷积层、池化层复合而成的组件后，实现图像降维并提取到主要特征，最后再利用全连接神经网络实现分类，一个完整CNN实现识别图像的示意图如下：

将一个矩阵用其中元素最大值或平均值代替称为下采样，在CNN中称为数据池化，池化可以有效地实现数据降维；相反从池化后结果再将数据还原称为上采样，CNN实现反向传播时需要先上采样后求参数梯度。CNN的核心是卷积运算，卷积操作可以提取图像不同的特征，当然一个图像的特征有很多，模型后端的全连接神经网络往往以交叉熵作为损失函数，通过交叉熵反馈过来信息，CNN可以调整卷积参数，找到最适合分类的特征数据。

一、卷积神经网络前向传播

1.1 卷积层

卷积常用卷积.png 表示，根据数据连续与否型分为积分和离散两种形式，积分形式：

积分形式.png ①

离散形式：

离散形式.png ②

公式①和②很难对卷积有一个感性的认识，通常介绍卷积时都会以信号处理为例，如下图f(t)是一串输入信号，自变量t代表时间，g(t)称之为系统响应，下图中g(t)代表信号的随时间衰减过程，信号在t=0时信号在t=20后大小为f(0)*g(20),而t=20时信号输出为f(20)*g(0)，显然在t=20时，t=0的信号已经衰减的差不多了。

信号.jpg

如果想知道任意一个时刻信号的输出，比如t=10时，信号输出是t=0,1,2,3...10各个输入信号f(t)与g(t)作用汇总后的一个数值，输出信号out可表示为：

信号输出.png

上式对应公式②，即离散形式的卷积公式，上式计算过程可用下图来表示：

卷积过程1.jpg

上图中变量间对应关系有些扭曲，更多时候上图也转化为下图更为形象：

卷积过程3.jpg

利用卷积运算CNN可实现数据降维：上面的例子中输入信号f(t)是一个向量，通过卷积运算汇总变为一个常量，当输入信号改变，系统响应函数g(t)不变时，不同信号与g(t)卷积后都变成为一个实数，以上图为例，在T=10时可以想象有一面墙，不同输入信号卷积后映射在T=10墙体的不同高度上。

映射1.png

不同高度代表不同输入信号在g(t)下有不同的特性，通过卷积实现了信号的特性分离。在人工智能算法中常将复杂的数据处理成单一的实数，比如利用范数可以把矩阵变为一个实数，利用内积把两个向量距离变为一个实数，泛函分析中将求一个线性算子范数等。CNN处理图像时，上述的信号f(t)可引申为二维像素值，g(t)在CNN中称为卷积核，典型的卷积操作如下图所示：

卷积1.jpg

下图是一个卷积的动态过程：

卷积过程.gif

上面原图是灰度图，只有黑白两色，而彩色图像由三原色构成，二维图像在任意一个点像素为立体三层结构，分别是红色、绿色、蓝色值，该值的范围在0∽255之间，在计算机里用一个无符号的8位数表示，有三层结构彩色图像通常也称为通道数为三层，当输入图为一张3通道彩图时，也可以理解为输入3张二维图，每个二维图通道数是1，所以在CNN里‘通道数’与输入、输出时单通道图片的个数等效。下面展示是对一个三层通道彩色图像卷积过程，这个卷积过程使用了2个卷积核，用于提取图像特定的2个特征，由于图像通道数是3所以每个卷积核也是3层结构。

前面介绍了卷积可以实现降维，接下来介绍卷积如何提取图像或信号特征，图像处理中常利用二阶导数来检测图像的边缘，二维图像可以看成一个二元函数f(x,y),x和y代表像素行坐标与列坐标，函数值代表该点的像素值。在图像的边缘处一般会有颜色交替，表现为函数值一个剧烈变化，函数图如下：

边界1.png

上图a前半段曲线的导数逐渐增大，在红色圆圈处导数开始变小，同时在该点导数值最大，图b显示像素值导数变化，顶端的拐点对应图a中红色标记，再对图b的函数求导即得到原图像的二阶导数如下图：

边界2.png

以上分析可以得出一个结论，在图像的边缘处二阶导数等于0，可以利用这个特性检测图像的边缘：首先生成一张与原图像大小一样的纯黑色图（函数值为0），然后计算每点的二阶导数并与黑色像素值相加得到一个新图片，新图片任意一点像素函数用g(x,y)表示：

g(x,y)=0+▽2f(x,y)=▽2f(x,y)

上式中▽2f(x,y)代表原图像函数的二阶导数，长*宽的二维图像可通过张量操作变成一个1*（长*宽）一维图形向量，接下来通过一维图像可推导出图像的二阶导数，一维图像导数为：

一阶导数.png

由此可以得到二阶导数：

二阶导数.png

f(x+2)与f(x)中间隔了一个像素，我们希望用f(x)附近的像素来近似计算f(x)的二阶导数，上式位置参数x+2，x+1，x都顺次减一个位置可得到二阶导数近似等式（临近像素颜色值很相似，可以这样近似）：

二阶导数约定式.png ⑤

由⑤可得到二维图像的二阶导数：

二维图像二阶导数.png (5.1)

上式可以写成：

尔尔卷积.png

系数为0的4项：f(x-1,y-1)、f(x+1,y-1)、f(x-1,y+1)、f(x+1,y+1)分别代表f(x,y)45°方向的像素，上式代表图像与下面的卷积核做卷积运算：

拉普拉斯算子.png

这个卷积核也称为拉普拉斯算子，根据上面的推导，用一段代码演示利用拉普拉斯算子卷积得到图像边缘的代码。

import os
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
#转化为灰度图
def rgb2gray(rgb):
  return np.dot(rgb[:,:,:3], [0.299, 0.587, 0.114])


def LaplaceConvolution( ):
    img = Image.open('dataset/grass.jpg')
    img = np.array(img)
    grayimg = rgb2gray(img)
    r, c = grayimg.shape
    new_image = np.zeros((r, c))
    #拉普拉斯算子
    L_sunnzi =np.array([[0,1,0],[1,-4,1],[0,1,0]]) 
    for i in range(r-2):
        for j in range(c-2):
            #公式5.1:利用拉普拉斯算子做卷积运算
            #abs取绝对值模拟Relu函数，可得到非线性输出效果
            new_image[i+1, j+1]  =    abs(np.sum(grayimg[i:i+3, j:j+3] * L_sunnzi))
    new_image=np.uint8(new_image)
    plt.subplot(211)
    plt.imshow(grayimg, cmap='Greys_r')
    plt.subplot(212)
    plt.imshow(new_image, cmap='Greys_r')
    plt.show()
if __name__=='__main__':
    img=LaplaceConvolution(  )

卷积前后的图像效果如下：

边缘.png

上面这个例子说明通过卷积可以获得图像的某些特征，CNN会利用多个卷积核来获得图像的多个特征，多个卷积核也称为一组滤波器。上面例子中卷积核是一个矩阵，为什么不叫卷积矩阵呢？'核'是一个立体结构，在CNN中，假设输入特征图高为H，宽度为W，通道数是C;卷积核的高为FH，宽度为FW，卷积核通道数也是C，即卷积核是一个立体结构，由C个权重矩阵复合而成，C个权重矩阵会和输入C个图全部或部分卷积相加后，得到一张通道为1的新的特征图，过程如下图：

卷积核1.jpg

卷积需要注意两点：

1) 由于存在激活函数和Dropout机制,有些卷积核权重矩阵并没有被激活，所以卷积核会与上层输入C个图像部分卷积而不是全部。

2) 无论输入图片通道数是多少，卷积后每个特征图通道数都是1，卷积后的每个特征图带有所有或部分上层输入图的特征信息，且输出特征图的个数与卷积核个数相关，有几个卷积核就有几个输出图，称输出特征图的个数为卷积层的通道数、或卷积核的个数，这两个都是一个概念。

当有多个卷积核时卷积层输出图也是一个立体结构，下图卷积层有FN个卷积核,输出图像维度是OW*OH*FN，需要注意的是上层特征图与卷积核卷积后一般会加上一个偏置项，而每个卷积核偏置项都是一样的，即有FN个卷积核同时就有FN个偏置项：

卷积核2.jpg

1.2 池化层

池化(pooling)层是将卷积后的特征图进一步降维、缩小特征图尺寸，池化后对信息是虽然有损失的，但也保证了模型有较好的拟合能力，常见池化示意图如下：

池化过程.png

常用池化手段有最大池化法(Max pooling)、平均池化法(Average pooling),最大池化法取池化窗口内最大值作为输出，过程如下图所示：

最大池化法.jpg

上图最大值池化法池化窗口为2*2,步长为2，平均池化法则取池化窗口内平均值作为输出。需要注意：当使用最大池化法时要同时记下池化窗口内最大值的位置，在反向传播时，最大值处有相应的梯度值，而在非最大值出梯度为0；另外，池化层没有使用激活函数，池化层输入等于输出。

二、卷积神经网络的反向传播

卷积神经网络概念最早在80年代就由日本学者福岛邦彦提出，当时借鉴了动物的视觉皮层命名为neocognitron，早期的卷积神经网络并未引入局部感受野、权值共享、反向传播等理念，导致卷积神经网络在识别率上一度被SVM这类感知机吊打，直到Yann LeCun引入现代神经网络技术后CNN才实现了与人类不相上下的识别率,了解CNN反向传播有助于了解其他衍生的卷积神经网络模型如ResNet、GooLeNet、AlexNet等。

CNN与全连接神经网络一样，损失函数的误差在层与层之间传递，在接下来的章节中还会了解到，有些神经网络模型如循环神经网络(RNN),长短时记忆网络(LSTM)不仅有层与层之间的误差传递，还有时间维度上的误差。CNN卷积过程也可以表达成全连接神经网络类似的方式，下图是三个特征图经过两个卷积核滤波的情形，与全连接神经网络区别是下图中连线代表卷积，每个连线上式卷积核中对应的一个权重矩阵：

卷积神经网络全连接神经网络.jpg

反向传播时，假设目前层为l,该层的输入为zl,输出为al,两者关系为：al=σ(zl),σ表示为激活函数，CNN在卷积层常用的激活函数是Relu函数，在之前介绍过：Relu(x)=max{0,x},当x大于0时，Relu函数的导数为1。在神经网络的反向传播中，利用链式法则求任意一层的误差时，需要一直定位到该层的输入端，用公式可表达为：

层误差.png

上式中C代表损失函数，在分类问题中常用softmax函数实现的交叉熵作为损失函数，接下来分三种情况讨论CNN的反向传播。

余下文章请转至链接：CNN卷积神经网络详解

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

卷积神经网络详解的相关文章

【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
利用CHAT上传文件的操作

问CHAT autox js ui 上传框 CHAT回复上传文件的操作如果是在应用界面中的话由于Android对于文件权限的限制你可能不能直接模拟点击选择文件一般来说有两种常见的解决方案一种是使用intent来模拟发送一个文件路径
打造完美人像，PixCake像素蛋糕助您一键修图

您是否曾经为自己的人像照片需要进行繁琐的修图而感到困扰是否曾经想要打造出完美的自拍照却不知道该如何下手现在我们为您推荐一款强大的人像处理技术修图软件 PixCake像素蛋糕 PixCake像素蛋糕是一款基于AI人像处理技术的修图软件
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
多模态、长文本、智能体，智谱AI推出GLM-4模型全家桶，发布即上线！

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 2024年01月16日智谱AI首届技术开放日 Zhipu DevDay 在北京中关村国家自主创新示范区展示中心成功举办现场智谱AI团队全面展示了其投身于大模型事业三年多来所
毕业设计：基于卷积神经网络的验证码识别系统机器视觉人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 字符分割算法 2 2 深度学习三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
手把手教你用 Stable Diffusion 写好提示词

Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好前面文章写了一篇文章一份保姆级的 Stable Diffusion
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
AI 赋能绿色制冷，香港岭南大学开发 DEMMFL 模型进行建筑冷负荷预测

近年来城市化进程加速所带来的碳排放量骤增已经严重威胁到了全球环境多个国家均已给出了碳达峰碳中和的明确时间点一场覆盖全球全行业的绿色革命已经拉开序幕在一众行业中建筑是当之无愧的能耗大户其中又以暖通空调 Heating

随机推荐

typescript, javascript, 字符串固定位置插入字符

js和ts里连个字符串插入方法都没有难受这个参考了python中index可以是负数从后向前数的思想自己写了一个字符串插入函数自己确认插入位置若位置不对会抛出异常 param string src 原字符串 param numb
Kotlin 1.3 终于正式发布，带来了稳定的 Coroutines、beta版本的Kotlin/Native

Kotlin 官网 https kotlinlang org Github 地址 https github com JetBrains kotlin 此次版本更新包括 Coroutines 的正式发布 Kotlin Native Beta
js中every用法_JS中every()和some()的用法

every 与some 方法都是JS中数组的迭代方法 every 是对数组中每一项运行给定函数如果该函数对每一项返回true 则返回true some 是对数组中每一项运行给定函数如果该函数对任一项返回true 则返回true func
44. 日志管理之systemd日志,持久化设置,journal,systemd-journald,查看日志(journalctl)

Systemd 统一管理所有 Unit 的启动日志可以只用journalctl一个命令查看所有相关日志内核日志和应用日志日志的配置文件是 etc systemd journald conf 文章目录持久化systemd日志查看日
时序预测

时序预测 MATLAB实现时间序列回归之似然检验目录时序预测 MATLAB实现时间序列回归之似然检验基本介绍程序设计学习小结参考资料基本介绍使用 CNLM 假设制定的 t 和 F 检验版本可以在创新分布偏离规范的各种情况下提
【mcuclub】压力检测模块-XGZP6847

一实物图型号 XGZP6847 二原理图编号名称功能 1 NC 空置 2 VDD 电源正 3 GND 电源地 4 VDD 电源正 5 OUT 信号引脚输出的是模拟量 6 GND 电源地三简介 XGZP6847型压力传感器是
Spyder预测标签和真实标签以Mat格式输出（待续）

1 需求需要将Spyder里面的预测标签和真实标签输出并保存为Mat格式以通过Matlab生成混淆矩阵为什么要用Matlab生成混淆矩阵呢 python不是也是可以的吗 import pandas as pd import torc
【《程序员的自我修养---链接装载于库》读书笔记】可执行文件的装载与进程

系列文章目录程序员的自我修养链接装载于库读书笔记初探ELF 程序员的自我修养链接装载于库读书笔记 windows PE COFF 程序员的自我修养链接装载于库读书笔记可执行文件的装载与进程文章目录系列文章目录前言 6
为什么TCP建立连接要求发送方和接收方的初始化序列号不一样的呢？

前几天有位读者问我为什么 TCP 建立连接需要三次握手文章中一个问题就是他不明白序列号解决了数据包的缺失和顺序颠倒等问题但为什么要求发送方和接收方的初始序列号不一样后来我跟他交流半个小时终于把他讲明白了我觉得应该有不少人会有以
postman之在tests断言中使用for循环断言和断言空

一 tests断言中使用for循环断言 1 在使用postman判断过程中想要实现这么一个场景的判断因为banner位置的配置是多变的可以不配置可以配置一个也可以配置多个在接口检测判断过程中想要通过for循环对banner列表中
Ubuntu安装了python3.8和python3.7，安装numpy时出现问题

环境 Ubuntu20 04 由于目前PySpark只支持python3 7及以下的版本而Ubuntu20 04自带的python3是python3 8 5 于是我安装了python3 7 9 且没有改动默认的python版本千万别改
接口测试的维度

在 Python自动化测试实战的书籍里面系统的介绍了基于Python语言的接口自动化测试实战和基于Python语言的UI自动化测试实战特别是接口测试部分详细的介绍了HTTP的协议原理序列化与反序列化主流测试工具 Postman和J
2020CCPC河南省赛发通知（离散+差分）

学院一共有 n 位学生用 1 编号每天学院都会派遣辅导员给学生发送若干通知以保证各项措施活动消息得到落实现在学院要求辅导员发送一条关于光盘行动的通知对于通知信息同学们的反应往往各不相同辅导员预测出第 i 号学生收到通知后
vue面试题——v-if 和v-show的区别

面试前端时涉及到vue v if和v show几乎是必问的一道题所以记录一下首先我们先来看一段代码
iwconfig查看网卡 ifconfig查看ip /etc/init.d/ssh restart

iwconfig查看网卡 ifconfig查看ip etc init d ssh restart 开启ssh服务 1 查看是否有sshd config cat etc ssh sshd config 查看是否有sshd config文件 2
python二级练习软件（90%原题）题库、三天速成。

刷题软件文末有联系方式注明来意我发现大家对考Python计算机二级都比较感兴趣也有一些疑问对于考证这个问题我简单说一下我的经验 python二级其实很容易通过考试题题库是前九年真题加一套新题你会遇到90 的原题只要考前三天练
linux下搭建SVN遇到authentication failed问题的解决方法

之前由于要管理项目组的文档所以就想在linux下搭建一个svn平台于是我就在网上找资料并按照步骤搭建了一个SVN 结果老是出现一个authentication failed的错误经过一个下午的努力终于让我找出了错误的原因一个非常
微信小程序实例源码大全下载

小程序QQ交流群 131894955 小程序开发直播腾讯课堂 https edu csdn net course detail 6743 微信小程序实例源码大全下载微信小应用示例代码 phodal weapp quick 源码链接 htt
避免Django重复提交表单，ERR_cache_miss错误

在做项目时遇到这个问题首页设置为登录页login html 登录后跳转至工具页tool html 使用django自带的会话及身份验证中间件自己认为的应该没问题但总报标题所述错误折腾了半天终于解决这里记录一下我的urls p
卷积神经网络详解

卷积神经网络 Convolutional Neural Networks CNN 是应用最多研究最广的一种神经网络卷积神经网络以下简称CNN 主要用于图片分类自动标注以及产品推荐系统中以CNN实现图片分类为例图像经过多个卷积层

卷积神经网络详解

卷积神经网络详解 的相关文章

随机推荐

热门标签

卷积神经网络详解的相关文章