一维卷积（1D-CNN）、二维卷积（2D-CNN）、三维卷积（3D-CNN）

2023-10-27

一维卷积神经网络（1D-CNN）

一维卷积常用在序列模型、自然语言处理领域；

假设输入数据维度为8，filter维度为5；

不加padding时，输出维度为4，如果filter的数量为16，那么输出数据的shape就是 $4\times16$ ；

二维卷积神经网络（2D-CNN）

二维卷积常用在计算机视觉、图像处理领域（在视频的处理中，是对每一帧图像分别利用CNN来进行识别，没有考虑时间维度的信息）；

假设原始图像 shape 为 $14\times14\times3$ （其中3为3个通道），使用32个大小为 $5\times5\times3$ （其中3为深度，与通道数相同）的卷积核对其进行卷积，得到特征图的shape为 $10\times10\times32$ ；

三维卷积神经网络（3D-CNN）

在神经网络的输入中增加时间这个维度（连续帧），神经网络就可以同时提取时间和空间特征，进行行为识别、视频处理；

比如：对3幅连续帧用三维卷积核进行卷积，可以理解为用3个不同的二维卷积核（二维卷积神经网络中使用的卷积核）卷积3张图，并将卷积结果相加（通过这种处理，网络就提取了时间之间的某种相关性）；

三维卷积神经网络的训练和卷积神经网络的训练方式相同；参考：深度网络的训练过程与方法

在文献《3D Convolutional Neural Networks for Human Action Recognition》中三维卷积与二维卷积的对比图如下：

上图的三维卷积是对连续的三帧图像进行卷积操作（堆叠多个连续帧组成一个立方体，在立方体中利用三维卷积核进行卷积，这样得到的每个特征map都与上一层中3个邻近的连续帧相连）；

三维卷积神经网络架构如下图：

input：7张大小为 $60\times40$ 的连续帧；

hardwired，H1：通过设定的hardwired kernels获得5种特征（灰度、x方向梯度、y方向梯度、x方向光流、y方向光流），前三个特征可以对每帧分别操作获得，光流则需要利用2帧信息获得，所以H1层特征map数量为7+7+7+6+6=33；

convolution C2：3D卷积核的大小为 $7\times7\times3$ （3为时间维度），即每次操作3帧图像，采用了2种不同的3D卷积核，增加了maps数量；

sub-sampling S3：按照图中降采样后maps数量保持不变，maps大小减半；

后面操作分析类似。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

一维卷积（1D-CNN）、二维卷积（2D-CNN）、三维卷积（3D-CNN）的相关文章

C++泛型显式实例化与显式具体化区别

显式实例化相当于通知编译器接下来我要使用这种数据类型的函数显示的通知编译器生成对应的模板以此和隐式的实例化相区别隐式的实例化通过实参的类型来控制编译器对于通用函数模板相应类型的生成而显式实例化为明文通知实际效果上两者似乎并无太大
MARKDOWN使用方式

这里写自定义目录标题欢迎使用Markdown编辑器红色字体空格新的改变功能快捷键合理的创建标题有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中居
Spring Data Redis中的事务陷阱

原文地址转载请注明出处 https blog csdn net qq 34021712 article details 79606551 王赛超之前spring整合redis开启事务在功能测试环境下跑了N天之后突然发现服务异常查看
pandas进阶修炼300题，全新上线！

大家好现在经过一个多月的整理全新的 pandas进阶修炼300题来了下面是一些介绍文末可以免费下载 01 全新目录新版pandas300题按照操作分为 10大章节每章均配有独立的真实数据每个操作的习题在20 40题左右

随机推荐

STM32 系统（SysTick）定时器实验

目录 SysTick 简介 SysTick 寄存器介绍 SysTick 定时时间计算 SysTick 定时实验实验结果 SysTick 简介 SysTick 系统定时器是属于 CM3 内核中的一个外设内嵌在 NVIC 中系统定时器是一
quartus ii 生成.rbf的文件

第一种方法点击device and pin options 勾选raw binary file 这样在全编译之后就会生成 rbf的文件在output fliles文件夹不过这个产生的rbf文件是经过压缩的文件在含ARM硬核的SoC
python中，用pyspark读写Hive数据

1 读Hive表数据 pyspark读取hive数据非常简单因为它有专门的接口来读取完全不需要像hbase那样需要做很多配置 pyspark提供的操作hive的接口使得程序可以直接使用SQL语句从hive里面查询需要的数据代码如下
【华为OD】

目录一题目描述二输入描述三输出描述示例一输入输出说明示例二输入输出说明示例三输入输出说明四 Java玩法一题目描述张兵和王武是五子棋迷工作之余经常切磋棋艺走了一会儿轮到张兵了他对着一条线思
编译器预定义宏

今天用MinGW http www mingw org 编译一个项目怎么也想不起来用哪一个宏来判断用的是mingw的gcc编译器不得以只好在头文件中搜索找了半天终于发现是 MINGW32 后来我就想有没有一个办法能把编译器的所有预定
MATLAB绘制二维和三维箭头

实践中发现MATLAB没有直接绘制箭头主要是二维的函数所以将自己绘制二维和三维箭头的解决方案和大家分享如有错误或更高效的方法请大家留言指教一 MATLAB绘制二维箭头测试例子 drawArrow 1 1 7 2 绘制二维箭头函数
使用OnScrollListener回调处理自动加载更多

使用OnScrollListener回调处理自动加载更多 http blog csdn net fancylovejava article details 39369753
【双系统】Windows10 查看电脑是UEFI+GPT还是Legacy+MBR模式的方法

具体查看方法如下 1 按下Win R组合键在运行窗口中输入cmd 点击确定 2 在弹出的窗口中输入diskpart 回车 3 在新弹出的窗口界面中输入list disk 回车 4 之后会显示下图的信息 Gpt下方如果有星号就表示是uefi
[1112]IDEA常用快捷键

文章目录 IDEA中常用的快捷键 IDEA 利用Generate快速生成构建java类 1 首先定义 java类的属性参数 2 右键 gt 选择 generate 3 出现 generate 面板 4 点击 construct 生成构造函
开放内测！百度正式发布中国版ChatGPT

最近 AI 真是火得没边了 OpenAI 靠着 ChatGPT 实力吸睛 Google 带着 Bard 紧随其后就在昨天 GPT 4 模型又抢尽风头你方唱罢我登场的 AI 领域今天轮到了百度了就在今天下午备受期待的百度文心一言如
聪明的人脸识别4——Pytorch 利用Retinaface+Facenet搭建人脸识别平台

睿智的目标检测51 Pytorch 利用Retinaface Facenet搭建人脸识别平台学习前言什么是Retinface和Facenet 1 Retinface 2 Facenet 整体实现代码实现流程一数据库的初始化二检
Linux系统时间同步（ntpdate/chrony/rdate）

2019独角兽企业重金招聘Python工程师标准 gt gt gt Linux下同步系统时间有rdate与ntpdate两种方法 chrony则是网络时间协议NTP的另一种实现先确认是否安装配置新服使用ntpdate同步系统时间不论是
适配器Adapter

1 意图将一个类的接口转换成客户希望的另外一个接口 Adapter模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作 2 结构类适配器结构图对象适配器结构图类适配器使用多重继承对一个接口与另一个接口进行匹配对象适配器依赖
点云的三角化重建

对点云数据进行三角化重建大致步骤程序先读取点云文件然后计算法向量并将法向量和点云坐标放在一起接着使用贪婪三角化投影算法进行重构最后显示结果由于获取的点云数据中常常伴有杂点或噪声影响了后续的处理因此为了获取完整的模型需要对点
适合于做服务器的操作系统有,适合于做服务器的操作系统有

适合于做服务器的操作系统有内容精选换一换镜像是一个包含了软件及必要配置的服务器或磁盘模版包含操作系统或业务数据还可以包含应用软件例如数据库软件和私有软件镜像分为公共镜像私有镜像共享镜像市场镜像镜像服务 Image
splay的认识，由画图开始

先说一下这个大神讲的蛮好的可以看看他的图哦可以跟着这个大佬的图来画我这里讲的是学习他的讲解之后的学习的方法以及一些笔记了然后就是自己对于splay的观点了初识splay是在寒假集训的时候但是压根就没听懂于是痛定思痛回家之后
学python需要注意什么-雷林鹏分享：学习python中的需要注意的几点事项

本文章向大家介绍数据库的DML与DQL语句主要包括数据库的DML与DQL语句使用实例应用技巧基本知识点总结和需要注意事项具有一定的参考价值需要的朋友可以参考一下 1 python 中的 and 从左到右计算表达式若所有值均为真
Android ApiDemos示例解析(79):Graphics->SensorTest

本例SensorTest和例子Android ApiDemos示例解析 61 Graphics gt Compass在绘图方面的介绍基本一样我也不知道为什么Google 再把这个SensorTest还是归在Graphics 目录下本例着
云环境openEuler 20.03 Arm 系统 GPGcheck 报错

云环境openEuler 20 03 Arm 系统 GPGcheck 报错最近在云上测试鲲鹏开发工具时遇到安装软件时报 GPG check Failed 的问题类似问题经测试后初步判断出现该问题的主要原因是华为云上 openEu
一维卷积（1D-CNN）、二维卷积（2D-CNN）、三维卷积（3D-CNN）

一维卷积神经网络 1D CNN 一维卷积常用在序列模型自然语言处理领域假设输入数据维度为8 filter维度为5 不加padding时输出维度为4 如果filter的数量为16 那么输出数据的shape就是二维卷积神经网络 2D C

热门标签