一维卷积(1D-CNN)、二维卷积(2D-CNN)、三维卷积(3D-CNN)

2023-10-27

一维卷积神经网络(1D-CNN)

一维卷积常用在序列模型、自然语言处理领域;

假设输入数据维度为8,filter维度为5;

不加padding时,输出维度为4,如果filter的数量为16,那么输出数据的shape就是4\times16


二维卷积神经网络(2D-CNN)

二维卷积常用在计算机视觉、图像处理领域(在视频的处理中,是对每一帧图像分别利用CNN来进行识别,没有考虑时间维度的信息);

假设原始图像 shape 为14\times14\times3(其中3为3个通道),使用32个大小为5\times5\times3(其中3为深度,与通道数相同)的卷积核对其进行卷积,得到特征图的shape为10\times10\times32


三维卷积神经网络(3D-CNN)

在神经网络的输入中增加时间这个维度(连续帧),神经网络就可以同时提取时间和空间特征,进行行为识别、视频处理

比如:对3幅连续帧用三维卷积核进行卷积,可以理解为用3个不同的二维卷积核(二维卷积神经网络中使用的卷积核)卷积3张图,并将卷积结果相加(通过这种处理,网络就提取了时间之间的某种相关性);

三维卷积神经网络的训练和卷积神经网络的训练方式相同;参考:深度网络的训练过程与方法

在文献《3D Convolutional Neural Networks for Human Action Recognition》中三维卷积与二维卷积的对比图如下:

  

上图的三维卷积是对连续的三帧图像进行卷积操作(堆叠多个连续帧组成一个立方体,在立方体中利用三维卷积核进行卷积,这样得到的每个特征map都与上一层中3个邻近的连续帧相连);

三维卷积神经网络架构如下图:

input:7张大小为60\times40的连续帧;

hardwired,H1:通过设定的hardwired kernels获得5种特征(灰度、x方向梯度、y方向梯度、x方向光流、y方向光流),前三个特征可以对每帧分别操作获得,光流则需要利用2帧信息获得,所以H1层特征map数量为7+7+7+6+6=33;

convolution C2:3D卷积核的大小为7\times7\times3(3为时间维度),即每次操作3帧图像,采用了2种不同的3D卷积核,增加了maps数量;

sub-sampling S3:按照图中降采样后maps数量保持不变,maps大小减半;

后面操作分析类似。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一维卷积(1D-CNN)、二维卷积(2D-CNN)、三维卷积(3D-CNN) 的相关文章

  • C++泛型 显式实例化与显式具体化区别

    显式实例化 相当于通知编译器接下来我要使用这种数据类型的函数 显示的通知编译器生成对应的模板 以此和隐式的实例化相区别 隐式的实例化通过实参的类型来控制编译器对于通用函数模板相应类型的生成 而显式实例化为明文通知 实际效果上两者似乎并无太大
  • MARKDOWN使用方式

    这里写自定义目录标题 欢迎使用Markdown编辑器 红色字体 空格 新的改变 功能快捷键 合理的创建标题 有助于目录的生成 如何改变文本的样式 插入链接与图片 如何插入一段漂亮的代码片 生成一个适合你的列表 创建一个表格 设定内容居中 居
  • Spring Data Redis中的事务陷阱

    原文地址 转载请注明出处 https blog csdn net qq 34021712 article details 79606551 王赛超 之前spring整合redis开启事务 在功能测试环境下跑了N天之后 突然发现服务异常 查看
  • pandas进阶修炼300题,全新上线!

    大家好 现在 经过一个多月的整理 全新的 pandas进阶修炼300题 来了 下面是一些介绍 文末可以免费下载 01 全新目录 新版pandas300题 按照操作分为 10大章节 每章均配有独立的真实数据 每个操作的习题在20 40题左右

随机推荐

  • STM32 系统(SysTick)定时器实验

    目录 SysTick 简介 SysTick 寄存器介绍 SysTick 定时时间计算 SysTick 定时实验 实验结果 SysTick 简介 SysTick 系统定时器是属于 CM3 内核中的一个外设 内嵌在 NVIC 中 系统定时器是一
  • quartus ii 生成.rbf的文件

    第一种方法 点击device and pin options 勾选raw binary file 这样在全编译之后就会生成 rbf的文件 在output fliles文件夹 不过这个产生的rbf文件是经过压缩的文件 在含ARM硬核的SoC
  • python中,用pyspark读写Hive数据

    1 读Hive表数据 pyspark读取hive数据非常简单 因为它有专门的接口来读取 完全不需要像hbase那样 需要做很多配置 pyspark提供的操作hive的接口 使得程序可以直接使用SQL语句从hive里面查询需要的数据 代码如下
  • 【华为OD】

    目录 一 题目描述 二 输入描述 三 输出描述 示例一 输入 输出 说明 示例二 输入 输出 说明 示例三 输入 输出 说明 四 Java玩法 一 题目描述 张兵和王武是五子棋迷 工作之余经常切磋棋艺 走了一会儿 轮到张兵了 他对着一条线思
  • 编译器预定义宏

    今天用MinGW http www mingw org 编译一个项目 怎么也想不起来用哪一个宏来判断用的是mingw的gcc编译器 不得以只好在头文件中搜索 找了半天终于发现是 MINGW32 后来我就想 有没有一个办法能把编译器的所有预定
  • MATLAB绘制二维和三维箭头

    实践中发现MATLAB没有直接绘制箭头 主要是二维 的函数 所以将自己绘制二维和三维箭头的解决方案和大家分享 如有错误或更高效的方法请大家留言指教 一 MATLAB绘制二维箭头 测试例子 drawArrow 1 1 7 2 绘制二维箭头函数
  • 使用OnScrollListener回调处理自动加载更多

    使用OnScrollListener回调处理自动加载更多 http blog csdn net fancylovejava article details 39369753
  • 【双系统】Windows10 查看电脑是UEFI+GPT还是Legacy+MBR模式的方法

    具体查看方法如下 1 按下Win R组合键 在运行窗口中输入cmd 点击确定 2 在弹出的窗口中输入diskpart 回车 3 在新弹出的窗口界面中输入list disk 回车 4 之后会显示下图的信息 Gpt下方如果有星号就表示是uefi
  • [1112]IDEA常用快捷键

    文章目录 IDEA中常用的快捷键 IDEA 利用Generate快速生成构建java类 1 首先定义 java类 的属性参数 2 右键 gt 选择 generate 3 出现 generate 面板 4 点击 construct 生成构造函
  • 开放内测!百度正式发布中国版ChatGPT

    最近 AI 真是火得没边了 OpenAI 靠着 ChatGPT 实力吸睛 Google 带着 Bard 紧随其后 就在昨天 GPT 4 模型又抢尽风头 你方唱罢我登场的 AI 领域 今天 轮到了百度了 就在今天下午 备受期待的百度文心一言如
  • 聪明的人脸识别4——Pytorch 利用Retinaface+Facenet搭建人脸识别平台

    睿智的目标检测51 Pytorch 利用Retinaface Facenet搭建人脸识别平台 学习前言 什么是Retinface和Facenet 1 Retinface 2 Facenet 整体实现代码 实现流程 一 数据库的初始化 二 检
  • Linux系统时间同步(ntpdate/chrony/rdate)

    2019独角兽企业重金招聘Python工程师标准 gt gt gt Linux下同步系统时间有rdate与ntpdate两种方法 chrony则是网络时间协议NTP的另一种实现 先确认是否安装 配置新服使用ntpdate同步系统时间 不论是
  • 适配器Adapter

    1 意图 将一个类的接口转换成客户希望的另外一个接口 Adapter模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作 2 结构 类适配器结构图 对象适配器结构图 类适配器使用多重继承对一个接口与另一个接口进行匹配 对象适配器依赖
  • 点云的三角化重建

    对点云数据进行三角化重建大致步骤 程序先读取点云文件 然后计算法向量 并将法向量和点云坐标放在一起 接着使用贪婪三角化投影算法进行重构 最后显示结果 由于获取的点云数据中常常伴有杂点或噪声 影响了后续的处理 因此为了获取完整的模型 需要对点
  • 适合于做服务器的操作系统有,适合于做服务器的操作系统有

    适合于做服务器的操作系统有 内容精选 换一换 镜像是一个包含了软件及必要配置的服务器或磁盘模版 包含操作系统或业务数据 还可以包含应用软件 例如 数据库软件 和私有软件 镜像分为公共镜像 私有镜像 共享镜像 市场镜像 镜像服务 Image
  • splay的认识,由画图开始

    先说一下 这个大神讲的蛮好的 可以看看他的图哦 可以跟着这个大佬的图来画 我这里讲的是学习他的讲解之后的学习的方法 以及一些笔记了 然后就是自己对于splay的观点了初识splay是在寒假集训的时候 但是压根就没听懂 于是痛定思痛 回家之后
  • 学python需要注意什么-雷林鹏分享:学习python中的需要注意的几点事项

    本文章向大家介绍数据库的DML与DQL语句 主要包括数据库的DML与DQL语句使用实例 应用技巧 基本知识点总结和需要注意事项 具有一定的参考价值 需要的朋友可以参考一下 1 python 中的 and 从左到右计算表达式 若所有值均为真
  • Android ApiDemos示例解析(79):Graphics->SensorTest

    本例SensorTest和例子Android ApiDemos示例解析 61 Graphics gt Compass在绘图方面的介绍基本一样 我也不知道为什么Google 再把这个SensorTest还是归在Graphics 目录下 本例着
  • 云环境openEuler 20.03 Arm 系统 GPGcheck 报错

    云环境openEuler 20 03 Arm 系统 GPGcheck 报错 最近在云上测试鲲鹏开发工具时 遇到安装软件时报 GPG check Failed 的问题 类似问题 经测试后初步判断 出现该问题的主要原因是 华为云上 openEu
  • 一维卷积(1D-CNN)、二维卷积(2D-CNN)、三维卷积(3D-CNN)

    一维卷积神经网络 1D CNN 一维卷积常用在序列模型 自然语言处理领域 假设输入数据维度为8 filter维度为5 不加padding时 输出维度为4 如果filter的数量为16 那么输出数据的shape就是 二维卷积神经网络 2D C