【Tensorflow】tf.nn.depthwise_conv2d如何实现深度卷积?

2023-10-29

实验环境：tensorflow版本1.2.0，python2.7

介绍

depthwise_conv2d来源于深度可分离卷积:

Xception: Deep Learning with Depthwise Separable Convolutions

tf.nn.depthwise_conv2d(input,filter,strides,padding,rate=None,name=None,data_format=None)

除去name参数用以指定该操作的name，data_format指定数据格式，与方法有关的一共五个参数：

input：
指需要做卷积的输入图像，要求是一个4维Tensor，具有[batch, height, width, in_channels]这样的shape，具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]
filter：
相当于CNN中的卷积核，要求是一个4维Tensor，具有[filter_height, filter_width, in_channels, channel_multiplier]这样的shape，具体含义是[卷积核的高度，卷积核的宽度，输入通道数，输出卷积乘子]，同理这里第三维in_channels，就是参数value的第四维
strides：
卷积的滑动步长。
padding：
string类型的量，只能是”SAME”,”VALID”其中之一，这个值决定了不同边缘填充方式。
rate：
这个参数的详细解释见【Tensorflow】tf.nn.atrous_conv2d如何实现空洞卷积？

结果返回一个Tensor，shape为[batch, out_height, out_width, in_channels * channel_multiplier]，注意这里输出通道变成了in_channels * channel_multiplier

实验

为了形象的展示depthwise_conv2d，我们必须要建立自定义的输入图像和卷积核

img1 = tf.constant(value=[[[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]]]],dtype=tf.float32)
img2 = tf.constant(value=[[[[1],[1],[1],[1]],[[1],[1],[1],[1]],[[1],[1],[1],[1]],[[1],[1],[1],[1]]]],dtype=tf.float32)
img = tf.concat(values=[img1,img2],axis=3)

filter1 = tf.constant(value=0, shape=[3,3,1,1],dtype=tf.float32)
filter2 = tf.constant(value=1, shape=[3,3,1,1],dtype=tf.float32)
filter3 = tf.constant(value=2, shape=[3,3,1,1],dtype=tf.float32)
filter4 = tf.constant(value=3, shape=[3,3,1,1],dtype=tf.float32)
filter_out1 = tf.concat(values=[filter1,filter2],axis=2)
filter_out2 = tf.concat(values=[filter3,filter4],axis=2)
filter = tf.concat(values=[filter_out1,filter_out2],axis=3)

建立好了img和filter，就可以做卷积了

out_img = tf.nn.conv2d(input=img, filter=filter, strides=[1,1,1,1], padding='VALID')

好了，用一张图来详细展示这个过程

这是普通的卷积过程，我们再来看深度卷积。

out_img = tf.nn.depthwise_conv2d(input=img, filter=filter, strides=[1,1,1,1], rate=[1,1], padding='VALID')

现在我们可以形象的解释一下depthwise_conv2d卷积了。看普通的卷积，我们对卷积核每一个out_channel的两个通道分别和输入的两个通道做卷积相加，得到feature map的一个channel，而depthwise_conv2d卷积，我们对每一个对应的in_channel，分别卷积生成两个out_channel，所以获得的feature map的通道数量可以用in_channel* channel_multiplier来表达，这个channel_multiplier，就可以理解为卷积核的第四维。

代码清单

import tensorflow as tf


img1 = tf.constant(value=[[[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]]]],dtype=tf.float32)
img2 = tf.constant(value=[[[[1],[1],[1],[1]],[[1],[1],[1],[1]],[[1],[1],[1],[1]],[[1],[1],[1],[1]]]],dtype=tf.float32)
img = tf.concat(values=[img1,img2],axis=3)
filter1 = tf.constant(value=0, shape=[3,3,1,1],dtype=tf.float32)
filter2 = tf.constant(value=1, shape=[3,3,1,1],dtype=tf.float32)
filter3 = tf.constant(value=2, shape=[3,3,1,1],dtype=tf.float32)
filter4 = tf.constant(value=3, shape=[3,3,1,1],dtype=tf.float32)
filter_out1 = tf.concat(values=[filter1,filter2],axis=2)
filter_out2 = tf.concat(values=[filter3,filter4],axis=2)
filter = tf.concat(values=[filter_out1,filter_out2],axis=3)

out_img = tf.nn.depthwise_conv2d(input=img, filter=filter, strides=[1,1,1,1], rate=[1,1], padding='VALID')

输出：

rate=1, VALID mode result:
[[[[  0.  36.   9.  27.]
   [  0.  54.   9.  27.]]

  [[  0.  36.   9.  27.]
   [  0.  54.   9.  27.]]]]

---------------------
作者：xf__mao
来源：https://blog.csdn.net/mao_xiao_feng/article/details/78003476
版权声明：本文为博主xf__mao原创文章，转载请附上博文链接！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

【Tensorflow】tf.nn.depthwise_conv2d如何实现深度卷积? 的相关文章

无法满足显式设备规范“/device:GPU:0”，因为没有匹配的设备

我想在我的 Ubuntu 14 04 机器上使用 TensorFlow 0 12 作为 GPU 但是当将设备分配给节点时我收到以下错误 InvalidArgumentError see above for traceback Canno
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
在 keras 中使用自定义张量流操作

我在张量流中有一个脚本其中包含自定义张量流操作我想将代码移植到 keras 但我不确定如何在 keras 代码中调用自定义操作我想在 keras 中使用tensorflow 所以到目前为止我发现的教程描述了与我想要的相反的内容 htt
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
张量流如何处理无法存储在一个盒子中的大变量

我想通过训练超过十亿特征维度的数据来训练 DNN 模型因此第一层权重矩阵的形状将为 1 000 000 000 512 这个权重矩阵太大无法存储在一个盒子中目前有没有什么解决方案来处理这么大的变量例如将大的权重矩阵划分为多个框 Up
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
如何使用 Tensorflow-GPU 和 Keras 修复低易失性 GPU-Util？

我有一台 4 GPU 机器在上面运行带有 Keras 的 Tensorflow GPU 我的一些分类问题需要几个小时才能完成 nvidia smi returns Volatile GPU Util which never exceeds

随机推荐

西瓜书学习笔记day2

模型评估与选择一经验误差与过拟合错误率分类错误的样本数占样本总数的比例在m个样本中共有a个样本分类错误则错误率E a m 精度 1 a m 误差学习器实际预测输入与样本的真实输出之间的差异定义为误差在训练集中的误差被称为训练
简单写一个随机在一个三维区域生成球的matlab函数

1条消息使用MATLAB在给定矩形区域随机绘制任意个不相交的圆风一样的航哥的博客 CSDN博客以上博客自从发表以来好几个同学都问我三维的怎么实现今天下班之后就写一个不知道是不是其他同学需要的先上代码 function plo
Qt学习: QCloseEvent关闭事件的使用及代码示例

QCloseEvent事件是指当你鼠标点击窗口右上角的关闭按钮时所触发的函数如果你没有重写virtual closeEvent QCloseEvent event 这个虚函数的话系统是默认接受关闭事件的所以就会关闭窗体但有的时候
ImportError: libcudart.so.10.0:cannot open shared object file: No such file or direct【mmdetection错误】

问题在使用mmdetection做训练的时候出现错误 gt gt gt from mmdet apis import init detector Traceback most recent call last return bootst
【IDEA】idea设置默认maven配置, 避免每次设置maven

环境 IDEA 2018 2021 场景每次导入新项目是经常需要重新设置maven 非常麻烦方案 idea设置默认maven配置避免每次设置maven 方法 Step 1 打开Settings File gt Other Setti
cartographer 参数理解

参考文章 cartographer参数调整 xjEzekiel 博客园 cartographer探秘第一章之安装编译与参数配置李太白lx的博客 CSDN博客 cartographer 涉及到的参数需要增加删除或者修改尽量在velodyne
mysql connector net 5.0_mysql 数据库和net 的版本动态库搭配问题

Connector NET 1 0 includes support for MySQL Server 4 0 4 1 and 5 0 features and full compatibility with the ADO NET dri
python实现弹球小游戏

跟着趣味开发python一起实现的弹球小游戏游戏运行效果实现流程 1 创建游戏画布创建ball类 2 增加几个动作让小球移动让小球来回反弹改变小球的起始方向 3 加上球拍使球拍左右移动循环移动 4 增加输赢因素对小球位置进
运动补偿 & 运动估计

运动补偿是一种描述相邻帧相邻在这里表示在编码关系上相邻在播放顺序上两帧未必相邻差别的方法具体来说是描述前面一帧相邻在这里表示在编码关系上的前面在播放顺序上未必在当前帧前面的每个小块怎样移动到当前帧中的某个位置去这种方法经常被
Effective Modern C++ Item 20 对于类似std::shared_ptr但有可能悬空的指针，使用std::weak_ptr

如果需要某种智能指针能够像std shared ptr一样方便但又无需参与管理所指涉到的对象的共享所有权的话就很好适合用std weak ptr 但这样的功能同样会带来一个问题这种指针需要处理一个对std shared ptr而言不是
softmax分类器_Softmax 理解

Softmax深入理解译 AIUAI www aiuai cn Pytorch的交叉熵nn CrossEntropyLoss在训练阶段里面是内置了softmax操作的因此只需要喂入原始的数据结果即可不需要在之前再添加softmax层
OpenWrt-SDK-编译生成ipk软件包

版本 Barrier Breaker 类型 brcm2708 下载SDK http downloads openwrt org barrier breaker 14 07 brcm2708 generic OpenWrt SDK brcm2
linux部署vue项目

命令行进入配置文件 vi usr local nginx conf nginx conf 输入i进行修改端口号和文件路径按ESC保存后输入 wq退出进入sbin启动nginx cd usr local nginx sbin nginx
FMC164-基于JESD204B的4路1Gsps AD 4路1.25Gsps DA FMC子卡

板卡介绍 FMC164子卡集成4通道1Gsps采样率 16位AD 4通道1 25Gsps 16位DA 板载时钟芯片HMC7044 可以提供JESD204B所需要的各种时钟具有同步触发功能模拟信号采用SSMC射频连接器输入和输出板卡可
es 修改mappings字段结构

es不支持直接修改mappings字段结构可以通过 reindex 重建索引方式修改 POST reindex source index old index dest index new index op type create Ela
记录：Qt Creator 10配置安卓开发环境

Qt Creator 现在的安卓开发环境配置相比老版本方便了不少本文以目前在线安装版的 Qt Creator 10 0 2 Qt 5 15 Qt 6 5 为例做演示有些文件可能会因为网络问题需要科学上网才能下载 1 下载 JDK htt
【css】css动画实现的3种方式

css实现动画主要有3种方式 transition实现过渡动画 transform转变动画 animation实现自定义动画一 transition过渡动画 1 语法 transition property duration timing
UnityAPI.Transform变换（Yanlz+Unity+API+Transform+）

UnityAPI Transform变换版本作者参与者完成日期备注 UnityAPI Transform V01 1 0 严立钻 2018 08 21 UnityAPI Transform变换发布说明 UnityAPI Tran
Linux·C++多线程基础知识

目录 1 多线程 1 1 多进程与多线程 1 2 多线程理解 1 3 创建线程 1 4 join与detach方式 1 join举例 2 detach举例 1 5 this thread 2 mutex 2 1 lock与unlock 2
【Tensorflow】tf.nn.depthwise_conv2d如何实现深度卷积?

实验环境 tensorflow版本1 2 0 python2 7 介绍 depthwise conv2d来源于深度可分离卷积 Xception Deep Learning with Depthwise Separable Convoluti

【Tensorflow】tf.nn.depthwise_conv2d如何实现深度卷积?

介绍

实验

代码清单

【Tensorflow】tf.nn.depthwise_conv2d如何实现深度卷积? 的相关文章

随机推荐

热门标签