在 Keras 中使用扩张卷积

2023-12-22

In WaveNet https://deepmind.com/blog/article/wavenet-generative-model-raw-audio，扩张卷积用于增加上面各层的感受野。

从图中，您可以看到内核大小为 2 且膨胀率为 2 次幂的膨胀卷积层创建了一个树状的感受野结构。我尝试（非常简单地）在 Keras 中复制上述内容。

import tensorflow.keras as keras
nn = input_layer = keras.layers.Input(shape=(200, 2))
nn = keras.layers.Conv1D(5, 5, padding='causal', dilation_rate=2)(nn)
nn = keras.layers.Conv1D(5, 5, padding='causal', dilation_rate=4)(nn)
nn = keras.layers.Dense(1)(nn)
model = keras.Model(input_layer, nn)
opt = keras.optimizers.Adam(lr=0.001)
model.compile(loss='mse', optimizer=opt)
model.summary()

和输出：

_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
input_4 (InputLayer)         [(None, 200, 2)]          0
_________________________________________________________________
conv1d_5 (Conv1D)            (None, 200, 5)            55
_________________________________________________________________
conv1d_6 (Conv1D)            (None, 200, 5)            130
_________________________________________________________________
dense_2 (Dense)              (None, 200, 1)            6
=================================================================
Total params: 191
Trainable params: 191
Non-trainable params: 0
_________________________________________________________________

我正期待着axis=1每次之后缩小conv1d图层，类似于gif。为什么情况并非如此？

模型摘要符合预期。正如您所注意到的，使用扩张卷积会导致感受野增加。然而，扩张卷积实际上保留了输入图像/激活的输出形状，因为我们只是改变卷积核。常规内核可能如下

0 1 0
1 1 1
0 1 0

膨胀率为 2 的内核会在原始内核的每个条目之间添加零，如下所示。

事实上，您可以看到我们的原始内核也是一个膨胀内核，膨胀率为 1。增加感受野的其他方法会导致输入图像尺寸缩小。最大池化和跨步卷积是两种替代方法。

例如。如果你想通过减小输出形状的大小来增加感受野，你可以使用如下的跨步卷积。我用跨步卷积替换了扩张卷积。您将看到输出形状减少了每一层。

import tensorflow.keras as keras
nn = input_layer = keras.layers.Input(shape=(200, 2))
nn = keras.layers.Conv1D(5, 5, padding='causal', strides=2)(nn)
nn = keras.layers.Conv1D(5, 5, padding='causal', strides=4)(nn)
nn = keras.layers.Dense(1)(nn)
model = keras.Model(input_layer, nn)
opt = keras.optimizers.Adam(lr=0.001)
model.compile(loss='mse', optimizer=opt)
model.summary()

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
input_2 (InputLayer)         [(None, 200, 2)]          0
_________________________________________________________________
conv1d_3 (Conv1D)            (None, 100, 5)            55
_________________________________________________________________
conv1d_4 (Conv1D)            (None, 25, 5)             130
_________________________________________________________________
dense_1 (Dense)              (None, 25, 1)             6
=================================================================
Total params: 191
Trainable params: 191
Non-trainable params: 0
_________________________________________________________________

总而言之，扩张卷积只是增加模型感受野的另一种方法。它的优点是保留输入图像的输出形状。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

convneuralnetwork

在 Keras 中使用扩张卷积的相关文章

在 Tensorflow 中每行选择一个元素的优雅方法

Given 一个矩阵A形状的 m n 张量I形状的 m 我想要一份清单J的元素来自A where J i A i I i 那是 I保存要从每行中选择的元素的索引A 背景我已经有了argmax A 1 现在我也想要max 我知道我可以使用r
大于 2GB 的 Tensorflow 图

我正在尝试优化一个大型张量流保存模型其中包含 10MB saving model pb 和 16GB 变量我尝试冻结我的图表并进行一些进一步的转换我已按照步骤操作https medium com google cloud optimi
Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
在 Tensorflow 中使用迁移学习是否需要预定义图像大小？

我打算使用预先训练的模型例如fast rcnn resnet101 pets用于 Tensorflow 环境中的对象检测如所述here https tensorflow object detection api tutorial rea
为什么平均百分比误差（mape）非常高？

我已获得代码掌握机器学习 https machinelearningmastery com time series prediction lstm recurrent neural networks python keras 我修改了mod
在优化器期间保持变量不变

我有一个损失张量 L 的 TensorFlow 计算图它取决于 2 个 tf Variables A 和 B 我想在保持 B 固定的同时在变量 A 上运行梯度上升 A L 与 A 的梯度反之亦然在 B 上运行梯度上升 B L 与 B
Keras：嵌入/向量的附加层？

我有 3 个词嵌入嵌入 1 w11 w12 w13 w14 嵌入 2 w21 w22 w23 w24 嵌入 3 w31 w32 w33 w34 有没有办法通过添加所有三个向量来获得第四个嵌入并使用所有向量的可训练权重例如嵌入 4 w
如何修复 Tensorflow 中的“ValueError：操作数无法与形状 (2592,) (4,) 一起广播”？

我目前正在设计一个 NoisyNet 层如下所示探索嘈杂的网络 https arxiv org abs 1706 10295 在 Tensorflow 中并得到如标题所示的维度误差而两个张量的维度将在行中按元素相乘filtered o
“你好，TensorFlow！”使用 C API

出于学习目的如何使用 TensorFlow C API 编写此 Python 示例 import tensorflow as tf hello tf constant hello TensorFlow sess tf Session pr
获取每个训练实例的损失值 - Keras

我想获得每个实例的损失值作为模型训练 history model fit 例如上面的代码返回每个时期的损失值而不是小批量或实例做这个的最好方式是什么有什么建议么在这个 keras 官方文档页面的末尾正是您要寻找的内容https
窗口多维 Tensorflow 数据集

我有形状的二维数据m by n我想要的窗口大小w沿着第一个轴进入数据集m w许多二维数组每个数组的大小w by n 例如如果数据是 0 1 2 3 4 5 6 7 8 9 10 11 然后我想将其窗口化 0 1 2 3 4 5 6 7 8
如何在arm64主机上运行amd64 docker镜像

警告请求的映像平台 linux amd64 与检测到的主机平台 linux arm64 v8 不匹配并且未请求特定平台 2021 07 28 22 25 06 349222 F tensorflow core platform cpu
Tensorflow 数据集的数据预处理是针对整个数据集还是针对每次调用 iterator.next() 进行一次？

您好我现在正在研究tensorflow中的数据集API 我有一个关于执行数据预处理的dataset map 函数的问题 file name image1 jpg image2 jpg im dataset tf data Dataset
model.fit 在 Keras 中如何工作？

我之前的帖子或错误是这样的one https stackoverflow com questions 52261090 do the operations defined in array ops in tensorflow have gr
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
按相似度对矩阵进行排序

我有 100 个矩阵其中每一行对应一个个体列对应站点我想通过相似性度量对行进行排序以便最相似的个体在矩阵中彼此相邻我使用 k 近邻按行对矩阵进行排序并将这些排序的矩阵提供给卷积神经网络我想知道是否还有其他措施可以完成手头的任务
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
model.predict() 返回类而不是概率

Hello 我是第一次使用 Keras 我训练并保存了一个模型作为 json 文件及其权重该模型旨在将图像分为 3 个类别我的编译方法 model compile loss categorical crossentropy optim
Scipy 稀疏 CSR 矩阵到 TensorFlow SparseTensor - 小批量梯度下降

我有一个 Scipy 稀疏 CSR 矩阵它是根据 SVM Light 格式的稀疏 TF IDF 特征矩阵创建的特征数量巨大且稀疏所以我必须使用 SparseTensor 否则速度太慢例如特征数量为 5 示例文件如下所示 0 4 1

随机推荐

SQL 更新后，wso2 数据服务能否返回受影响的行？

我已经使用 WSO2 数据服务连接到数据库一段时间了一切都很完美只是在 SQL 更新脚本之后我仍然无法获取受影响的行我已经按照向导一遍又一遍地尝试但没有找到解决方案有谁知道如何获得吗感谢您的提前回复恐怕没有办法直接获取更新的行
makefile 的错误检查行为

如果我的程序必须为不同的结果主要是错误返回不同的值例如 0 1 2 3 等则调用该程序的 makefile 将必须停止执行其余的 makefile 命令即使该命令产生错误返回非零值是否有办法继续执行 makefile 谢谢你们
当文件没有 .py 扩展名时为 python 运行 Flymake

我根本不是一个 lisp 人但我的主要脚本环境位于 emacs 上当文件上没有 py 扩展名时我需要一些帮助来运行我的 Flymake pyflakes 因为我工作中的一些脚本没有 py 扩展名当我读取编码扩展名为 py 的文件时
为什么 Firefox 对输入元素使用 IE 框模型？

尝试以下简单示例 div div div
TS-Jest 实用程序丢失

Well using ts jest 27 x x I could access the utils helper by require ts jest utils and as you can see in the below pictu
将 List 添加到 JSONArray

我正在尝试使用 JSON 库创建 JSON 目前我正在创建 JSONArray 添加以将列表中的所有值添加到其中但我面临这个问题 JSONArray 类型中的方法 put int boolean 不适用于参数 String List 在这
在 ListBox 中记录用户可见的项目

我有一个列表框或数据网格其中包含数千个条目我想知道用户查看过的项目滚动搜索或其他方式我如何知道列表框中的用户可以看到什么奖励设置一个计时器以便该项目必须显示至少 N 毫秒如果用户只是拉下滚动条 Update 这几乎是重复的
如何阻止应用程序在崩溃时重新启动并使崩溃可见？

我正在开发一个应用程序并使用华为手机进行测试每当发生崩溃时应用程序就会重新启动并且日志消失开发人员选项中是否有任何设置或其他设置可以让崩溃对话框出现并显示崩溃日志我最近了解到这一点希望对其他人有帮助像平常一样进行调试但一旦发生崩
Internet Explorer：SCRIPT7002：XMLHttpRequest：网络错误 0x2f7d，由于错误 00002f7d，无法完成操作

这个问题快把我逼疯了我们的 Web 应用程序使用 HTTP POST 登录用户现在 IE 10 正在中止连接并显示 SCRIPT7002 XMLHttpRequest Network Error 0x2f7d Could not com
openssl aes gcm 加密，带身份验证 TAG；命令行

我正在尝试使用 openssl th 命令行以 AES GCM 模式加密文件 openssl enc aes 256 gcm p iv 000000000000000000000000 K 0000000000000000000000000
为什么 jPlayer 无法在 Firefox 中播放我的 MP3 文件？

我在 Firefox 8 中使用 jQuery Jplayer 播放 MP3 文件时遇到问题我已经为我的浏览器安装了最新的 Flash 并且我可以看到 jplayer swf 文件正在 Firebug 的 Flash 选项卡中下载我按此
如何更新reducer中嵌套对象的值？

我已经像这样建立了我的国家 const list categories Professional active false names id 1 name Golf active false id 2 name Ultimate Frisb
如何通过 Java AWS SDK 使 Cloudfront CDN 提供的文件（待刷新）失效？

我正在使用 Java SDK 将图像上传到 S3 如何使 CloudFront 中的文件无效以便从 s3 源重新获取该文件如何通过Java SDK做到这一点 import com amazonaws services cloudfron
过滤泛型类型

我正在尝试使用 TypeScript 编写一个函数该函数允许我根据对象的类型过滤对象列表结果应该是一个允许我执行以下任一操作的函数 filter
使用 capybara-webkit 检测到死锁

我正在尝试通过这个规范 scenario Edit a service js true do service create service for provider title First service fill edit service
给定字符生成器和长度，如何生成所有可能字符串的列表？

例如给定 a b 作为生成器和 2 作为长度该函数将输出一个生成器该生成器将产生 a b ab ba aa bb 或给定 a 长度为 3 a aa aaa 正如您可以想象的那样如果添加更多字母或增加长度该集合会变得更大它应该列出
array_replace() / array_merge() | array_replace() / array_merge() | ( $_SESSION = array() ) 参数不是数组？

我的学校项目有这段代码并且认为该代码按照我想要的方式完成了工作但在使用时我仍然不断收到有关 SESSION 不是数组参数的错误array replace and array merge 功能会话已在标头上启动 Start Sessi
我们可以使用 modelform 来更新模型的现有实例吗？

我知道 Django 中的 modelform 是一种用于生成模型实例的表单但假设如果我们想通过 modelform 更新已经存在的模型实例那么它会更新模型还是创建一个全新的实例 save 方法每个 ModelForm 也有一个sav
android.permission.PACKAGE_USAGE_STATS 仅适用于系统应用程序吗？

我通过以下方式访问用户统计信息 UsageStatsManager userStatsMgr UsageStatsManager getSystemService usagestats List
在 Keras 中使用扩张卷积

In WaveNet https deepmind com blog article wavenet generative model raw audio 扩张卷积用于增加上面各层的感受野从图中您可以看到内核大小为 2 且膨胀率为 2

在 Keras 中使用扩张卷积

在 Keras 中使用扩张卷积 的相关文章

随机推荐

热门标签

在 Keras 中使用扩张卷积的相关文章