为什么扩张卷积可以保持分辨率？

2024-01-07

动画来自here https://github.com/vdumoulin/conv_arithmetic。我想知道为什么扩张卷积声称可以保持分辨率。显然，蓝色的输入是 7x7，绿色的输出是 3x3。

EDIT:

解决分辨率损失的一种方法是用当前感受野大小的大约一半来填充输入，但是

这本质上破坏了扩张卷积不会失去分辨率的说法，因为它是保留分辨率的填充。为了获得与输入相同的输出大小，传统的卷积需要更少的填充。
由于填充呈指数级增长，相对不小的膨胀因子将导致输入图像被大量填充。想象一下 1024x1024 输入经过 10 倍膨胀，它将变成大约 2048x2048（如果我错了，请告诉我）。这是原始大小的 4 倍，这意味着大部分卷积是在填充区域而不是真实输入上完成的。就我个人而言，这对我来说似乎非常违反直觉。

这确实是一个带有 5x5 滤波器的扩张卷积。如果您将动画的蓝色部分想象为 0 填充的 3x3 图像，它会保留分辨率。

关于您的编辑，重点实际上在于您链接的帖子中的这一声明：扩张卷积支持感受野的指数扩展，而不会损失分辨率或覆盖范围

进行填充是为了保持分辨率。那是对的。

我们真正想要的是扩大感受野的大小。在您链接的文章中，通过 3 个 3x3 扩张卷积以不断增加的扩张，我们已经在特征图中实现了 15x15 的感受野。

为了达到与 3x3 卷积相同的效果没有失去承保范围 and 没有分辨率损失，我们可以用 3 的步幅（4 会导致覆盖范围的损失）和极重的填充（就像你所说的那样，用大部分填充的零进行卷积）来完成。然而，我们需要 4 个 3x3 卷积，步长为 3 而不是 3，才能实现 15x15 的感受野。

最重要的是，与扩张卷积情况相比，正常卷积会具有更多没有意义的卷积。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么扩张卷积可以保持分辨率？的相关文章

如何使用sklearn Pipeline和FeatureUnion选择多个（数字和文本）列进行文本分类？

我开发了一个用于多标签分类的文本模型这OneVsRest分类器 http scikit learn org stable modules generated sklearn multiclass OneVsRestClassifier h
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
使用sklearn进行多标签特征选择

我希望使用 sklearn 对多标签数据集执行特征选择我想要获得最终的功能集across标签然后我将在另一个机器学习包中使用它我打算使用我看到的方法here https stackoverflow com questions 1640
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
多视图几何

我从相距一定距离的两台相同品牌的相机捕获了两张图像捕获了相同的场景我想计算两个相机之间的现实世界旋转和平移为了实现这一点我首先提取了两张图像的 SIFT 特征并进行匹配我现在有基本矩阵也单应性矩阵然而无法进一步进行有很多混乱
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
神经网络不能立即重现？

通过使用反向传播导数弹性的前馈神经网络中的随机权重初始化误差图上的初始位置位于某个随机谷的顶部该随机谷可能是也可能不是局部最小值可以使用方法来克服局部最小值但假设这些方法没有被使用或者在给定的地形上不能很好地工作那么神经网络
从点云检测平面集

我有一组点云我想测试3D房间中是否有角落所以我想讨论一下我的方法以及在速度方面是否有更好的方法因为我想在手机上测试它我将尝试使用霍夫变换来检测线然后我将尝试查看是否有三条线相交并且它们也形成了两个相交的平面如果点云数据来自深
如何重现 Ridge(normalize=True) 的行为？

这段代码 from sklearn pipeline import make pipeline from sklearn preprocessing import StandardScaler from sklearn linear mod
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
libsvm 收缩启发法

我在 C SVC 模式下使用 libsvm 和 2 次多项式内核并且需要训练多个 SVM 在训练期间我训练的一些 SVM 会收到以下一个或什至两个警告 WARNING using h 0 may be faster WARNING re
sklearn LogisticRegressionCV 是否使用最终模型的所有数据

我想知道sklearn中LogisticRegressionCV的最终模型即决策边界是如何计算的假设我有一些 Xdata 和 ylabels Xdata shape of this is n samples n features yl
如何使用 AdaBoost 进行特征选择？

我想使用 AdaBoost 从大量 100k 中选择一组好的特征 AdaBoost 的工作原理是迭代功能集并根据功能的执行情况添加功能它选择对现有特征集错误分类的样本表现良好的特征我目前正在 Open CV 中使用CvBoost 我得到
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

我正在努力掩盖 MultiHeadAttention 层的输入我正在使用 Keras 文档中的 Transformer Block 进行自我关注到目前为止我在网上找不到任何示例代码如果有人能给我一个代码片段我将不胜感激变压器块来
Fast R-CNN 中 ROI 层的用途是什么？

In this https leonardoaraujosantos gitbooks io artificial inteligence content object localization and detection html关于目标

随机推荐

Sqlite在创建表中设置默认值

我写了类似的东西 create table if not exists QuickTest id integer primary key NOT NULL a TEXT DEFAULT 0 b TEXT c TEXT 我在 0 上遇到错误
尝试静默命令时 Dos2unix 不工作

我是这样从 Python 中调用 dos2unix 的 call dos2unix file1 shell True stdout PIPE 然而为了使 Unix 输出保持沉默我这样做了 f null open os devnull w
如何找到完整无向图中的哈密顿循环数？

有人可以解释如何在完整的无向图中找到哈密顿循环的数量吗维基百科说 http en wikipedia org wiki Hamiltonian path Properties公式是 n 1 2 但是当我用这个公式计算时 K3只有1个周期
在正则表达式中匹配带有井号 (#) 符号的单词

我有正则表达式来检查某些文本是否包含单词忽略边界 String regexp bSOME WORD HERE b 但是这个正则表达式返回false当 SOME WORD 以主题标签开头时 Example without String
访问 SCD 中的静态文件

In the NET CORE应用程序我正在使用静态文件wwwroot文件夹运行它时dotnet run the index html文件显示流畅且正常localhost port 但在将应用程序发布为SCD独立的开发包并运行 exe
Razor 智能感知不适用于自定义 ASP.NET MVC 构建

我能够创建 ASP NET MVC 的自定义构建并在 Web 应用程序中使用它但是我似乎无法弄清楚如何让 Razor 智能感知正常工作如果您按照以下步骤操作 Razor 智能感知将仅显示网页信息而不显示其他内容 HTML 帮助程序等
使用字符串的值创建新的表单对象

我有一个已启动的主表单然后它可以转到我创建的任何其他表单但最重要的是我编写了一个类我称之为它返回一个字符串其中包含要转到的表单名称目前我还没有这个工作所以我将像这样从一个表单转到另一个表单静态编写的链接代码 this Hid
在 redux 中使用不可变 js（toJS 和 from JS）的正确方法

我想知道这是否是正确的使用方法immutable js与 redux 和reselect also redux saga 具体来说我想知道toJS 和来自fromJS 以及在哪里使用它们我的想法是 I use toJS 向传奇发送数据时
当数据更改时，如何在 DataGrid 中保持选择？

我有一个 DataGrid 并将 DataProvider 设置为我的数据当我的数据更改时 DataGrid 会丢失所选行并且滚动条会跳回到顶部如何保持选择和滚动位置如果你只是想保住位置在任何更改数据的函数中首先捕获选定的索引
如何让ViewSwitcher只包裹当前显示的视图高度？

我正在使用一个视图切换器 http developer android com intl fr reference android widget ViewSwitcher html这让我可以轻松地在两个不同的内置动画的列表标题之间来回翻转
通过 http 标头传递真实性令牌

我有一个使用令牌来验证用户身份的 Rails 应用程序目前我正在将令牌作为参数传递我想改变这一点我相信可以通过 html header 传递它我不明白如何使用authenticate or request with http tok
React Native 应用程序的 UI（在 iOS 上）滞后并且 fps 速率定期下降

我的 React Native 应用程序的 UI 经常下降但仅限于 iOS 我附上了一张屏幕截图显示 UI fps 约为 11 而且它是一个非常稳定的波并且不断发生多次这会导致令人烦恼的滞后例如在过渡动画或倒计时如附加屏幕上
未知类型名称字符串 C++

我是 C 新手并且在我的程序中获得了一些帮助来比较两个 XML 文件这是我的代码 include pugixml hpp include
Android.mk 应该在哪里？

在 Android NDK 的文档中存在以下声明 Android mk 文件位于项目 jni 目录的子目录中 http developer android com ndk guides android mk html http devel
如何在 jQuery.validation 中添加不等于规则

我想知道如何制作它以便我可以制定一个字段不等于值的规则就像我有一个名为姓名的字段所以我不希望姓名您的名字有人知道如何做到这一点吗谢谢你的帮助您可以使用自定义方法如下所示 jQuery validator addMeth
UITextField 最大长度

当我尝试过如何使用 swift 设置可以输入 UITextField 的最大字符数 https stackoverflow com questions 24641982 how to you set the maximum number o
PHP ltrim 与字符列表的行为

我试图使用 php ltrim 函数从字符串中剥离一些开始部分它工作正常直到它在冒号之后得到一个 i 字符如果它在冒号后面找到 i 它就会忽略 i 字符我知道可以用 substr 或任何其他方式来完成但我想知道为什么它会发生在修
pageAction 上的 chrome“setBadgeText”

我正在寻找如何将文本设置为页面操作图标并找到了这个示例 window setInterval function chrome pageAction setIcon imageData draw 10 0 tabId tabId 1000 f
如何删除 ASP.NET Designer.cs 文件？

我之前参与过没有 designer cs 文件的 VS 项目现在我在另一台计算机上开始了一个新项目但无法删除 Designer cs 文件这真的很烦我我真的需要它吗我该如何删除它一定有某个地方的设置是的您可以删除它们这是方
为什么扩张卷积可以保持分辨率？

动画来自here https github com vdumoulin conv arithmetic 我想知道为什么扩张卷积声称可以保持分辨率显然蓝色的输入是 7x7 绿色的输出是 3x3 EDIT 解决分辨率损失的一种方法是用当前感

为什么扩张卷积可以保持分辨率？

为什么扩张卷积可以保持分辨率？ 的相关文章

随机推荐

热门标签

为什么扩张卷积可以保持分辨率？的相关文章