Pytorch 卷积自动编码器

2023-12-28

如何构建卷积自动编码器的解码器部分？假设我有这个

(input -> conv2d -> maxpool2d -> maxunpool2d -> convTranspose2d -> output):

# CIFAR images shape = 3 x 32 x 32

class ConvDAE(nn.Module):
    def __init__(self):
        super().__init__()

        # input: batch x 3 x 32 x 32 -> output: batch x 16 x 16 x 16
        self.encoder = nn.Sequential(
            nn.Conv2d(3, 16, 3, stride=1, padding=1), # batch x 16 x 32 x 32
            nn.ReLU(),
            nn.BatchNorm2d(16),
            nn.MaxPool2d(2, stride=2) # batch x 16 x 16 x 16
        )

        # input: batch x 16 x 16 x 16 -> output: batch x 3 x 32 x 32
        self.decoder = nn.Sequential(
            # this line does not work
            # nn.MaxUnpool2d(2, stride=2, padding=0), # batch x 16 x 32 x 32
            nn.ConvTranspose2d(16, 16, 3, stride=2, padding=1, output_padding=1), # batch x 16 x 32 x 32
            nn.ReLU(),
            nn.BatchNorm2d(16),
            nn.ConvTranspose2d(16, 3, 3, stride=1, padding=1, output_padding=0), # batch x 3 x 32 x 32
            nn.ReLU()
        )

    def forward(self, x):
        print(x.size())
        out = self.encoder(x)
        print(out.size())
        out = self.decoder(out)
        print(out.size())
        return out

Pytorch具体问题：为什么我不能在解码器部分使用 MaxUnpool2d 。这给了我以下错误：

TypeError: forward() missing 1 required positional argument: 'indices'

以及概念性问题：我们不应该在解码器中做与编码器中所做的相反的事情吗？我看到了一些实现，似乎他们只关心解码器输入和输出的维度。Here https://github.com/L1aoXingyu/pytorch-beginner/blob/master/08-AutoEncoder/conv_autoencoder.py and here https://github.com/GunhoChoi/Kind-PyTorch-Tutorial/blob/master/07_Denoising_Autoencoder/Denoising_Autoencoder.ipynb是一些例子。

对于问题的火炬部分，unpool 模块将池模块返回的索引作为必需的位置参数，该索引将返回return_indices=True。所以你可以做

class ConvDAE(nn.Module):
    def __init__(self):
        super().__init__()

        # input: batch x 3 x 32 x 32 -> output: batch x 16 x 16 x 16
        self.encoder = nn.Sequential(
            nn.Conv2d(3, 16, 3, stride=1, padding=1), # batch x 16 x 32 x 32
            nn.ReLU(),
            nn.BatchNorm2d(16),
            nn.MaxPool2d(2, stride=2, return_indices=True)
        )

        self.unpool = nn.MaxUnpool2d(2, stride=2, padding=0)

        self.decoder = nn.Sequential( 
            nn.ConvTranspose2d(16, 16, 3, stride=2, padding=1, output_padding=1), 
            nn.ReLU(),
            nn.BatchNorm2d(16),
            nn.ConvTranspose2d(16, 3, 3, stride=1, padding=1, output_padding=0), 
            nn.ReLU()
        )

    def forward(self, x):
        print(x.size())
        out, indices = self.encoder(x)
        out = self.unpool(out, indices)
        out = self.decoder(out)
        print(out.size())
        return out

至于问题的一般部分，我认为最先进的技术不是使用对称解码器部分，因为已经表明，去卷积/转置卷积会产生棋盘效应，并且许多方法倾向于使用上采样模块来代替。您将通过 PyTorch 渠道更快地找到更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

autoencoder

Pytorch 卷积自动编码器的相关文章

PyTorch 中的截断反向传播（代码检查）

我正在尝试在 PyTorch 中实现随时间截断的反向传播对于以下简单情况K1 K2 我下面有一个实现可以产生合理的输出但我只是想确保它是正确的当我在网上查找 TBTT 的 PyTorch 示例时它们在分离隐藏状态将梯度归零以及这些
如何检查 PyTorch 是否正在使用 GPU？

如何检查 PyTorch 是否正在使用 GPU 这nvidia smi命令可以检测 GPU 活动但我想直接从 Python 脚本内部检查它这些功能应该有助于 gt gt gt import torch gt gt gt torch cu
Pytorch 数据加载器：错误的文件描述符和 EOF > 0

问题描述在使用由自定义数据集制作的 Pytorch 数据加载器进行神经网络训练期间我遇到了奇怪的行为数据加载器设置为workers 4 pin memory False 大多数时候训练都顺利完成有时训练会随机停止并出现以下错误
PyTorch - 参数不变

为了了解 pytorch 的工作原理我尝试对多元正态分布中的一些参数进行最大似然估计然而它似乎不适用于任何协方差相关的参数所以我的问题是为什么这段代码不起作用 import torch def make covariance ma
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
在 C++ API 中将一个张量的一大块复制到另一个张量中

我需要复制一行一个张量在c API 转换为另一个张量的某些部分其中开始和结束索引可用在 C 中我们可以使用类似的东西 int myints 10 20 30 40 50 60 70 std vector
如何在 google colab 中运行 matlab .m 文件

我目前正在尝试运行这个存储库https github com Fanziapril mvfnet https github com Fanziapril mvfnet这需要一个步骤 Run the Matlab ModelGeneratio
为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等

随机推荐

使用 tr1 在 C++ 中生成超出范围的随机数

我试图从 0 1 范围内的实数均匀分布生成数字但编译器生成的数字超出了 0 1 范围这是代码 int main void Solver solve mt19937 mteng mteng seed rdtsc uniform real
Leaflet图层控件仅在单击时打开

有没有办法只在单击时打开传单图层控件默认情况下当鼠标悬停鼠标移开时它会展开折叠我只想点击打开您可以使用一些 jQuery 来完成此任务将折叠选项设置为 false 然后创建一个按钮来显示隐藏图层控件 btn onclic
通过flutter在Firestore中添加嵌套数据

我来自以下问题如何在 Firebase 中管理添加和更新数据 https stackoverflow com questions 61910157 how to manage add and update data in firebase
如何获取UIImage中形状的UIBezierPath或将UIImage裁剪为某种形状

我是 iOS 新手我想知道我是否可以获得UIBezierPath of a UIImage 我有一个UIImage的面部布局并想要得到UIBezierPath 这有助于我裁剪UIImage 或者谁能告诉我其他裁剪方法UIImages 但
Groovy instance.metaclass 与 this.metaclass

我有一个以下脚本 task myTask class Person Person Person instance this println this metaClass class name println this getMetaClas
如何在 SwiftUI 中重置子视图？

下面是我正在使用的代码的简化版本但每当我重置键盘时它仍然显示以前的键盘无论如何当我调用 ResetKeyboard 时它会用新的 KeyboardView 替换键盘吗 struct GameView View State var
Ember.js——如何在嵌套/重复视图中定位插座，以及这种 ui 布局的最佳实践是什么？

我正在重构一个继承的 Ember 应用程序其中存在相当多的非 MVC 混乱我希望尽可能保持模块化并希望在多个屏幕中重用各种 ui 组件以帮助防止代码重复看起来直销店是做到这一点的最佳方式现在我有一个显示许多元素的 UI 每个
驱动核心数必须为正数

我已将 Spark 从版本 3 1 1 升级到 3 2 1 现在所有现有 Spark 作业都会因以下错误而中断 Exception in thread main org apache spark SparkException Driver
我如何与 PHP 一起使用 HTML5 本地存储，将其用于 php 会话，并存储 php 使用的其他信息

我已经在网上寻找了一段时间了 HTML5 本地存储似乎对我有用并且是我在 PHP 会话中遇到的问题的解决方案问题是即使我设置它们它们也不一致为了记住我下次我访问主页时我会被带到登录页面这并不总是如此但通常情况下 PHP 会话对
在 JUnit 5 中超过超时后如何使测试失败？

在 JUnit 4 中 timeout 注释参数可用于强制测试在给定时间后停止 Test timeout 100 public void infinity while true 在 JUnit 5 中如何做到这一点与以及摘自的代码密切
有人可以从 python 字节码解释 CALL_FUNCTION 和 RETURN_VALUE

我试图理解 python 字节码但我被抓住了CALL FUNCTION and RETURN VALUE 函数有自己的堆栈吗如果不是文档中的将 TOS 返回给函数的调用者是什么意思 In CPython every functio
使用 Laravel 表单模型绑定和复选框更新多对多 Eloquent 关系

我有3张桌子 doors id name image colors id name image 门颜色 id door id color id 以及2个具有多对多关系的模型每扇门都有多种颜色并且许多颜色门与门重叠门模型 class D
使用 JaCoCo 和 spring-boot-maven-plugin 生成代码覆盖率

在集成测试期间我使用 spring boot maven plugin 来启动我的 spring 应用程序
Erlang：这个 trie 实现最错误的地方是什么？

假期里我的家人喜欢玩Boggle 问题是我的Boggle 技术很糟糕所以我做了任何优秀程序员都会做的事情编写一个程序来给我玩该算法的核心是一个简单的前缀特里树 http en wikipedia org wiki Trie 其中每
离子恢复暂停事件防止文件浏览时触发，仅在按下主页按钮时触发

我正在开发一个聊天应用程序我在暂停和恢复事件时使用 document addEventListener 暂停 onpause false document addEventListener resume onresume false 当我
加特林（性能测试）：如何每x分钟在后台执行一次任务

我想知道如何使用加特林每 x 分钟在后台执行一项任务背景我想在我们的后端写几个场景在这种情况下我们的后端将被另一个后端调用一个常见的场景客户端后端到服务器身份验证可选客户请求 X 客户请求 Y 客户请求Z 我想要一个执行
播放规格时配置中断，因为“没有启动的应用程序”

我将一些字符串外部化到 HOCON application conf 我正在访问这样的配置值 import play api Play current import play api Play configuration configura
AngularJS - 将变量传递到“$routeProvider”

试图找出一种特定于角度的方法来尝试实现这一目标我有一个包含一些视图的页面当用户单击锚点时视图会发生变化我工作得很好我很好奇的是当用户点击时是否可以存储一个变量比如内部 html 然后将其传递给 routeProvider
为什么有时scrollTop/scrollLeft不可写？

我正在使用 dhtmlx 甘特图 UI 组件其中包含任务列表和图形图表任务列表和图形图表包含在两个独立的 div 元素中它们同步并行滚动通过滚动图表区域任务列表会自动滚动从而使任务行位置与甘特线位置相匹配检查组件源代码我发现
Pytorch 卷积自动编码器

如何构建卷积自动编码器的解码器部分假设我有这个 input gt conv2d gt maxpool2d gt maxunpool2d gt convTranspose2d gt output CIFAR images shape 3 x

Pytorch 卷积自动编码器

Pytorch 卷积自动编码器 的相关文章

随机推荐

热门标签

Pytorch 卷积自动编码器的相关文章