为什么自动编码器中的解码器在最后一层使用 sigmoid？

2024-02-27

我正在看this https://github.com/L1aoXingyu/pytorch-beginner/blob/master/08-AutoEncoder/Variational_autoencoder.py工作变分自动编码器。

主要班级

class VAE(nn.Module):
    def __init__(self):
        super(VAE, self).__init__()

        self.fc1 = nn.Linear(784, 400)
        self.fc21 = nn.Linear(400, 20)
        self.fc22 = nn.Linear(400, 20)
        self.fc3 = nn.Linear(20, 400)
        self.fc4 = nn.Linear(400, 784)

    def encode(self, x):
        h1 = F.relu(self.fc1(x))
        return self.fc21(h1), self.fc22(h1)

    def reparametrize(self, mu, logvar):
        std = logvar.mul(0.5).exp_()
        if torch.cuda.is_available():
            eps = torch.cuda.FloatTensor(std.size()).normal_()
        else:
            eps = torch.FloatTensor(std.size()).normal_()
        eps = Variable(eps)
        return eps.mul(std).add_(mu)

    def decode(self, z):
        h3 = F.relu(self.fc3(z))
        return F.sigmoid(self.fc4(h3))

    def forward(self, x):
        mu, logvar = self.encode(x)
        z = self.reparametrize(mu, logvar)
        return self.decode(z), mu, logvar

has

    def decode(self, z):
        h3 = F.relu(self.fc3(z))
        return F.sigmoid(self.fc4(h3))

我无法向自己解释为什么最后一层应该在返回之前通过 sigmoid。

请解释。

编辑：我刚刚检查了没有 sigmoid。结果还是不错的。现在我不确定是否需要。

正如 Jim J 的回答中提到的，sigmoid 强制输出范围为 [0, 1]。在这种情况下，这并不是因为我们想要将输出解释为概率，而是为了强制将输出解释为灰度图像的像素强度。

如果删除 sigmoid，神经网络将必须知道所有输出都应在 [0, 1] 范围内。 sigmoid 可能有助于使学习过程更加稳定。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

neuralnetwork

Pytorch

autoencoder

Sigmoid

为什么自动编码器中的解码器在最后一层使用 sigmoid？的相关文章

神经网络中“特征”的定义是什么？

我是神经网络的初学者我对这个词很困惑feature 你能给我一个定义吗feature 这些特征是隐藏层中的神经元吗这些特征是输入向量的元素特征的数量等于网络输入层的节点数量如果您使用神经网络根据物理属性的测量将动物分类为猫或狗那么
Sklearn 随机森林回归器的错误

当尝试使用 y 数据拟合随机森林回归器模型时如下所示 0 00000000e 00 1 36094276e 02 4 46608221e 03 8 72660888e 03 1 31375786e 04 1 73580193e 04 2
哪些分类器提供权重向量？

存在哪些机器学习分类器可以在学习阶段后提供权重向量我了解 SVM 逻辑回归感知器和 LDA 还有更多吗我的目标是使用这些权重向量绘制重要性图其实任何线性分类器 https en wikipedia org title Linear
随着新数据的出现，如何增量训练 FANN？

我使用 FANN 库构建并训练了一个神经网络这是初步培训大部分数据将在线收集当在线数据可用时我想要improve使用这些新数据的网络不是重新训练而是使之前的训练更加准确如何用FANN来做这种增量训练呢从更改为的文件进行训练 s
使用 load_model 加载经过训练的tensorflow.keras模型会返回JSON解码错误，而未经训练的模型加载正常

我有一个训练有素的 Keras 模型使用 tensorflow keras API 构建和训练并使用tf keras save model 没有可选参数的方法 Tensorflow 是最新的我的 Python 版本是 3 8 根据我的
VotingClassifier：不同的功能集

在我的例子中我有两个不同的功能集因此行数相同且标签相同 DataFrames df1 A B C 1 4 2 1 4 8 2 1 1 2 3 0 3 2 5 df2 E F 6 1 1 3 8 1 2 8 5 2 labels lab
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
WEKA 的重采样过滤器 - 如何解释结果

我目前正在努力解决机器学习问题而我必须处理大量不平衡的数据集也就是说有六个类 1 2 6 不幸的是有例如对于 1 类有 150 个示例实例对于 2 有 90 个实例对于 3 类只有 20 个实例所有其他类都无法训练因为
如果我使用不同数量的核心，XGBoost 会产生相同的结果吗？

我在两台机器上安装了完全相同版本的 XGBoost 0 4 两台机器之间的唯一区别是 RAM 和内核数量 8 与 16 使用完全相同的数据我无法重现相同的结果它们略有不同小数点后第四第五位种子保留为默认值它是高度特定于实现的但
检查输入时出错：预期 conv2d_1_input 有 4 个维度，但得到形状为 (800, 1000) 的数组

我正在尝试使用 CNN 进行情感分析我的代码我的数据具有 1000 1000 形状当我将数据传递给 convolution2D 时它会抛出一个错误我无法解决我尝试了以下解决方案但仍然面临问题在构建 CNN 时我收到 Kera
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
朴素分类器 matlab

在 matlab 中测试朴素分类器时即使我在相同的样本数据上进行训练和测试我也会得到不同的结果我想知道我的代码是否正确是否有人可以帮助解释这是为什么 dimensionality reduction columns 6 U S V
Altair 中具有自定义置信区间的折线图

假设我有下面的数据框我检查了文档 https altair viz github io gallery line with ci html但它仅基于单个列可重现的代码 x np random normal 100 5 100 data
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
如何制作 U 矩阵？

为了可视化一个 U 矩阵到底是如何构建的自组织映射 http en wikipedia org wiki Self organizing map 更具体地说假设我有一个 3x3 节点的输出网格已经经过训练我如何从中构造一个 U 矩阵
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n

随机推荐

如何重定向到 404 上的特定网址

error 404 def error404 error return Nothing here sorry 这是响应404的方式bottle framework 但是在 404 上我想重定向到特定的 url 说http abc com h
为什么不能创建抽象类的对象？

这是我脑海中的一个场景我用谷歌搜索了很多但得到了像这样的答案抽象类没有实现方法所以我们无法创建对象抽象一词指示编译器不要创建该类的对象但是在一个简单的类中我们拥有所有虚拟方法能够创建对象此外我们可以定义不同的访问权限来
从 HSV 直方图中获取主色值

我正在根据如下图像创建 HSV 直方图 void processImageWithHsv Mat image Mat image hsv cvtColor image image hsv CV BGR2HSV int hbins 50 sb
如何停止 IIS 要求对本地主机上的默认网站进行身份验证

我在 Windows XP Pro SP2 上安装了 IIS 5 1 此外我还安装了带有 NET 3 5 的 VS 2008 Express 显然 IIS 已针对 NET 3 5 自动配置为 ASP NET 问题是每当我访问http lo
如何确保weak_ptr不是从临时的shared_ptr创建的？

我们来上课吧Foo和方法void use weak ptr std weak ptr
ANDROID：无法解析方法 getSupportActionBar()

这件事让我发疯我似乎无法让我的应用程序正确编译我通过复制 jar 文件将它们放入 libs 文件夹右键单击并将它们添加为库在我的应用程序中添加了支持库我已经尝试扩展 ActionBaractivity 但仍然没有任何方法无法识别
关于 C# 泛型最重要的事情...经验教训 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
删除字符串中 JavaScript 代码中的新行

我在 javascript 文件的源代码中有一个带有换行符的字符串如下所示 var str new line 现在我想删除代码中的换行符我找不到任何关于此的内容我一直在获取相关内容 n and r 提前致谢编辑 2021 这个问题是
刚习惯在 OS X 上的 emacs 中进行 paredit - 为什么 C-) 不起作用？

我最近在 Mac OS X Leopard 中设置了 Common Lisp 编程环境我发现 paredit 是一个不可或缺的 emacs 模块 Paredit 正在尽力帮助我更轻松地处理我的 Lisp 代码但我遇到了一些陷阱 C 必然
Mongoose.js 交易

我知道 MongoDB 不像关系数据库那样支持事务但我仍然想知道如何实现多个操作的原子性在网上搜寻我看到人们提到没有交易的交易 http www infoq com presentations Transactions without
如何在 C++ 中可靠地检查一个 Windows 进程是否是另一个 Windows 进程的父进程？

我正在开发一个函数它可以获取给定 PID 的父进程的 PID 该函数的原型是 DWORD getParentPid DWORD pid 为此我正在使用CreateToolhelp32Snapshot http msdn microsof
如何从应用程序内部启动 ClickOnce 应用程序的卸载？

我可以可靠地启动 ClickOnce 应用程序的卸载吗从应用程序内换句话说我想在其中一个表单上为用户提供一个大的立即卸载我按钮当用户单击该按钮时我想启动该应用程序的 Windows 卸载过程并且可能关闭该应用程序原因我们
编写一个“启用”依赖注入的库

我目前正在开发一个项目它将主要基于图书馆我希望使用依赖项注入来使用该库但我希望该库在很大程度上与所使用的容器无关我不久前写了一个桥库来使这类事情变得更容易但我不确定这是否真的是正确的方法图书馆 https github co
NPM 安装“sse4_crc32”时出错

我最初收到此错误是作为不同包的依赖项但当我自己尝试它时它也失败了因为这是我第一次尝试安装 node js 包所以我确信我错过了一些东西但是什么呢 npm install save sse4 crc32 gt email protec
是否可以同时从两个麦克风输入独立录制音频

尝试创建新的音频记录实例例如 mAudioInstance new Record MediaRecorder AudioSource MIC mAudioInstanceSecond new Record MediaRecorder Au
将 Visual Studio Code 中的终端移动到另一个屏幕（或新的编辑器选项卡）[重复]

这个问题在这里已经有答案了您知道是否可以在窗口中打开 Visual Studio Code 的终端以将其放在第二个屏幕上谢谢在 vscode 的下一版本 v1 58 中您将能够将终端拖动或移动到编辑器看https github c
从签名文档 DocuSign API 中检索信息

我是 DocuSign 的新手已经制作了教程并阅读了 DocuSign API 文档我正在用Java进行开发并已成功实现将用于签名的文档从模板发送到电子邮件地址然后打开文档填写自定义字段该文档由用户签名现在我遇到两个问题 1
Ebean或Siena有多成熟？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案上次我听到很多关于 Hibernate 的抱怨事实上我在 Hibernate 方面也有过一些痛苦的经历所以我读到了Ebean https
仅当存在特定字段时才自定义 JSON 反序列化（使用 Jackson）

反序列化时MyEntity 这是一个接口我要么有以下输入 id 123 在这种情况下我想将其反序列化为 new MyEntityRef 123 或者我有以下输入 id 123 message Hello world otherEnti
为什么自动编码器中的解码器在最后一层使用 sigmoid？

我正在看this https github com L1aoXingyu pytorch beginner blob master 08 AutoEncoder Variational autoencoder py工作变分自动编码器主要班

为什么自动编码器中的解码器在最后一层使用 sigmoid？

为什么自动编码器中的解码器在最后一层使用 sigmoid？ 的相关文章

随机推荐

热门标签

为什么自动编码器中的解码器在最后一层使用 sigmoid？的相关文章