使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

2024-04-13

当不使用 KL 散度项时，VAE 几乎完美地重建 mnist 图像，但在提供随机噪声时无法正确生成新图像。

当使用 KL 散度项时，VAE 在重建和生成图像时都会给出相同的奇怪输出。

这是损失函数的 pytorch 代码：

def loss_function(recon_x, x, mu, logvar):
    BCE = F.binary_cross_entropy(recon_x, x.view(-1, 784), size_average=True)
    KLD = -0.5 * torch.sum(1 + logvar - mu.pow(2) - logvar.exp())    
    return (BCE+KLD)

recon_x 是重建图像，x 是原始图像，mu 是均值向量，而 logvar 是包含方差对数的向量。

这里出了什么问题？提前致谢：）

一个可能的原因是两个损失之间的数值不平衡，您的BCE损失计算为批次的平均值（参见size_average=True）而KLD一是总结。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

deeplearning

Pytorch

autoencoder

bayesiannetworks

lossfunction

使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像的相关文章

如何平衡 GAN 中生成器和判别器的性能？

这是我第一次使用 GAN 我面临着判别器多次优于生成器的问题我正在尝试重现PA模型来自本文 http openaccess thecvf com content ICCV 2017 papers Sajjadi EnhanceNet Si
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
一次热编码期间出现 RunTimeError

我有一个数据集其中类值以 1 步从 2 到 2 i e 2 1 0 1 2 其中 9 标识未标记的数据使用一种热编码 self one hot encode labels 我收到以下错误 RuntimeError index 1 is
torch.mm、torch.matmul 和 torch.mul 有什么区别？

阅读完 pytorch 文档后我仍然需要帮助来理解之间的区别torch mm torch matmul and torch mul 由于我不完全理解它们所以我无法简明地解释这一点 B torch tensor 1 1207 0 3137
保存并加载 keras 自动编码器

看看这个奇怪的加载保存模型情况我保存了变分自动编码器模型及其编码器和解码器 autoencoder save autoencoder save overwrite True encoder save encoder save overw
了解随机起始权重对神经网络性能的影响

使用 R 和包neuralnet 我尝试对数据进行建模如下所示这些是几天内以 10 分钟为间隔的温度读数上面是 2 天的截图使用下面的代码我将神经网络拟合到数据可能有更简单的方法来对这些精确数据进行建模但将来数据可能看起来完全
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
PyTorch 中复数矩阵的行列式

有没有办法在 PyTorch 中计算复矩阵的行列式 torch det未针对 ComplexFloat 实现不幸的是目前尚未实施一种方法是实现您自己的版本或简单地使用np linalg det 这是一个简短的函数它计算我使用 LU
最大限度地降低重新分配人员的成本

我有属于不同类别的个人他们位于不同的地方区这些人口预计将从population值低于到demand value population and demand by category and zone lt tibble tribble
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
使用 keras 和多个序列进行时间序列预测

我明白了有状态 LSTM 预测示例 https github com fchollet keras blob master examples stateful lstm py在 Keras 中的单个序列上该示例有一个包含 50k 个观察值
BatchNorm 动量约定 PyTorch

Is the 批归一化动量约定 http pytorch org docs master modules torch nn modules batchnorm html 默认 0 1 与其他库一样正确例如Tensorflow默认情况下似乎
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
Keras，训练模型后如何预测？

我正在使用 reuters example 数据集它运行良好我的模型已经过训练我阅读了有关如何保存模型的信息以便稍后加载它以再次使用但如何使用这个保存的模型来预测新文本呢我用吗models predict 我必须以特殊方式准备这
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
如何有效地对一个数组中某个值在另一个数组中的位置出现的次数求和

我正在寻找一种有效的 for 循环避免解决方案来解决我遇到的数组相关问题我想使用一个巨大的一维数组 A gt size 250 000 用于一维索引的 0 到 40 之间的值以及用于第二维索引的具有 0 到 9995 之间的值的相同大
带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32

随机推荐

RttiType.TypeKind 和 RttiType.Name 之间有什么区别？

以下之间的语义差异是什么 RttiType TypeKind 和 RttiType Name 我问是因为原则上不能从名称推断出 TypeKind 吗 The TypeKind and Name的属性TRttiType是完全不同的事情 Typ
波特词干算法实现问题？

我正在尝试实现波特词干算法但我陷入了这一点 Step 1b m gt 0 EED gt EE feed gt feed agreed gt agree v ED gt plastered gt plaster bled gt bled v
无法连接到远程调试 - Web App Azure

我正在尝试使用 Visual Studio 2017 Professional 远程调试部署为 Azure 应用服务的 Asp Net Core Web 应用程序使用 Web API 项目按照记录的说明进行操作here https le
来自本机的 Android O 设备序列号

在 Android O 上从本机获取序列号而不调用 Java 的正确方法是什么Build getSerial 在 Android string serial read property ro boot serialno string rea
在 openpyxl 中为选项卡着色

我们有一种情况我们想要使用 openpyxl 为工作表的选项卡着色有没有办法在图书馆内做到这一点或者有没有人找到一种方法可以在库外部执行此操作即通过扩展或类似的方式您可以使用 openpyxl 为sheet properties
UIView的transitionWithView丢弃图层设置

我 viewDidload 我有这样的设置 self layer setCornerRadius 30 0f NSString imgFilepath NSBundle mainBundle pathForResource imageNam
IntelliJ IDEA中如何自动分割长字符串？

我正在编写一个包含很长字符串的测试我需要拆分这些字符串 private static final String TOO LONG JSON field1 field1 field2 field2 fieldN fieldN 所以他们会变成
在 Azure 上部署后 ChatBot 无法工作 - 内部服务器错误

我已经使用 LUIS 和 QnA Maker 部署了一个聊天机器人当我在模拟器上运行它时它在本地完美运行它在聊天开始时加载自适应卡我从 LUIS 那里得到了正确的回复但是当我在 Azure 上部署机器人并在 Web 聊天上测试它
使用带有返回值的访问者模式实现 AST 的最佳方法是什么？

我正在尝试使用访问者模式在 C 中实现一个简单的抽象语法树 AST 通常访问者模式不处理返回值但在我的 AST 中有一些表达式节点关心其子节点的返回类型和值例如我有一个这样的 Node 结构 class AstNode public
如何从 jenkins UI 控制台本身下载构建输出文件

我是新詹金斯使用詹金斯1 651 3战争部署于Tomcat6有没有办法从 jenkins UI 控制台本身下载 Jenkins 作业的输出文件我的作业生成了一个 jar 文件那么有人可以建议我是否有任何方法或插件可以使每个 Jenk
iPad、JavaScript 字符代码和 shiftKey

假设我有一个 Web 应用程序每次用户在 ID 为 txt 的文本区域中按下按键时该应用程序都会调用以下 jQuery txt keydown function e console log e which shows the keyCo
sqlite 相当于 row_number() over ( 分区 ...?

我想知道是否可以使用单个 sqlite 语句执行以下操作我的桌子看起来像这样 AnId UserId SomeDate SomeData 123 A 1 1 2010 aadsljvs 87 A 2 9 2010 asda fas 193
将java类文件转换为kotlin会导致编译错误

我有一个 java 类文件可以正常工作但是如果我将其转换为 Kotlin 则会出现一些问题这是一个Java版本 public class CallbackWrapper
如何在数学中为给定旋转轴的 3D 绘图制作动画

如果给定标准化旋转轴例如 1 Sqrt 3 1 Sqrt 3 1 Sqrt 3 和 3d 图例如 z x y Exp Sqrt x 2 y 2 Power 4 3 1 Power 4 3 1 Sqrt 1 2 Sqrt x 2 y 2
为什么活性/就绪性探测失败？

我正在尝试通过 Helm 图表将应用程序部署到 Kubernetes 集群每次我尝试部署应用程序时我都会得到活性探测失败获取http 172 17 0 7 80 http 172 17 0 7 80 拨号 TCP 172 17 0
为什么我的 Firebase 推送通知单个项目的打开率总是显示零计数？

从上图可以看出所有推送通知始终显示零打开率尽管我非常确定至少有 1 会打开推送通知我想跟踪一天内每条发送消息的打开率但如果从 Firebase 控制台打开基于当天的总体报告它将跟踪一天内发送的所有消息的打开率如下图所示那么为什
FTP 错误 530 用户无法登录

我正在尝试通过 FTP 访问我使用 Windows Server Web 64 位版本的 IIS 7 0 设置的新 FTP 站点但是当我尝试登录该网站时出现上述错误但我可以登录到我的其他 FTP 站点另外当我从 IIS 管理器中选
在 Core Graphics 中创建一个具有多色段的圆

我正在尝试绘制一个饼图该饼图由大小相等的部分组成每个部分具有不同的颜色我的代码基于此SO 在SWIFT中画一个圆弧段进度 https stackoverflow com questions 31807846 draw a circul
Indy10 + OpenSSL：发送电子邮件代码在 Windows 8 上停止工作

代码在 Windows 8 上停止运行它在 Windows7 Windows XP 上运行良好我找到了解决此问题的方法以 Windows 兼容模式启动应用程序 Windows XP Service Pack 3 代码工作如果 Win
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu

使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像 的相关文章

随机推荐

热门标签

使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像的相关文章