如何解释生成对抗网络中判别器的损失和生成器的损失？

2024-01-20

我正在阅读人们对 DCGAN 的实现，尤其是this one https://github.com/carpedm20/DCGAN-tensorflow在张量流中。

在该实现中，作者画出了判别器和生成器的损失，如下所示（图片来自https://github.com/carpedm20/DCGAN-tensorflow https://github.com/carpedm20/DCGAN-tensorflow):

鉴别器和生成器的损失似乎都不遵循任何模式。与一般神经网络不同，其损失随着训练迭代的增加而减少。如何解释训练 GAN 时的损失？

不幸的是，就像你对 GAN 所说的那样，损失是非常不直观的。大多数情况下，生成器和鉴别器相互竞争，因此一个的改进意味着另一个的损失更高，直到另一个更好地学习接收到的损失，这会搞砸其竞争对手，等等。

Now one thing that should happen often enough (depending on your data and initialisation) is that both discriminator and generator losses are converging to some permanent numbers, like this: (it's ok for loss to bounce around a bit - it's just the evidence of the model trying to improve itself)

这种损失收敛通常意味着 GAN 模型找到了一些最佳值，但它无法进一步改进，这也意味着它已经学习得足够好了。（另请注意，数字本身通常并不能提供太多信息。）

以下是一些旁注，希望对您有所帮助：

如果损失没有很好地收敛，并不一定意味着模型没有学到任何东西 - 检查生成的示例，有时它们足够好。或者，可以尝试更改学习率和其他参数。
如果模型收敛良好，仍然检查生成的示例 - 有时生成器会发现判别器无法与真实数据区分开的一个/几个示例。问题是它总是给出这几个，而不创建任何新的东西，这称为模式崩溃。通常为数据引入一些多样性会有所帮助。
由于普通 GAN 相当不稳定，我建议使用某些版本 DCGAN 模型 https://github.com/carpedm20/DCGAN-tensorflow，因为它们包含一些特征，例如卷积层和批量归一化，这应该有助于收敛的稳定性。（上图是 DCGAN 而不是 vanilla GAN 的结果）
这是一些常识，但仍然是：就像大多数神经网络结构调整模型一样，即更改其参数或/和架构以满足您的某些需求/数据可以改进模型或搞砸它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

deeplearning

generativeadversarialnetwork

如何解释生成对抗网络中判别器的损失和生成器的损失？的相关文章

如何使用keras打印神经网络中预测类的名称？

我在 keras 中使用预先训练的模型最终将类索引预测为一些整数值但我似乎不明白如何打印这些类的名称我使用的模型是 ResNet 50 看一下https martin thoma com image classification ht
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
如何在快速人工智能中获得给定测试集的预测并计算准确性？

我正在尝试加载由导出的学习者learn export 我想针对测试集运行它我希望我的测试集有标签以便我可以测量其准确性这是我的代码 test src TextList from df df path cols texts split
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
实例标准化与批量标准化

据我所知批量归一化通过将激活转向单位高斯分布来帮助加快训练速度从而解决梯度消失问题批量归一化行为在训练使用每个批次的平均值 var 和测试时间使用训练阶段的最终运行平均值 var 时应用不同另一方面实例归一化充当本文提到的对比
结合两个 CNN

我想在 Keras 中将两个 CNN 合并为一个我的意思是我希望神经网络拍摄两张图像并在单独的 CNN 中处理每一张图像然后将它们连接在一起进入扁平化层并使用全连接层来做最后的工作我做了什么 Start With First Bran
帮助我在 Python 中实现反向传播

EDIT2 新的训练集 Inputs 0 0 0 0 0 0 1 0 0 0 2 0 0 0 3 0 0 0 4 0 1 0 0 0 1 0 1 0 1 0 2 0 1 0 3 0 1 0 4 0 2 0 0 0 2 0 1 0 2 0 2
BERT 输出不确定

BERT 输出是不确定的当我输入相同的输入时我希望输出值是确定性的但我的 bert 模型的值正在变化听起来很尴尬同一个值返回两次一次也就是说一旦出现另一个值就会出现相同的值并重复如何使输出具有确定性让我展示我的代码片段
如何修复：AttributeError：模块“neat”没有属性“config”

我正在浏览使用发现的 NEAT 神经网络 API 玩 flappybird 的 AI 的指南当我运行从 Github 下载的代码时出现错误 Traceback most recent call last File test py lin
ValueError：“连接”层需要具有匹配形状的输入（连接轴除外）

我正在尝试为我的项目构建 Pix2Pix 并收到错误值错误 Concatenate层需要具有匹配形状的输入除了连接轴之外获得输入形状 None 64 64 128 None 63 63 128 生成器是一个 U 网模型我的输入高度
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每

随机推荐

TypeScript 函数定义中的嵌套泛型

我正在尝试为依赖于操作类型的 redux 操作创建类型安全的处理程序例如任何操作都可以描述为 type ActionType
如何在使用 range() 函数从列表中删除项目时迭代列表？ [复制]

这个问题在这里已经有答案了这是我在尝试学习 python 编程时遇到的最常见问题问题是当我尝试使用 range 函数迭代列表以检查列表中的给定项目是否满足给定条件如果满足则删除它它总是会给出 IndexError 那么是否有一种
Python Sockets：如何在同一 wifi 上的两台计算机之间进行连接

我有两台相邻的笔记本电脑想在它们之间发送消息我发现当客户端和服务器位于同一台计算机上时代码可以工作但当它们分开时它就不起作用 SERVER import socket def Main host localhost port 5000
VBA复杂的Getter、Setter语法

您好我对 VBA 相当陌生我需要创建一个具有相对复杂的 Getter 和 Setter 的对象为了做到这一点我不断地检查MSDN https msdn microsoft com en us library zzh9ha57 asp
最多可连接 45 台设备的多点连接框架

我希望使用多点连接框架并且感谢任何有关如何最好地进行的经验之谈我需要在教练设备和最多 45 个球员设备之间建立连接它们都将位于同一空间但无法预测 wifi 可用性或连接情况教练设备需要每秒向所有玩家设备发送一条指令一个小
使用 AES 加密文件、使用 RSA 加密密钥 - 我走在正确的轨道上吗？

概述我正在尝试设计一个应用程序来加密文件以安全地发送蜗牛邮件大量数据我计划使用 Net 中的 AES RijndaelManaged 加密来最初加密文件使用随机生成的密钥RNGCryptoServiceProvider 然后我使用
使用特定队列调用dispatch_async时的符号断点

我正在调试项目中涉及中央调度的问题在调试过程中如果有一种在工作被分派到特定队列时收到通知的方法将会非常有帮助有没有办法设置符号断点dispatch async有一个条件可以检查调度队列参数是否与我有权访问的其他队列相同以下是设置条
在类库（.NET 标准）中找不到位图类

我想制作一个类库 NET Standard 并且我正在使用 System Drawing 但我收到错误 CS0246 C 找不到类型或命名空间名称 Bitmap 您是否缺少 using 指令或程序集引用我正在使用 NET Standard
函数计算已在真/假表达式中使用，该表达式用作表过滤表达式，这是不允许的

我需要检查 ssas 表格模型中某个度量的当月和当年值但由于类型不匹配我无法执行此操作为此我创建了一个使用此 dax 查询的度量 CurrMonthYear CONCATENATE CONCATENATE concatenate y
设置表格单元格内容的最大高度

我有一张桌子它应该始终占据屏幕高度的一定百分比大多数行的高度都是固定的但我有一行应该拉伸以填充可用空间如果该行中单元格的内容溢出所需的高度我希望使用溢出隐藏来剪辑内容不幸的是表和行不遵守 max height 属性这是 W
从 A-Z 排序 div

我有一个聊天网页每个成员都有一个 DIV DIV 的外观如下 div div class chatmember 10001 div div class chatmember 10008 div div class chatmember 1
scipy 中的 kmeans 和 kmeans2 有什么区别？

我是机器学习的新手想知道 scipy 中 kmeans 和 kmeans2 之间的区别根据文档它们都使用 k means 算法但是如何选择它们呢根据文档 kmeans2 似乎是标准的 k 均值算法并且运行直到收敛到局部最优并且
SQL SELECT * FROM XXX WHERE 数组中的列名

我正在编写一些 SQL 代码我熟悉语法 SELECT FROM myTable WHERE myColumn in 1 2 3 假设我正在编写一些 C 代码我想在其中使用我使用过的 C 数组 1 2 3 我怎么做您可以动态构建 SQL
当活动被破坏时，GPS图标不会消失吗？

作为一个尝试 GPS 东西的 Android 新手我设法将这段代码组合在一起它的工作原理就像我期望的那样除了一件事 GPS 图标永远不会消失如何让GPS图标在Activity被破坏时消失我有 locationManager rem
在 Ruby 中如何找到机器上的空闲物理内存？

我想知道系统上有多少可用物理内存不包括任何交换区有没有办法在 Ruby 中获取这些信息如果您使用 Linux 您通常使用 free 命令来查找系统上的物理内存即 RAM 详细信息 output x free 输出将类似于以下字符串
如何使用 boto3 仅检索 S3 中的 last_modified 密钥

我只想使用 boto3 从 S3 存储桶中检索特定前缀中的 last modified 密钥 Get Today s date today datetime date today Get Objects date s3 boto3 reso
Angular8 i18n 用于占位符标签文本

如何在 ngx mat select search palceholderLabel 中添加 i18n div class form group col md 6 mb lg 5 mb 4 div
确保 MongoDb findAndModify 中独占读取的方法？

我有一个 MongoDB 集合用作作业队列多个进程从中读取记录使用findAndModify FindAndModify搜索记录其中activefield 为 false 将其设置为 true 这样其他进程就不会读取同一条记录问题
Excel Range 中的一维数组

我目前正在使用以下代码填充我的数组 Securities Option Base 1 Securities Array Worksheets 3 Range A8 A SymbolCount Value 这会生成一个二维数组其中每个地址都
如何解释生成对抗网络中判别器的损失和生成器的损失？

我正在阅读人们对 DCGAN 的实现尤其是this one https github com carpedm20 DCGAN tensorflow在张量流中在该实现中作者画出了判别器和生成器的损失如下所示图片来自https git

如何解释生成对抗网络中判别器的损失和生成器的损失？

如何解释生成对抗网络中判别器的损失和生成器的损失？ 的相关文章

随机推荐

热门标签

如何解释生成对抗网络中判别器的损失和生成器的损失？的相关文章