本文是对http://www.seeprettyface.com/research_notes.html的学习笔记
不想让GANs随机生成图片,希望通过控制输入的参数去生成特定的图片。例如:在手写数字图片的生成中,希望通过输入,控制数字,高度以及形状等。但为输入的某一维度,对输出的影响是不清楚的。
1. InfoGAN:可解释的GAN
人为要求输入向量对输出影响要明确。把输入的向量z拆分为子向量c和子向量z',我们希望输出包含c的信息,即我们可以通过一个classifier提取出c的信息,同时为保证输出图像x的真实度,增加一个判别器,判断图像x的real/fake(感觉和StarGAN很像,只不过StarGAN把classifier和detector合并为一个判别器:输入一张图片,输出real/fake,以及图片所属的domain,并且每个domain的语义是清晰的)。
但是我们依旧无法人为的控制图片的某些部分,只能通过输入图片和classifier去学习,在特征差异最大的地方做划分。最后通过实验去理解向量c的作用。