
使用自动编码器和
GAN
的表征学习和生成学习
|
515
率)或技术来解决训练稳定性或避免模式崩溃的问题。例如,一种称为重播体验的流行
技术包括将生成器在每次迭代中生成的图像存储在重播缓冲区中(逐渐删除较早生成的
图像),使用真实图像以及从该缓冲区取出的伪图像来训练判别器(而不是由当前生成器
生成的伪图像)。这减少了判别器过拟合最新生成器输出的图像的机会。另一种常见的
技术称为小批量判别:它可测量跨批次中相似图像的程度,并将此统计信息提供给判
别器,因此判别器可以轻松拒绝缺乏多样性的一整个批次的伪图像。这会鼓励生成器生
成更多样性的图像,从而减少模式崩溃。其他论文只是提出了一些表现良好的特定网络
架构。
简而言之,这仍然是一个非常活跃的研究领域,并且对 GAN 的动态过程还没有完全了
解。但是,好消息是已经取得了巨大的进步,其中一些结果确实令人震惊!让我们看一
些最成功的架构,首先是深度卷积 GAN,这是几年前的最新技术。然后,我们将研究两
种最新(更复杂)的架构。
17.9.2 深度卷积 GAN
2014 年的 GAN 原始论文试验了卷积层,但是只是生成了小图像。不久之后,许多研究
人员试图基于更深的卷积网络为更大的图像构建 GAN。由于训练非常不稳定,所以被
证明是棘手的,但是 Alec Radford 等人在实验了许多不同的架构和超参数之后,终于在
2015 年末取得了成功。他们称其架构为深度卷积 GAN( DCGAN)
注 13
。以下是他们为
构建稳定的卷积 GAN 提出的主要指导:
1
•
用跨步卷积(在判别器中 ...