基于之前讨论的基础原理和局限,本章研究了使得生成对抗网络在质量、稳定性、和可控性方面大幅提升的架构创新。标准GAN在生成高分辨率图像或保持训练稳定性方面常遇到困难。在此,我们学习旨在解决这些问题的特定架构。
我们将涵盖几项重要进展:
- 渐进式增长(ProGAN): 学习如何在训练期间逐步提升网络分辨率,帮助稳定高清晰度图像的生成过程。
- 基于风格的生成(StyleGAN / StyleGAN2): 理解基于风格的生成器的运作方式,包括映射网络和自适应实例归一化(AdaIN),这些机制增强了对生成图像属性的控制。
- GAN扩展(BigGAN): 研究正交正则化和自注意力等技术,这些技术使得GAN可以在更大规模上有效训练,生成高质量和多样化的样本。
- 非配对图像转换(CycleGAN): 学习循环一致性损失的思路,其公式为 Lcyc(G,F)=Ex∼pdata(x)[∣∣F(G(x))−x∣∣1]+Ey∼pdata(y)[∣∣G(F(y))−y∣∣1],使得在没有配对数据的情况下进行域间转换成为可能。
- 注意力机制: 分析如何引入自注意力层帮助模型捕获长距离空间依赖关系。
通过剖析这些架构,你将了解驱动现代高性能生成模型的原理。本章还包括StyleGAN等重要组件的实际实现指导。