基于之前讨论的基础原理和局限,本章研究了使得生成对抗网络在质量、稳定性、和可控性方面大幅提升的架构创新。标准GAN在生成高分辨率图像或保持训练稳定性方面常遇到困难。在此,我们学习旨在解决这些问题的特定架构。我们将涵盖几项重要进展:渐进式增长(ProGAN): 学习如何在训练期间逐步提升网络分辨率,帮助稳定高清晰度图像的生成过程。基于风格的生成(StyleGAN / StyleGAN2): 理解基于风格的生成器的运作方式,包括映射网络和自适应实例归一化(AdaIN),这些机制增强了对生成图像属性的控制。GAN扩展(BigGAN): 研究正交正则化和自注意力等技术,这些技术使得GAN可以在更大规模上有效训练,生成高质量和多样化的样本。非配对图像转换(CycleGAN): 学习循环一致性损失的思路,其公式为 $L_{cyc}(G, F) = \mathbb{E}{x \sim p{data}(x)}[||F(G(x)) - x||1] + \mathbb{E}{y \sim p_{data}(y)}[||G(F(y)) - y||_1]$,使得在没有配对数据的情况下进行域间转换成为可能。注意力机制: 分析如何引入自注意力层帮助模型捕获长距离空间依赖关系。通过剖析这些架构,你将了解驱动现代高性能生成模型的原理。本章还包括StyleGAN等重要组件的实际实现指导。