趋近智
本章将从图像内容的分析过渡到使用生成对抗网络(GAN)合成新图像。GAN 提供了一个训练模型的框架,通过生成器 (负责创建数据)和判别器 (试图区分真实数据和生成数据)之间的竞争过程,以生成逼真的输出,通常是图像。
我们将首先回顾 GAN 的基本原理及其对抗性目标函数。随后,我们将讨论模式崩溃和不稳定性等常见的训练难题,以及可能的解决方案。您将学习重要的 GAN 结构,包括深度卷积 GAN (DCGAN)、用于受控生成的条件 GAN (cGAN),以及 StyleGAN 的基于风格的方法。评估生成图像质量和多样性的方法,例如 Fréchet Inception Distance (FID) 和 Inception Score (IS),也将涉及。本章包含一个关于实现 DCGAN 的实践练习。
7.1 GAN 基本原理回顾
7.2 训练生成对抗网络的挑战
7.3 深度卷积生成对抗网络 (DCGAN)
7.4 条件GANs用于可控生成
7.5 StyleGAN 架构与基于风格的生成
7.6 GAN 的评估指标
7.7 图像生成实践中的DCGAN实现