趋近智
尽管生成对抗网络(GANs)常与生成逼真图像相关联,但其应用已扩展到生成各种其他形式的数据。本章将不再专注于标准图像合成,而是审视GANs如何适应不同的数据模态。
您将了解到在将GANs应用于非图像数据时遇到的具体难题。我们将讨论处理离散序列的方法,例如文本,包括使用强化学习信号和像Gumbel-Softmax技巧这样的连续近似方法。我们还将介绍生成音频波形和频谱图、连贯视频序列、像点云这样的3D数据表示以及像图这样的结构化数据的技术。本章将分析成功地将对抗训练原理应用于这些不同数据类型所需的架构修改和训练策略。
6.1 离散数据带来的难题:文本生成
6.2 强化学习方法 (SeqGAN, RankGAN)
6.3 连续近似(Gumbel-Softmax)
6.4 基于GAN的音频合成 (WaveGAN, SpecGAN)
6.5 视频生成与预测
6.6 三维数据生成 (点云, 网格)
6.7 使用GANs生成图
© 2026 ApX Machine Learning用心打造