所有课程

高级合成数据生成：GAN和扩散模型

章节 1: 生成模型基本原理回顾

用于生成的概率建模

生成模型分类

高维数据生成中的挑战

扩散模型原理介绍

章节 2: 高级GAN架构与技术

渐进式生成对抗网络 (ProGAN)

基于风格的生成器（StyleGAN变体）

非配对图像到图像转换 (CycleGAN)

条件生成对抗网络：架构与控制

GAN中的注意力机制

分析与调整GAN潜在空间

动手实践：实现StyleGAN组件

章节 3: GAN训练稳定性与优化

诊断训练不稳定：振荡与发散

模式坍塌：原因与缓解策略

替代损失函数（WGAN, WGAN-GP, LSGAN）

GAN 的正则化方法

双时间尺度更新规则 (TTUR)

GAN的超参数调整策略

动手实践：WGAN-GP 的实现

章节 4: 扩散模型：理论与进阶实现

数学基本原理：随机微分方程

去噪扩散概率模型 (DDPM)

基于得分的生成模型

改进技术：DDIM和方差调度

分类器引导与无分类器引导

扩散模型 (U-Net) 的结构考量

动手实践：构建基础DDPM

章节 5: 合成数据质量评估

生成模型评估中的难题

定量指标：IS、FID、精确率、召回率

分布度量：核Inception距离 (KID)

生成对抗网络（GAN）的感知路径长度（PPL）

定性评估方法

评估条件生成模型

动手实践：计算FID分数

章节 6: 高级应用与整合

高分辨率生成策略

文本到图像生成架构

合成数据：扩充与隐私保护

使用生成模型进行视频生成

结合GAN与扩散模型

计算考量与扩展

实践操作：条件图像生成

使用生成模型进行视频生成

这部分内容有帮助吗？

参考文献

Generating Videos with Spatio-Temporal Generative Adversarial Networks, Carl Vondrick, Hamed Pirsiavash, Antonio Torralba, 2016 Advances in Neural Information Processing Systems (NeurIPS), Vol. 29 (NeurIPS Foundation) - 引入使用3D卷积生成对抗网络进行视频合成的奠基性工作。
MoCoGAN: Decomposing Motion and Content for Video Generation, Sergey Tulyakov, Ming-Yu Liu, Xiaodong Yang, Jan Kautz, 2018 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (IEEE Computer Society) DOI: 10.1109/CVPR.2018.00165 - 提出了一种GAN架构，用于解耦视频生成中的运动和内容，以提高时间连贯性。

© 2025 ApX Machine Learning用心打造