所有课程

高级合成数据生成：GAN和扩散模型

章节 1: 生成模型基本原理回顾

用于生成的概率建模

生成模型分类

高维数据生成中的挑战

扩散模型原理介绍

章节 2: 高级GAN架构与技术

渐进式生成对抗网络 (ProGAN)

基于风格的生成器（StyleGAN变体）

非配对图像到图像转换 (CycleGAN)

条件生成对抗网络：架构与控制

GAN中的注意力机制

分析与调整GAN潜在空间

动手实践：实现StyleGAN组件

章节 3: GAN训练稳定性与优化

诊断训练不稳定：振荡与发散

模式坍塌：原因与缓解策略

替代损失函数（WGAN, WGAN-GP, LSGAN）

GAN 的正则化方法

双时间尺度更新规则 (TTUR)

GAN的超参数调整策略

动手实践：WGAN-GP 的实现

章节 4: 扩散模型：理论与进阶实现

数学基本原理：随机微分方程

去噪扩散概率模型 (DDPM)

基于得分的生成模型

改进技术：DDIM和方差调度

分类器引导与无分类器引导

扩散模型 (U-Net) 的结构考量

动手实践：构建基础DDPM

章节 5: 合成数据质量评估

生成模型评估中的难题

定量指标：IS、FID、精确率、召回率

分布度量：核Inception距离 (KID)

生成对抗网络（GAN）的感知路径长度（PPL）

定性评估方法

评估条件生成模型

动手实践：计算FID分数

章节 6: 高级应用与整合

高分辨率生成策略

文本到图像生成架构

合成数据：扩充与隐私保护

使用生成模型进行视频生成

结合GAN与扩散模型

计算考量与扩展

实践操作：条件图像生成

改进技术：DDIM和方差调度

这部分内容有帮助吗？

参考文献

Denoising Diffusion Implicit Models, Jiaming Song, Chenlin Meng, Stefano Ermon, 2020 ICLR 2021 DOI: 10.48550/arXiv.2010.02502 - 引入了DDIM，这是一种非马尔可夫生成过程，可实现显著更快且确定性的扩散模型采样，无需重新训练。
Denoising Diffusion Probabilistic Models, Jonathan Ho, Ajay Jain, and Pieter Abbeel, 2020 Advances in Neural Information Processing Systems (NeurIPS) DOI: 10.48550/arXiv.2006.11239 - 介绍了去噪扩散概率模型（DDPM）的基础论文，定义了其前向和反向过程。
Improved Denoising Diffusion Probabilistic Models, Alexander Quinn Nichol, Prafulla Dhariwal, 2021 Proceedings of the 38th International Conference on Machine Learning, Vol. 139 (PMLR) DOI: 10.1109/ICCV48922.2021.01050 - 提出了余弦方差调度及其他DDPM改进，提高了样本质量和训练稳定性。
Score-Based Generative Modeling through Stochastic Differential Equations, Yang Song, Jascha Sohl-Dickstein, Diederik P. Kingma, Abhishek Kumar, Stefano Ermon, Ben Poole, 2021 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.2011.13456 - 提出了基于分数的生成模型和扩散模型的统一框架，强调了确定性采样（如η=0的DDIM）与概率流ODE之间的联系。

© 2026 ApX Machine Learning用心打造