所有课程

进阶扩散模型架构与训练

章节 1: 基础回顾与进阶噪声调度

回顾：去噪扩散概率模型（DDPM）

回顾：去噪扩散隐式模型 (DDIM)

数学原理：分数匹配与常微分方程

标准噪声调度法的局限性

设计定制噪声调度

可学习方差调度

动手实践：实现噪声调度变体

章节 2: 高级U-Net架构

扩散模型中的标准U-Net

U-Net中的注意力机制（自注意力、交叉注意力）

在U-Net中整合时间嵌入

高级条件输入整合

为求效率的架构变体（深度、宽度、池化）

归一化方法（GroupNorm, AdaLN）

实操：修改带注意力机制的 U-Net

章节 3: 基于Transformer的扩散模型

生成式建模中采用Transformer模型的缘由

使Transformer适应图像数据 (ViT, 图像块嵌入)

扩散变换器 (DiT)：架构概述

扩散Transformer模型中的条件作用

U-Net与Transformer在扩散模型中的比较

DiT 的实现考量

动手实践：构建一个简单的 DiT 模块

章节 4: 进阶训练技巧

分类器引导：原理与实现

无分类器引导 (CFG)：理论与优势

实施与调整CFG尺度

高级损失函数形式 (v-预测, L_simple)

模型参数化 (epsilon预测 vs. x0预测)

训练稳定性的方法 (梯度裁剪, 指数移动平均)

扩散模型的混合精度训练

动手实践：实现无分类器引导

章节 5: 一致性模型

动机：对更快采样的需求

核心思想：一致性

一致性模型训练：蒸馏方法

一致性模型训练：独立方法

一致性模型中的采样 (单步和多步)

一致性模型的架构考量

权衡：速度与质量

实践操作：基本一致性蒸馏

章节 6: 进阶采样与优化

高阶求解器 (DPM-求解器, UniPC)

随机采样变体

引导采样改进

采样问题排查（伪影、模糊）

扩散模型的模型蒸馏

扩散模型的量化

硬件加速考量 (GPU 核函数, 编译)

动手实践：比较高级采样器

随机采样变体

这部分内容有帮助吗？

参考文献

Score-Based Generative Modeling through Stochastic Differential Equations, Yang Song, Jascha Sohl-Dickstein, Diederik P. Kingma, Abhishek Kumar, Stefano Ermon, Ben Poole, 2020 ICLR 2021 (Oral) DOI: 10.48550/arXiv.2011.13456 - 建立了扩散模型与随机微分方程（SDE）之间的联系，介绍了SDE求解器和预测-校正方法用于采样。
Denoising Diffusion Implicit Models, Jiaming Song, Chenlin Meng, Stefano Ermon, 2020 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.2010.02502 - 提出了一种确定性采样方法，同时引入了 η 参数，允许在逆向过程中控制性地重新引入随机性。

© 2026 ApX Machine Learning用心打造