所有课程

进阶扩散模型架构与训练

章节 1: 基础回顾与进阶噪声调度

回顾：去噪扩散概率模型（DDPM）

回顾：去噪扩散隐式模型 (DDIM)

数学原理：分数匹配与常微分方程

标准噪声调度法的局限性

设计定制噪声调度

可学习方差调度

动手实践：实现噪声调度变体

章节 2: 高级U-Net架构

扩散模型中的标准U-Net

U-Net中的注意力机制（自注意力、交叉注意力）

在U-Net中整合时间嵌入

高级条件输入整合

为求效率的架构变体（深度、宽度、池化）

归一化方法（GroupNorm, AdaLN）

实操：修改带注意力机制的 U-Net

章节 3: 基于Transformer的扩散模型

生成式建模中采用Transformer模型的缘由

使Transformer适应图像数据 (ViT, 图像块嵌入)

扩散变换器 (DiT)：架构概述

扩散Transformer模型中的条件作用

U-Net与Transformer在扩散模型中的比较

DiT 的实现考量

动手实践：构建一个简单的 DiT 模块

章节 4: 进阶训练技巧

分类器引导：原理与实现

无分类器引导 (CFG)：理论与优势

实施与调整CFG尺度

高级损失函数形式 (v-预测, L_simple)

模型参数化 (epsilon预测 vs. x0预测)

训练稳定性的方法 (梯度裁剪, 指数移动平均)

扩散模型的混合精度训练

动手实践：实现无分类器引导

章节 5: 一致性模型

动机：对更快采样的需求

核心思想：一致性

一致性模型训练：蒸馏方法

一致性模型训练：独立方法

一致性模型中的采样 (单步和多步)

一致性模型的架构考量

权衡：速度与质量

实践操作：基本一致性蒸馏

章节 6: 进阶采样与优化

高阶求解器 (DPM-求解器, UniPC)

随机采样变体

引导采样改进

采样问题排查（伪影、模糊）

扩散模型的模型蒸馏

扩散模型的量化

硬件加速考量 (GPU 核函数, 编译)

动手实践：比较高级采样器

扩散模型的模型蒸馏

这部分内容有帮助吗？

参考文献

Distilling the Knowledge in a Neural Network, Geoffrey Hinton, Oriol Vinyals, and Jeff Dean, 2015 arXiv preprint arXiv:1503.02531 DOI: 10.48550/arXiv.1503.02531 - 介绍了知识蒸馏的概念，即训练一个较小的学生模型来模仿较大教师模型的输出。
Progressive Distillation for Fast Sampling of Diffusion Models, Tim Salimans and Jonathan Ho, 2022 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.2202.00512 - 提出了渐进式蒸馏方法，这是一种通过在每个阶段将步数减半来训练扩散模型以实现更快、少步采样的迭代技术。
Consistency Models, Yang Song, Prafulla Dhariwal, Mark Chen, Ilya Sutskever, 2023 ICML 2023 DOI: 10.48550/arXiv.2303.01469 - 介绍了用于一步生成的一致性模型，可通过类似蒸馏的方法或独立训练以实现快速采样。

© 2025 ApX Machine Learning用心打造