所有课程

进阶扩散模型架构与训练

章节 1: 基础回顾与进阶噪声调度

回顾：去噪扩散概率模型（DDPM）

回顾：去噪扩散隐式模型 (DDIM)

数学原理：分数匹配与常微分方程

标准噪声调度法的局限性

设计定制噪声调度

可学习方差调度

动手实践：实现噪声调度变体

章节 2: 高级U-Net架构

扩散模型中的标准U-Net

U-Net中的注意力机制（自注意力、交叉注意力）

在U-Net中整合时间嵌入

高级条件输入整合

为求效率的架构变体（深度、宽度、池化）

归一化方法（GroupNorm, AdaLN）

实操：修改带注意力机制的 U-Net

章节 3: 基于Transformer的扩散模型

生成式建模中采用Transformer模型的缘由

使Transformer适应图像数据 (ViT, 图像块嵌入)

扩散变换器 (DiT)：架构概述

扩散Transformer模型中的条件作用

U-Net与Transformer在扩散模型中的比较

DiT 的实现考量

动手实践：构建一个简单的 DiT 模块

章节 4: 进阶训练技巧

分类器引导：原理与实现

无分类器引导 (CFG)：理论与优势

实施与调整CFG尺度

高级损失函数形式 (v-预测, L_simple)

模型参数化 (epsilon预测 vs. x0预测)

训练稳定性的方法 (梯度裁剪, 指数移动平均)

扩散模型的混合精度训练

动手实践：实现无分类器引导

章节 5: 一致性模型

动机：对更快采样的需求

核心思想：一致性

一致性模型训练：蒸馏方法

一致性模型训练：独立方法

一致性模型中的采样 (单步和多步)

一致性模型的架构考量

权衡：速度与质量

实践操作：基本一致性蒸馏

章节 6: 进阶采样与优化

高阶求解器 (DPM-求解器, UniPC)

随机采样变体

引导采样改进

采样问题排查（伪影、模糊）

扩散模型的模型蒸馏

扩散模型的量化

硬件加速考量 (GPU 核函数, 编译)

动手实践：比较高级采样器

高级损失函数形式 (v-预测, L_simple)

这部分内容有帮助吗？

参考文献

Denoising Diffusion Probabilistic Models, Jonathan Ho, Ajay Jain, and Pieter Abbeel, 2020 Advances in Neural Information Processing Systems DOI: 10.48550/arXiv.2006.11239 - 这篇基础性论文介绍了去噪扩散概率模型（DDPM）框架和简化的噪声预测损失（$L_{simple}$），这已成为训练扩散模型的标准方法。
Elucidating the Design Space of Diffusion-Based Generative Models, Tero Karras, Miika Aittala, Timo Aila, and Samuli Laine, 2022 Advances in Neural Information Processing Systems DOI: 10.48550/arXiv.2206.00364 - 这项研究系统地分析了扩散模型的各种架构和训练设计选择，包括不同的损失权重和预测目标（如v-prediction），提供了它们对性能影响的见解。

© 2025 ApX Machine Learning用心打造