所有课程

进阶扩散模型架构与训练

章节 1: 基础回顾与进阶噪声调度

回顾：去噪扩散概率模型（DDPM）

回顾：去噪扩散隐式模型 (DDIM)

数学原理：分数匹配与常微分方程

标准噪声调度法的局限性

设计定制噪声调度

可学习方差调度

动手实践：实现噪声调度变体

章节 2: 高级U-Net架构

扩散模型中的标准U-Net

U-Net中的注意力机制（自注意力、交叉注意力）

在U-Net中整合时间嵌入

高级条件输入整合

为求效率的架构变体（深度、宽度、池化）

归一化方法（GroupNorm, AdaLN）

实操：修改带注意力机制的 U-Net

章节 3: 基于Transformer的扩散模型

生成式建模中采用Transformer模型的缘由

使Transformer适应图像数据 (ViT, 图像块嵌入)

扩散变换器 (DiT)：架构概述

扩散Transformer模型中的条件作用

U-Net与Transformer在扩散模型中的比较

DiT 的实现考量

动手实践：构建一个简单的 DiT 模块

章节 4: 进阶训练技巧

分类器引导：原理与实现

无分类器引导 (CFG)：理论与优势

实施与调整CFG尺度

高级损失函数形式 (v-预测, L_simple)

模型参数化 (epsilon预测 vs. x0预测)

训练稳定性的方法 (梯度裁剪, 指数移动平均)

扩散模型的混合精度训练

动手实践：实现无分类器引导

章节 5: 一致性模型

动机：对更快采样的需求

核心思想：一致性

一致性模型训练：蒸馏方法

一致性模型训练：独立方法

一致性模型中的采样 (单步和多步)

一致性模型的架构考量

权衡：速度与质量

实践操作：基本一致性蒸馏

章节 6: 进阶采样与优化

高阶求解器 (DPM-求解器, UniPC)

随机采样变体

引导采样改进

采样问题排查（伪影、模糊）

扩散模型的模型蒸馏

扩散模型的量化

硬件加速考量 (GPU 核函数, 编译)

动手实践：比较高级采样器

一致性模型训练：蒸馏方法

这部分内容有帮助吗？

参考文献

Consistency Models, Yang Song, Prafulla Dhariwal, Mark Chen, Ilya Sutskever, 2023 ICML 2023 DOI: 10.48550/arXiv.2303.01469 - 介绍了一致性模型及其一致性蒸馏训练方法，可实现快速一步生成。
Denoising Diffusion Probabilistic Models, Jonathan Ho, Ajay Jain, and Pieter Abbeel, 2020 Advances in Neural Information Processing Systems (NeurIPS 2020) DOI: 10.48550/arXiv.2006.11239 - 提出了去噪扩散概率模型的核心架构和训练方法，该模型常作为一致性蒸馏中的教师模型。
Diffusion Models Beat GANs on Image Synthesis, Prafulla Dhariwal, Alex Nichol, 2021 Advances in Neural Information Processing Systems (NeurIPS 2021) DOI: 10.48550/arXiv.2105.05233 - 详细说明了如何训练高质量扩散模型并提高采样效率，使其成为蒸馏技术的有效教师模型。
Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference, Simian Luo, Yiqin Tan, Longbo Huang, Jian Li, Hang Zhao, 2023 arXiv preprint arXiv:2310.04378 DOI: 10.48550/arXiv.2310.04378 - 将一致性蒸馏应用于潜在空间扩散模型，以更少的推理步骤实现高分辨率图像生成。

© 2025 ApX Machine Learning用心打造