所有课程

进阶扩散模型架构与训练

章节 1: 基础回顾与进阶噪声调度

回顾：去噪扩散概率模型（DDPM）

回顾：去噪扩散隐式模型 (DDIM)

数学原理：分数匹配与常微分方程

标准噪声调度法的局限性

设计定制噪声调度

可学习方差调度

动手实践：实现噪声调度变体

章节 2: 高级U-Net架构

扩散模型中的标准U-Net

U-Net中的注意力机制（自注意力、交叉注意力）

在U-Net中整合时间嵌入

高级条件输入整合

为求效率的架构变体（深度、宽度、池化）

归一化方法（GroupNorm, AdaLN）

实操：修改带注意力机制的 U-Net

章节 3: 基于Transformer的扩散模型

生成式建模中采用Transformer模型的缘由

使Transformer适应图像数据 (ViT, 图像块嵌入)

扩散变换器 (DiT)：架构概述

扩散Transformer模型中的条件作用

U-Net与Transformer在扩散模型中的比较

DiT 的实现考量

动手实践：构建一个简单的 DiT 模块

章节 4: 进阶训练技巧

分类器引导：原理与实现

无分类器引导 (CFG)：理论与优势

实施与调整CFG尺度

高级损失函数形式 (v-预测, L_simple)

模型参数化 (epsilon预测 vs. x0预测)

训练稳定性的方法 (梯度裁剪, 指数移动平均)

扩散模型的混合精度训练

动手实践：实现无分类器引导

章节 5: 一致性模型

动机：对更快采样的需求

核心思想：一致性

一致性模型训练：蒸馏方法

一致性模型训练：独立方法

一致性模型中的采样 (单步和多步)

一致性模型的架构考量

权衡：速度与质量

实践操作：基本一致性蒸馏

章节 6: 进阶采样与优化

高阶求解器 (DPM-求解器, UniPC)

随机采样变体

引导采样改进

采样问题排查（伪影、模糊）

扩散模型的模型蒸馏

扩散模型的量化

硬件加速考量 (GPU 核函数, 编译)

动手实践：比较高级采样器

设计定制噪声调度

这部分内容有帮助吗？

参考文献

Denoising Diffusion Probabilistic Models, Jonathan Ho, Ajay N. Jain, Pieter Abbeel, 2020 Advances in Neural Information Processing Systems (NeurIPS), Vol. 33 (Curran Associates, Inc.) DOI: 10.55919/neurips-2020-00101 - 这篇基础论文介绍了去噪扩散概率模型及其正向/逆向过程，包括最初的线性噪声调度。它对于理解噪声调度的基本原理很重要。
Improved Denoising Diffusion Probabilistic Models, Alexander Quinn Nichol, Prafulla Dhariwal, 2021 Proceedings of the 38th International Conference on Machine Learning, Vol. 139 (PMLR) DOI: 10.1109/ICCV48922.2021.00971 - 这篇论文引入了余弦噪声调度，作为线性调度的改进，直接解决了探索不同噪声调度设计的必要性。
Score-Based Generative Modeling through Stochastic Differential Equations, Yang Song, Jascha Sohl-Dickstein, Diederik P. Kingma, Abhishek Kumar, Stefano Ermon, Ben Poole, 2021 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.2011.13456 - 这篇论文提出了一个使用随机微分方程的基于分数的生成模型的统一框架，提供了噪声调度的连续时间视角及其与信噪比（SNR）的关联，信噪比是原理性调度设计的关键概念。
Elucidating the Design Space of Diffusion-Based Generative Models, Tero Karras, Miika Aittala, Samuli Laine, Erik Härkönen, Janne Hellsten, Jaakko Lehtinen, Timo Aila, 2022 Advances in Neural Information Processing Systems, Vol. 35 DOI: 10.55919/neurips-2022-ed1209b0 - 这篇论文系统地分析了扩散模型的多种设计选择，包括噪声调度（sigma调度）的具体参数化和设计，以及它们对样本质量和训练效率的影响。它为创建有效调度提供了具体指导。

© 2026 ApX Machine Learning用心打造