趋近智
首页
博客
课程
大模型
中
所有课程
进阶扩散模型架构与训练
章节 1: 基础回顾与进阶噪声调度
回顾:去噪扩散概率模型(DDPM)
回顾:去噪扩散隐式模型 (DDIM)
数学原理:分数匹配与常微分方程
标准噪声调度法的局限性
设计定制噪声调度
可学习方差调度
动手实践:实现噪声调度变体
章节 2: 高级U-Net架构
扩散模型中的标准U-Net
U-Net中的注意力机制(自注意力、交叉注意力)
在U-Net中整合时间嵌入
高级条件输入整合
为求效率的架构变体(深度、宽度、池化)
归一化方法(GroupNorm, AdaLN)
实操:修改带注意力机制的 U-Net
章节 3: 基于Transformer的扩散模型
生成式建模中采用Transformer模型的缘由
使Transformer适应图像数据 (ViT, 图像块嵌入)
扩散变换器 (DiT):架构概述
扩散Transformer模型中的条件作用
U-Net与Transformer在扩散模型中的比较
DiT 的实现考量
动手实践:构建一个简单的 DiT 模块
章节 4: 进阶训练技巧
分类器引导:原理与实现
无分类器引导 (CFG):理论与优势
实施与调整CFG尺度
高级损失函数形式 (v-预测, L_simple)
模型参数化 (epsilon预测 vs. x0预测)
训练稳定性的方法 (梯度裁剪, 指数移动平均)
扩散模型的混合精度训练
动手实践:实现无分类器引导
章节 5: 一致性模型
动机:对更快采样的需求
核心思想:一致性
一致性模型训练:蒸馏方法
一致性模型训练:独立方法
一致性模型中的采样 (单步和多步)
一致性模型的架构考量
权衡:速度与质量
实践操作:基本一致性蒸馏
章节 6: 进阶采样与优化
高阶求解器 (DPM-求解器, UniPC)
随机采样变体
引导采样改进
采样问题排查(伪影、模糊)
扩散模型的模型蒸馏
扩散模型的量化
硬件加速考量 (GPU 核函数, 编译)
动手实践:比较高级采样器
权衡:速度与质量
这部分内容有帮助吗?
有帮助
报告问题
标记为完成
© 2025 ApX Machine Learning
一致性模型:速度与质量的权衡