趋近智

所有课程

生成式AI扩散模型入门

章节 1: 生成模型简介

生成模型概述

扩散模型的缘由

核心思路：噪声与去噪

概率框架概述

第 1 章测验

章节 2: 前向扩散过程

定义马尔可夫链

高斯噪声调度

每一步的数学表示

从中间步骤采样

前向过程的性质

实践：模拟正向扩散

第 2 章测验

章节 3: 逆向扩散过程

目标：逆转马尔可夫链

逼近逆向转移

使用神经网络参数化逆向过程

预测噪声分量

去噪步骤的数学表达

第 3 章测验

章节 4: 模型架构与训练

用于噪声预测的U-Net架构

整合时间步信息

定义训练目标

简化训练损失的推导

动手实践：搭建U-Net

第 4 章测验

章节 5: 采样与生成过程

从噪声生成数据

DDPM采样算法

理解采样方差

加速采样方法介绍：DDIM

DDIM采样算法

DDPM与DDIM的权衡

动手实践：实现采样循环

第 5 章测验

章节 6: 扩散模型的条件生成

条件生成的动因

分类器引导

无分类器引导 (CFG)

实现分类器无关引导

文本条件要点

用于条件生成的架构修改

动手实践：应用引导

第 6 章测验

章节 4: 模型架构与训练

在确立了正向和逆向扩散过程的数学体系后，我们现在将说明如何实现逆向（去噪）步骤。这需要一个可训练的模型，它能够根据含噪声数据 $x_t$ 学习估算在特定时间步 $t$ 所添加的噪声。

本章主要说明这一核心模型的架构和训练流程。我们将介绍：

U-Net 架构： 考察 U-Net 的结构，这是一种常用于处理图像类数据并保留空间信息的卷积网络，这对于噪声预测是不可或缺的。
时间步整合： 提供扩散时间步 $t$ 作为网络输入的方法，使其能够相应地调整预测。
训练目标： 定义损失函数 (loss function)，通常是实际添加的噪声与网络预测的噪声之间的均方误差 (MSE)。我们将简要提及它与整体概率目标之间的关联。
训练算法： 概述使用批次数据训练噪声预测网络的分步流程。
实际配置： 讨论在代码中实现 U-Net 和时间步嵌入 (embedding)的重要方面。

完成本章后，你将理解扩散模型中使用的神经网络 (neural network)的设计原则以及训练它执行去噪任务的流程。

课程章节

4.1 用于噪声预测的U-Net架构
4.2 整合时间步信息
4.3 定义训练目标
4.4 简化训练损失的推导
4.5 训练算法
4.6 动手实践：搭建U-Net

© 2026 ApX Machine Learning