所有课程

生成式AI扩散模型入门

章节 1: 生成模型简介

生成模型概述

扩散模型的缘由

核心思路：噪声与去噪

概率框架概述

第 1 章测验

章节 2: 前向扩散过程

定义马尔可夫链

高斯噪声调度

每一步的数学表示

从中间步骤采样

前向过程的性质

实践：模拟正向扩散

第 2 章测验

章节 3: 逆向扩散过程

目标：逆转马尔可夫链

逼近逆向转移

使用神经网络参数化逆向过程

预测噪声分量

去噪步骤的数学表达

第 3 章测验

章节 4: 模型架构与训练

用于噪声预测的U-Net架构

整合时间步信息

定义训练目标

简化训练损失的推导

动手实践：搭建U-Net

第 4 章测验

章节 5: 采样与生成过程

从噪声生成数据

DDPM采样算法

理解采样方差

加速采样方法介绍：DDIM

DDIM采样算法

DDPM与DDIM的权衡

动手实践：实现采样循环

第 5 章测验

章节 6: 扩散模型的条件生成

条件生成的动因

分类器引导

无分类器引导 (CFG)

实现分类器无关引导

文本条件要点

用于条件生成的架构修改

动手实践：应用引导

第 6 章测验

使用神经网络参数化逆向过程

这部分内容有帮助吗？

参考文献

Denoising Diffusion Probabilistic Models, Jonathan Ho, Ajay Jain, Pieter Abbeel, 2020 Advances in Neural Information Processing Systems (NeurIPS) DOI: 10.48550/arXiv.2006.11239 - 本文介绍了本节核心的特定参数化策略、噪声预测网络和固定方差选择。
Deep Unsupervised Learning using Nonequilibrium Thermodynamics, Jascha Sohl-Dickstein, Eric A. Weiss, Niru Maheswaranathan, Surya Ganguli, 2015 International Conference on Machine Learning (ICML) DOI: 10.48550/arXiv.1503.03585 - 这篇基础性论文介绍了扩散概率模型，定义了正向和反向过程，以及近似反向转换的通用框架。
U-Net: Convolutional Networks for Biomedical Image Segmentation, Olaf Ronneberger, Philipp Fischer, Thomas Brox, 2015 Medical Image Computing and Computer-Assisted Intervention (MICCAI) (Springer, Cham) DOI: 10.1007/978-3-319-24574-4_28 - 介绍了U-Net架构，该架构被广泛用作扩散模型中噪声预测网络的骨干。

© 2025 ApX Machine Learning用心打造