章节 6: 扩散模型的条件生成

迄今为止，我们已经了解了扩散模型如何通过逆转加噪过程来生成数据，其起点是纯随机噪声 $x_T \sim \mathcal{N}(0, \mathbf{I})$ 。这会产生反映训练数据分布的样本，但无法对输出进行精确控制。

然而，我们通常希望引导生成过程。例如，我们可能想生成特定物体类别的图像，或者根据文本描述创建图像。本章将介绍用于条件生成的方法，使我们能够根据额外信息（通常表示为条件 $y$ ）影响扩散模型的输出。

我们将考察诸如分类器引导等技术，其中一个独立的分类模型有助于将采样引向所需属性。随后我们将研究无分类器引导（CFG），这是一种广泛使用的方法，通过修改训练和采样流程，无需外部分类器即可实现类似控制。最后，我们将提及基于文本提示的条件设置的基础知识，这是现代文本到图像模型背后的重要技术。