趋近智
迄今为止,我们已经了解了扩散模型如何通过逆转加噪过程来生成数据,其起点是纯随机噪声 xT∼N(0,I)。这会产生反映训练数据分布的样本,但无法对输出进行精确控制。
然而,我们通常希望引导生成过程。例如,我们可能想生成特定物体类别的图像,或者根据文本描述创建图像。本章将介绍用于 条件 生成的方法,使我们能够根据额外信息(通常表示为条件 y)影响扩散模型的输出。
我们将考察诸如分类器引导等技术,其中一个独立的分类模型有助于将采样引向所需属性。随后我们将研究无分类器引导(CFG),这是一种广泛使用的方法,通过修改训练和采样流程,无需外部分类器即可实现类似控制。最后,我们将提及基于文本提示的条件设置的基础知识,这是现代文本到图像模型背后的重要技术。
本章结束时,您将理解如何实现并应用这些引导技术,以便更好地控制扩散模型的生成能力。
6.1 条件生成的动因
6.2 分类器引导
6.3 无分类器引导 (CFG)
6.4 实现分类器无关引导
6.5 文本条件要点
6.6 用于条件生成的架构修改
6.7 动手实践:应用引导
© 2026 ApX Machine Learning用心打造