趋近智
前向扩散过程将初始数据点(例如清晰图像 x0)在一系列离散时间步 t=1,2,...,T 中逐渐损坏成噪声。这种有序的损坏并非随意;它遵循一种特定的概率模型,称为马尔可夫链。
马尔可夫链是一个随机变量序列,其中转移到下一状态的概率仅取决于当前状态,而不取决于之前的事件序列。在我们这里,这些“状态”是数据逐渐增噪的版本:x0,x1,x2,...,xT。其决定性特征是,要得到 xt,我们只需要知道 xt−1 以及在步骤 t 添加噪声的规则。我们不需要直接知道 xt−2 或任何更早的状态。
我们可以这样表示这个序列:
x0→x1→x2→⋯→xt−1→xt→⋯→xT这里:
从一个状态 xt−1 到下一个状态 xt 的转移由条件概率分布定义,记作 q(xt∣xt−1)。这个分布规定了在给定 xt−1 的情况下如何采样 xt。因为这个过程只取决于前一个状态,它满足马尔可夫性质:
q(xt∣xt−1,xt−2,…,x0)=q(xt∣xt−1)这个性质极大简化了前向过程的分析和实现。我们不需要追踪整个加噪历史来确定下一状态;只需要紧邻的前一个状态。
从视觉上看,我们可以描绘出这种依赖链:
前向扩散过程被建模为马尔可夫链。每个箭头表示一个转移 q(xt∣xt−1),其中噪声的添加仅基于前一个状态。
在后续部分,我们将详细阐述转移 q(xt∣xt−1) 的具体数学形式,这涉及在每一步添加经过仔细调整的高斯噪声,并由预定方案控制。理解这种马尔可夫结构是理解扩散模型如何运作,以及最终它们如何学习逆转此过程以进行生成的第一步。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造