趋近智
虽然像DDIM和高阶常微分方程(ODE)求解器这样的确定性采样器通过去除原始DDPM表述中固有的随机性成分,提供了大幅度提升的速度,但在某些情况下重新引入噪声可能带来益处。随机采样变体运用扩散过程的随机性,通常与底层理论更为贴合,有时在样本多样性和质量方面提供优势,但它们通常比高度优化的确定性方法需要更多的采样步骤。
回顾一下,DDPM中的逆向过程涉及预测在时间步 t 添加的噪声,然后从以 xt 和预测噪声的函数为中心的高斯分布中采样 xt−1,并使用学习或固定的方差 σt2。这个明确的采样步骤引入了随机性。
xt−1∼N(μθ(xt,t),σt2I)确定性采样器有效地将 σt=0(如 η=0 的DDIM)或使用常微分方程(ODE)表述来近似该过程,该表述描述了样本在噪声移除时的预期路径。相比之下,随机采样器保留一个噪声项,旨在求解对应的随机微分方程(SDE)。
逆时SDE通常呈现如下一般形式:
dx=f(x,t)dt+g(t)dwˉ这里,dx 表示样本 x 在微小时间步 dt 内的变化。f(x,t)dt 项是漂移项,引导样本趋向更低的噪声水平(这是ODE求解器所近似的)。g(t)dwˉ 项是扩散项或随机项,g(t) 调整噪声的尺度,dwˉ 表示无穷小随机噪声(来自维纳过程)。随机采样器包含了对这个 g(t)dwˉ 项的近似。
DDPM祖先采样器: 原始DDPM采样器本身是随机的。它直接实现逆向过程的马尔可夫链定义,使用模型的预测均值 μθ(xt,t) 和方差时间表 σt2(可以是固定的,如 βt,或学习的)来生成 xt−1。作为一种基本方法,它通常需要许多步骤(例如1000步)才能生成高质量结果。
SDE求解器(例如,欧拉-马鲁亚马方法): 这些是为求解SDE而设计的数值方法。欧拉-马鲁亚马方法是欧拉方法在ODE方面的一个直接扩展。一个更新步骤大致如下:
xt−Δt≈xt+f(xt,t)Δt+g(t)Δtzt其中 zt∼N(0,I) 是标准高斯噪声。这在每一步明确地添加了按比例调整的噪声,并由SDE表述引导。尽管简单,但它可能需要小的 Δt(即许多步骤)以确保稳定性和准确性。
预测-校正方法: 受Score-SDE启发而来的采样器通常在每个时间步内采用两阶段过程:
确定性求解器的随机变体: 一些方法在原本确定性的求解器(如 η>0 的DDIM)中加入噪声注入步骤。这提供了一个可调参数来控制随机性程度,以平衡速度和多样性。例如,SDEdit在逆向过程的大部分时间中使用确定性ODE求解器,但在中间时间步 tedit 引入大量噪声,然后继续求解,有效地扰动采样路径以增加多样性或执行编辑任务。
选择随机采样器和确定性采样器涉及权衡:
从时间T的相同初始噪声开始,确定性采样器遵循单一路径到达最终样本。随机采样器在中间步骤引入随机性,导致不同的潜在路径和最终结果。
使用随机采样器时:
g(t)): 在整个过程中注入噪声的幅度很重要。它通常遵循与原始扩散过程噪声水平相关的调度。不正确的缩放会损害样本质量。总而言之,随机采样变体提供了一种生成方法,它包含随机性。尽管通常比最新确定性求解器慢,但它们在样本多样性和与底层SDE理论的更紧密贴合方面提供优势,为控制和优化扩散模型生成过程提供了另一套工具。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造