趋近智
去噪扩散概率模型(DDPM)和去噪扩散隐式模型(DDIM)是从训练好的扩散模型中采样(生成)的两种主要方法。虽然这两种方法都运用了训练好的噪声预测网络来逆转扩散过程,但它们操作方式不同,因此带来了不同的权衡。选择哪种方法取决于具体的生成速度、样本质量和期望随机性水平方面的要求。
让我们从几个重要方面来比较DDPM和DDIM。
DDPM采样,按其最初的公式,需要逐步模拟逆向马尔可夫链。如果模型训练了 个时间步(通常 或更多),DDPM采样就涉及对神经网络 (neural network)进行 次顺序评估。这使得该过程计算量大且相对缓慢,因为每一步都依赖于前一步。
DDIM在此方面提供了显著优势。由于DDIM以不同的方式构建生成过程(与求解基础微分方程有关),它不严格要求模拟原始正向过程序列 中的每一个时间步。相反,您可以选择一个时间步的子序列,比如 步(例如,),并仅在这些选定的时间步执行去噪更新。这大大减少了所需的网络评估次数,从而使样本生成速度快得多。例如,使用100步的DDIM可以比使用1000步的DDPM快10倍。
通常,步数较多( 或更多)的DDPM采样已知能生成与训练数据分布非常匹配的高保真样本。每一步添加随机性的缓慢、渐进式去噪过程有助于实现这种质量。
DDIM通常可以在比DDPM明显更少的步数下,达到可比甚至非常好的样本质量。然而,这通常存在权衡:过度减少DDIM步数(例如,根据模型和数据集,低于20-50步)可能导致样本质量相对于完整的DDPM运行出现明显的下降。DDIM的最佳步数通常需要通过实验来平衡速度和保真度。对于许多应用来说,100-200步的DDIM所产生的质量已足够,并且速度提升是可观的。
比较展示了DDPM和DDIM的样本质量(由FID等指标表示,越低越好)如何随采样步数变化。DDIM能更快地获得良好质量,但其质量下限可能比DDPM在最大步数下的表现略高。
DDPM采样本身就具有随机性。在每一步 ,逆向转换 都涉及采样,通常是通过添加由方差项 缩放的高斯噪声。这意味着即使从相同的初始噪声 开始,多次运行DDPM采样过程也会产生不同的最终样本 。这种随机性有助于生成样本的多样化。
DDIM引入了一个参数 (parameter),通常表示为 (eta),它控制着采样过程中的随机性程度。
这种确定性属性()对于需要可重复性的应用,或对于图像反演和操作等任务很有帮助,在这些任务中您希望潜在噪声与生成图像之间存在可预测的对应关系。0到1之间的值允许在确定性和随机生成之间进行插值。
DDPM采样遵循预定义的时间步序列 。它不容易改变去噪过程中所取步骤的“大小”。
DDIM的公式提供了更大的灵活性。通过允许使用原始时间步的子序列进行采样,DDIM从而实现了去噪过程中更大、非均匀的步长。这通过其与求解微分方程的联系得到了数学上的解释,在微分方程中步长可以进行调整。
| 特性 | DDPM | DDIM |
|---|---|---|
| 速度 | 慢(需T步) | 快(可用S << T步) |
| 质量 | 高(尤其步数多时) | 好(步数少时常可比,过少则下降) |
| 随机性 | 始终随机 | 由 控制;若 则确定 |
| 步长 | 固定(遵循原始T步) | 灵活(使用时间步子序列) |
| 应用场景 | 最高保真度,多样化生成 | 更快生成,交互式使用,确定性输出 |
DDPM和DDIM的选择:
在实际应用中,DDIM因其显著的速度优势且通常能保持出色的样本质量而应用非常普遍。了解这些权衡有助于您选择最符合特定生成任务要求的采样方法。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造