趋近智
训练量子生成对抗网络(QGAN)面临一系列独特的难题,它结合了传统 GAN 训练中众所周知的困难与量子计算的特有约束。成功实施 QGAN 需要仔细考量其基础量子力学原理以及优化中的实际问题。
其核心是,GAN 训练是一个生成器 (G) 与判别器 (D) 之间的最小最大博弈。生成器试图产生能欺骗判别器的样本,而判别器则努力正确识别真实样本与虚假(生成)样本。
GminDmaxV(D,G)=Ex∼pdata[logD(x)]+Ez∼pz[log(1−D(G(z)))]GAN 的标准最小最大目标函数。pdata 是真实数据分布,pz 是输入噪声分布(通常为均匀分布或高斯分布),G(z) 是生成器的输出,D(x) 是判别器对 x 为真实样本的概率估计。
这种对抗过程本质上不稳定。常见的失效模式有:
在 QGAN 中,这些问题持续存在并可能加剧。生成器 G(θ) 是一个参数化量子电路(PQC),其训练涉及估计其参数 θ 的梯度。来自量子硬件或模拟器的噪声会增加这些梯度估计的方差,可能破坏对抗训练所需的精密平衡。
如在变分量子算法(VQA)背景下所讨论的,计算 PQC 的梯度通常涉及参数移位法则等方法。对于 QGAN 生成器 G(θ),梯度计算需要考虑下游判别器 D。如果 D 是经典判别器,我们需要像 ∇θD(G(θ)) 这样的梯度。如果 D 也是一个量子电路 D(ϕ),那么 ∇θV(D(ϕ),G(θ)) 和 ∇ϕV(D(ϕ),G(θ)) 的梯度计算会变得更加复杂。
每个梯度分量估计都需要多次电路执行,这使得 QGAN 训练成为计算密集型任务,特别是与反向传播通常更直接的传统 GAN 相比。此外,从量子测量中估计期望值固有的统计噪声直接影响梯度精度,可能阻碍收敛或需要更小的学习率和更多的测量次数。
量子生成器,特别是那些使用深度或全局相互作用的 PQC 实现的,容易受到梯度消失平原现象的影响。正如第 4 章所述,梯度消失平原导致梯度随量子比特数呈指数级消失,从而有效阻碍优化过程。如果生成器的量子线路结构容易出现梯度消失平原,它可能无法学习复杂分布,无论判别器有多强大。如果使用量子判别器,且其 PQC 也呈现梯度消失平原,则可能出现类似问题。仔细的量子线路结构设计、参数初始化策略以及可能的局部成本函数成为重要的考量因素。
生成器和判别器的具体设计会显著影响训练动态和性能。
生成器 G(θ) 通常是一个 PQC,它接收一个标准初始态(例如 ∣0⟩⊗n),或者一个编码某些潜在变量 z 的简单输入态,并根据参数 θ 进行演化。最终状态被测量以产生一个样本。
一个主要的架构决策是判别器的性质:
经典判别器: 使用经典神经网络(例如多层感知机 MLP、卷积神经网络 CNN)来区分真实数据和通过测量量子生成器输出状态生成的样本。这通常更易于实现和训练,可以借助于成熟的经典机器学习工具。然而,经典判别器只看到测量结果,可能丢失测量前生成器输出状态中存在的量子信息或关联。
量子判别器: 使用另一个 PQC,D(ϕ),来执行判别任务。这通常涉及比较 G(θ) 产生的量子态与代表真实数据的量子态(这需要将经典数据编码为量子态,参见第 2 章)。
常见 QGAN 架构。左图:量子生成器与对测量结果进行操作的经典判别器配对。右图:生成器和判别器都是量子电路,需要量子态比较机制。
特定训练技术有助于应对难题:
训练 QGAN 仍然是一个活跃的研究领域。量子电路属性(表达能力、可训练性)、梯度估计噪声、对抗动态以及架构选择之间的相互作用,形成了一个复杂的优化问题。成功解决这些难题对构建有效的量子生成模型非常重要。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造