在利用参数化量子电路 (PQC) 作为可训练组件的思路上,我们现在关注一种专为生成建模设计的特定类型量子神经网络:量子电路波恩机 (QCBM)。与学习决策边界的判别模型(如之前讨论的变分量子分类器)不同,QCBMs 旨在学习给定数据集背后隐藏的未知概率分布,并生成与数据相似的新样本。“波恩机”这个名称源于其依赖波恩法则来将量子态的测量结果解释为概率。
核心思想:从量子态采样
QCBM 的核心是一种隐式生成模型。它不明确计算概率密度函数,而是提供一种机制,根据量子电路学到的概率分布来抽取样本。这个过程包含以下主要步骤:
- 态制备: 将一个 PQC,表示为 U(θ),作用于标准初始态,通常是 n 量子比特系统的全零态 ∣0⟩⊗n。这会制备一个参数化量子态 ∣ψ(θ)⟩=U(θ)∣0⟩⊗n。参数 θ 是我们量子“网络”的可调权重。
- 测量: 得到的量子态 ∣ψ(θ)⟩ 在计算基 {∣x⟩} 下测量,其中 x 代表一个长度为 n 的比特串(例如,x=0110...1)。
- 概率解释(波恩法则): 根据波恩法则,得到测量结果 x 的概率由下式给出:
pθ(x)=∣⟨x∣ψ(θ)⟩∣2
- 采样: 通过重复制备量子态 ∣ψ(θ)⟩ 并测量它,我们得到一组样本 {x1,x2,...,xM},这些样本根据 pθ(x) 分布。
训练 QCBM 的目标是调整参数 θ,使电路定义的概率分布 pθ(x) 很好地近似目标概率分布 ptarget(x),目标概率分布通常由一组训练数据样本 S={s1,s2,...,sN} 隐式表示。
训练量子电路波恩机的基本流程。PQC 生成样本,这些样本通过损失函数与目标数据进行比较。经典优化器更新 PQC 参数 θ。
训练 QCBMs:匹配分布
由于我们通常只拥有来自目标分布 ptarget(x) 的样本 S,我们无法直接最小化散度(如库尔巴克-莱布勒 (KL) 散度),因为这需要明确知道 ptarget(x)。相反,常用方法依赖于比较 QCBM 生成的样本 {xi} 与训练数据样本 {sj}。
为此目的,一种广泛使用的损失函数是最大均值差异 (MMD)。MMD 是一种概率分布之间的距离度量,其思想是:当且仅当两个分布在再生核希尔伯特空间 (RKHS) 中的均值嵌入相同,这两个分布才是相同的。为了训练 QCBMs,我们通常计算 MMD 的基于样本的估计值:
LMMD(θ)=N1j=1∑Nϕ(sj)−M1i=1∑Mϕ(xi(θ))H2
在此,ϕ 是与经典核 k(x,x′)=⟨ϕ(x),ϕ(x′)⟩H(例如高斯核)相关的特征映射,{sj} 是来自目标数据的样本,而 {xi(θ)} 是由参数为 θ 的 QCBM 生成的样本。目标是关于 θ 最小化 LMMD(θ)。
训练涉及一个迭代优化循环:
- 通过制备和测量 U(θ)∣0⟩⊗n,从 QCBM 生成一批 M 个样本 {xi(θ)}。
- 从训练数据集中取一批 N 个样本 {sj}。
- 使用这些批次计算 MMD 损失 LMMD(θ)(或另一个合适的损失)。
- 估计损失的梯度 ∇θLMMD(θ)。这通常需要诸如参数位移规则等技术,如对通用变分量子算法 (VQA) 所讨论的,并谨慎地应用于 MMD 目标函数。
- 使用经典优化器(例如 Adam、SGD、SPSA)更新参数 θ。
- 重复直到收敛。
挑战与注意事项
尽管其方法优雅,训练 QCBMs 面临显著的实际挑战,其中许多与其他 VQA 和 QNN 共有:
- Ansatz 的选择: QCBM 的表达能力和可训练性高度依赖于 PQC U(θ) 的结构。选择不当的 Ansatz 可能无法表示目标分布,或者可能严重受到如贫瘠高原等问题的影响。
- 优化: 由于非凸损失景观、贫瘠高原的可能性(特别是对于深度电路或全局损失函数),以及基于有限样本的梯度估计的随机性,寻找最佳参数 θ 可能很困难。
- 梯度估计: 计算梯度(通常通过参数位移规则)需要执行额外的电路,从而增加了每步优化的计算成本。由于有限的测量次数,梯度估计中的方差也会减缓收敛速度。
- 损失函数估计: 估计如 MMD 等损失函数,每一步都需要从 QCBM 和目标数据中获取足够数量的样本(M 和 N),以获得可靠的估计值,这增加了总测量预算。
- 评估: 量化训练后的 QCBM pθ(x) 如何良好地近似 ptarget(x) 并非易事,尤其是在高维情况下。评估指标常依赖于比较矩、评估在下游任务上的表现,或对生成样本使用其他统计检验。
尽管存在这些挑战,QCBMs 代表了一类专注于生成任务的重要 QNN。它们提供了一个框架,用于运用量子电路学习和采样复杂概率分布,这些分布可能对经典方法来说难以处理。对其的研究阐明了使用量子计算解决无监督学习问题的可能性和困难。我们将在下一章讨论量子生成对抗网络 (QGAN) 时遇到相关内容。