基础量子特征映射,例如将数据特征编码为单比特旋转的那些,提供了一个起点,但它们通常对应于量子特征空间中的线性结构。经典机器学习常得益于输入数据的非线性变换,使模型能够捕捉复杂关系和决策边界。例如,多项式核是支持向量机 (SVM) 等算法实现此目的的标准技术。它们隐式地将数据映射到更高维空间,其中特征对应于原始输入的各种多项式组合,而无需显式计算这些高维向量。
量子计算提供了一种构建特征映射的方式,可以自然地生成等效的或可能更强大的非线性关系,包括输入特征之间的高阶多项式关联。核心思想是设计量子电路 U(x),将初始态 ∣0⟩⊗n 转换为特征态 ∣ϕ(x)⟩=U(x)∣0⟩⊗n,使得量子比特之间的关联(受输入数据 x 调制)创建缠结模式,以表示这些多项式项。
构建多项式特征映射
考虑一个经典数据点 x=(x1,x2,...,xd)。一个简单的特征映射可能将每个 xi 编码为单个量子比特的旋转角度。为引入多项式项,我们需要关联。这通常通过纠缠门实现,其旋转角度取决于输入特征的组合。
一种常见结构包含单比特旋转层和多比特纠缠门层。例如,一个二阶多项式特征映射可能使用如下电路结构:
- 初始层: 对所有量子比特应用哈达玛门 H 以产生叠加态:H⊗n∣0⟩⊗n。
- 数据编码 (线性项): 应用依赖于单个特征的单比特旋转,例如,在量子比特 i 上应用 RZ(f1(xi))。这里,f1 可以是一个简单的缩放函数,如 f1(xi)=2xi。
- 纠缠层 (多项式项): 在量子比特对 (i,j) 之间应用双比特纠缠门,例如受控相位门或 ZZ 关联门。重要的是,这些纠缠器的旋转角度取决于相应输入特征的一个函数,例如,作用于量子比特 i 和 j 的 RZZ(f2(xi,xj))。一种为 f2 引入二阶关联的常见选择是 f2(xi,xj)=(π−xi)(π−xj)。这种特定形式出现在一些标准库实现中。
- 重复: 步骤2和3可以重复多次(常被称为“层”或“重复”)以可能增加特征映射的复杂度和表达能力。
生成的量子态 ∣ϕ(x)⟩ 存在于 2n 维希尔伯特空间中。两个此类状态之间的内积 ⟨ϕ(x′)∣ϕ(x)⟩ 定义了量子核 k(x,x′)。因为电路 U(x) 包含由特征乘积(如嵌入在 f2(xi,xj) 中的 xixj)控制的纠缠操作,所以生成的核 k(x,x′) 将包含输入特征 x 和 x′ 的多项式项。
例如,在 ZZ 旋转中使用 f2(xi,xj)=(π−xi)(π−xj) 关联,可有效实现与 (π−xi)(π−xj)ZiZj 成比例的算子下的演化。在计算核 ⟨ϕ(x′)∣ϕ(x)⟩ 时,涉及 xixjxi′xj′ 等乘积的项可能会产生,这是多项式核的特点。
数学结构与核
让我们考虑一个简单的双比特例子 (n=2),数据为 x=(x1,x2)。包含 H⊗2,然后在量子比特1上应用 RZ(2x1),在量子比特2上应用 RZ(2x2),接着是一个纠缠门,例如 e−iθZ1Z2 (其中 θ=(π−x1)(π−x2))的电路结构,将生成一个态 ∣ϕ(x)⟩。
x 和 x′ 之间的核元素是 k(x,x′)=∣⟨ϕ(x′)∣ϕ(x)⟩∣2。展开电路操作 U(x)=e−iθZ1Z2RZ(2x2)RZ(2x1)H⊗2 和 U(x′)=e−iθ′Z1Z2RZ(2x2′)RZ(2x1′)H⊗2,其中 θ′=(π−x1′)(π−x2′),计算 ⟨00∣U†(x′)U(x)∣00⟩ 将包含依赖于诸如 (2x1−2x1′) 这样的差值以及关联项 θ,θ′ 的和/差的项。这自然会使得核函数 k(x,x′) 在 x1,x2,x1′,x2′ 上呈多项式形式。
具体来说,涉及 k 局部关联(作用于 k 个量子比特的门)且其参数取决于至多 k 个特征乘积的特征映射可以生成与 k 阶多项式相关的核。
优势与考量
- 捕捉非线性: 主要优势在于能够通过量子特征空间几何直接建模数据中的非线性关系,与线性特征映射相比,这可能在复杂分类或回归任务上带来更好的表现。
- 希尔伯特空间的丰富性: 高阶关联可以在高维希尔伯特空间中表现更复杂的纠缠结构,可能提供比同阶经典多项式核更丰富的特征表示,尽管这仍是一个活跃的研究方向。
然而,有一些重要考量:
- 电路深度与量子比特: 实现高阶关联通常需要更深的电路或更多的量子比特(如果使用辅助量子比特),这会增加近期设备对噪声和退相干的敏感性。
- 核集中: 随着量子比特数量或电路深度的增加,生成的核矩阵可能会出现集中效应(核值呈指数级相互靠近),这可能会阻碍QSVM等基于核的方法的训练。我们将在第3章中详细考察这一现象。
- 关联选择: 纠缠关联的具体选择(例如 ZZ, XX, 受控门)以及对数据特征的功能依赖性(例如 (π−xi)(π−xj), xixj)对生成的核及其属性有重大影响。常需要仔细设计和实验。
电路示例可视化
以下图示说明了针对 n 量子比特和特征向量 x 的两层 (d=2) 二阶多项式特征映射的结构。
一个多层量子特征映射的图示,旨在引入多项式关联。每层应用数据相关的单比特旋转 (RZ) 和多比特纠缠关联 (RZ...Z),其参数 f1,f2 是输入特征 x 的函数。
总而言之,高阶多项式量子特征映射通过纠缠门结合多特征关联,扩展了基本编码策略。这使得量子态 ∣ϕ(x)⟩ 能够编码经典数据 x 中存在的非线性关系,可能带来更具表现力的特征空间,并改进为使用量子核而设计的QML算法的性能。这些映射的设计涉及表达能力、电路复杂度和资源需求之间的权衡,这些都是实际实现中需着重考量的方面。