已经明确了量子核 k ( x , x ′ ) k(x, x') k ( x , x ′ ) 是如何在量子特征空间中由内积产生的,我们来审视它们的基本数学属性。正如它们的经典对应物一样,理解这些特性对于在支持向量机(SVM)等机器学习算法中有效应用量子核非常重要。这些性质决定了核函数的行为,并影响了所生成的特征空间的几何结构,进而影响模型性能和可训练性。
经典数据、量子特征态、它们的内积以及最终核值之间的关系。
正半定性 (PSD)
任何函数要在支持向量机(SVM)及其他核方法中成为有效核的一个核心要求是它必须是正半定(PSD)的。此性质确保了由在任意数据集上评估核函数所形成的矩阵,即格拉姆矩阵 K K K ,具有非负特征值。形式上,对于任意数据集 { x 1 , . . . , x N } \{x_1, ..., x_N\} { x 1 , ... , x N } 和任意复数系数 { c 1 , . . . , c N } \{c_1, ..., c_N\} { c 1 , ... , c N } ,以下条件必须成立:
∑ i = 1 N ∑ j = 1 N c ˉ i K i j c j ≥ 0 \sum_{i=1}^{N} \sum_{j=1}^{N} \bar{c}_i K_{ij} c_j \ge 0 i = 1 ∑ N j = 1 ∑ N c ˉ i K ij c j ≥ 0
其中 K i j = k ( x i , x j ) K_{ij} = k(x_i, x_j) K ij = k ( x i , x j ) 。此条件与存在一个潜在的特征映射 ϕ \phi ϕ 使得 k ( x , x ′ ) = ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ k(x, x') = \langle \phi(x) | \phi(x') \rangle k ( x , x ′ ) = ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ 密切相关。
我们来验证一下量子核的此点。如果我们将核直接定义为内积:
k ( x , x ′ ) = ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ k(x, x') = \langle \phi(x) | \phi(x') \rangle k ( x , x ′ ) = ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩
其中 ∣ ϕ ( x ) ⟩ |\phi(x)\rangle ∣ ϕ ( x )⟩ 是与数据点 x x x 对应的量子态。那么,此和变为:
∑ i , j c ˉ i ⟨ ϕ ( x i ) ∣ ϕ ( x j ) ⟩ c j = ⟨ ∑ i c i ϕ ( x i ) | ∑ j c j ϕ ( x j ) ⟩ = ∥ ∑ i c i ∣ ϕ ( x i ) ⟩ ∥ 2 \sum_{i,j} \bar{c}_i \langle \phi(x_i) | \phi(x_j) \rangle c_j = \left\langle \sum_i c_i \phi(x_i) \;\middle|\; \sum_j c_j \phi(x_j) \right\rangle = \left\| \sum_i c_i |\phi(x_i)\rangle \right\|^2 i , j ∑ c ˉ i ⟨ ϕ ( x i ) ∣ ϕ ( x j )⟩ c j = ⟨ i ∑ c i ϕ ( x i ) j ∑ c j ϕ ( x j ) ⟩ = i ∑ c i ∣ ϕ ( x i )⟩ 2
由于希尔伯特空间中任何向量的范数平方都是非负的,因此该条件得到满足。所以,直接定义为希尔伯特空间中内积的核总是正半定的。
在量子机器学习中,核通常根据特征态之间的测量概率 或保真度 来定义,其常见形式为:
k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ ∣ 2 k(x, x') = |\langle \phi(x) | \phi(x') \rangle|^2 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ ∣ 2
这个函数仍然是正半定(PSD)的吗?是的。考虑格拉姆矩阵 G G G ,其中 G i j = ⟨ ϕ ( x i ) ∣ ϕ ( x j ) ⟩ G_{ij} = \langle \phi(x_i) | \phi(x_j) \rangle G ij = ⟨ ϕ ( x i ) ∣ ϕ ( x j )⟩ 。我们知道 G G G 是正半定的。我们感兴趣的核矩阵 K K K 的元素是 K i j = ∣ ⟨ ϕ ( x i ) ∣ ϕ ( x j ) ⟩ ∣ 2 = G i j G i j ‾ K_{ij} = |\langle \phi(x_i) | \phi(x_j) \rangle|^2 = G_{ij} \overline{G_{ij}} K ij = ∣ ⟨ ϕ ( x i ) ∣ ϕ ( x j )⟩ ∣ 2 = G ij G ij 。这可以看作是 G G G 及其复共轭 G ˉ \bar{G} G ˉ 的元素乘积(阿达玛积)。由于 G G G 是正半定的,G ˉ \bar{G} G ˉ 也是正半定的。舒尔乘积定理指出,两个正半定矩阵的阿达玛积也是正半定的。因此,定义为 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ ∣ 2 k(x, x') = |\langle \phi(x) | \phi(x') \rangle|^2 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ ∣ 2 的量子核保证是有效且正半定的核。
这种正半定(PSD)性质很重要,因为它保证了支持向量机(SVM)底层的优化问题保持凸性,从而确保我们能够找到唯一的全局最小值。
归一化与有界性
量子核,特别是那些定义为 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ ∣ 2 k(x, x') = |\langle \phi(x) | \phi(x') \rangle|^2 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ ∣ 2 的核,通常表现出源于量子态性质的自然归一化特性。
假设量子特征态 ∣ ϕ ( x ) ⟩ |\phi(x)\rangle ∣ ϕ ( x )⟩ 是归一化态(即 ⟨ ϕ ( x ) ∣ ϕ ( x ) ⟩ = 1 \langle \phi(x) | \phi(x) \rangle = 1 ⟨ ϕ ( x ) ∣ ϕ ( x )⟩ = 1 ),我们有:
对角元素: k ( x , x ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ) ⟩ ∣ 2 = 1 2 = 1 k(x, x) = |\langle \phi(x) | \phi(x) \rangle|^2 = 1^2 = 1 k ( x , x ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x )⟩ ∣ 2 = 1 2 = 1 。一个数据点与自身的核值总是 1。
非对角元素: 根据柯西-施瓦茨不等式, ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ ∣ ≤ ⟨ ϕ ( x ) ∣ ϕ ( x ) ⟩ ⟨ ϕ ( x ′ ) ∣ ϕ ( x ′ ) ⟩ = 1 |\langle \phi(x) | \phi(x') \rangle| \le \sqrt{\langle \phi(x) | \phi(x) \rangle} \sqrt{\langle \phi(x') | \phi(x') \rangle} = 1 ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ ∣ ≤ ⟨ ϕ ( x ) ∣ ϕ ( x )⟩ ⟨ ϕ ( x ′ ) ∣ ϕ ( x ′ )⟩ = 1 。因此, 0 ≤ ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ ∣ 2 ≤ 1 0 \le |\langle \phi(x) | \phi(x') \rangle|^2 \le 1 0 ≤ ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ ∣ 2 ≤ 1 。
因此,这种常见的量子核形式自然会产生介于 0 和 1 之间的值,其中 1 表示相同的特征态(除了一个全局相位),而值越接近 0 表示特征态越不相似(正交)。这种有界性在实际应用中很有帮助,可以避免数值问题,并为相似性提供一个直观的衡量尺度。然而,输入态 ∣ ϕ ( x ) ⟩ |\phi(x)\rangle ∣ ϕ ( x )⟩ 的归一化是先决条件,这在量子计算中是标准做法。
普适性
在经典机器学习中,如果相应的再生核希尔伯特空间(RKHS)在输入域的连续函数空间中是稠密的,则称该核为普适 核。实际中,这意味着具有普适核的支持向量机在数据充足的情况下可以近似任何任意决策边界。高斯(RBF)核是普适经典核的一个著名例子。
量子核可以是普适的吗?答案完全取决于量子特征映射 ϕ \phi ϕ 的表现力。
如果特征映射 ϕ \phi ϕ 受限,并且只能在希尔伯特空间中生成有限的子集态,则生成的核可能不具有普适性。
如果特征映射 ϕ \phi ϕ 足够强大或富有表现力 ,即它能近似任何幺正变换或生成密集覆盖希尔伯特空间的态,那么生成的核就有可能具有普适性。
研究表明,某些量子特征映射,特别是那些涉及充分纠缠和数据重上传结构(如第2章所述)的映射,确实可以产生普适核。证明普适性通常涉及分析函数 x ↦ ∣ ϕ ( x ) ⟩ x \mapsto |\phi(x)\rangle x ↦ ∣ ϕ ( x )⟩ 的丰富性,并将其与傅里叶分析或函数近似理论关联起来。在核函数中生成高频分量的能力通常与普适性相关。实现普适性可能需要特征映射的参数数量随着数据集的大小或目标函数的复杂性而增长。
对特征映射选择的依赖性
需要反复强调的是:量子核的性质和性能完全由量子特征映射 ϕ \phi ϕ 的选择决定。 用于将 x x x 编码为 ∣ ϕ ( x ) ⟩ |\phi(x)\rangle ∣ ϕ ( x )⟩ 的不同电路将导致不同的核。
考虑受特征映射设计影响的这些因素:
维度: 所用量子比特的数量决定了希尔伯特空间的标称维度。
纠缠: 电路生成的纠缠量和结构显著影响内积捕获的相关性。
非线性: 从 x x x 导出的参数如何加载到电路门中引入了非线性依赖,从而塑造了特征空间的几何结构。使用数据重上传的电路可以创建高度复杂的非线性特征映射。
因此,设计或选择合适的特征映射是量子核方法中的一项核心任务。一个在某个数据集上表现良好的特征映射可能在另一个数据集上表现不佳。这与第2章中关于编码策略及其表现力的主题密切相关。
计算考量与噪声
尽管在数学上很优美,但在量子硬件上实际估算量子核 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ ) ⟩ ∣ 2 k(x, x') = |\langle \phi(x) | \phi(x') \rangle|^2 k ( x , x ′ ) = ∣ ⟨ ϕ ( x ) ∣ ϕ ( x ′ )⟩ ∣ 2 会带来一些复杂性:
估算: 我们无法获得精确值,而是通过重复测量(例如,使用SWAP测试或反演测试电路)得到的估算值。这需要多次电路执行和测量,从而引入统计不确定性。
噪声: 当前量子处理器上的退相干、门误差和读出误差会损坏计算,导致核矩阵元素的估算值存在偏差或噪声。
对性质的影响: 噪声和统计误差意味着经验估算的核矩阵可能与理想的正半定性略有偏差。这可能需要缓解技术或在算法的经典优化部分进行仔细处理(例如,通过在估算的核矩阵的对角线上添加一个小的数值)。
这些与硬件噪声和估算相关的实际方面将在第7章中进行更详细的讨论。
总而言之,量子核通过希尔伯特空间中的内积定义,因此继承了基本的正半定(PSD)性质。它们的归一化取决于特征态的归一化,而其潜在的普适性则取决于所选量子特征映射的表现力。特征映射设计与核性质之间的紧密关联使得特征映射工程成为成功应用这些方法的一个重要方面。