量子纠缠是量子力学的一个标志性特征,它表示量子系统间的关联,这种关联远超经典范围内的任何可能。本节将分析纠缠和相关非局域现象对量子机器学习的具体影响,并将这些思想与多量子比特系统的数学描述(例如使用张量积和密度矩阵)联系起来。弄清这些思想对领会量子机器学习算法可运用的能力具有积极作用。纠缠:经典关联回顾一下,如果一个多量子比特态不能写成单个量子比特态的简单张量积形式,那么它就是纠缠态。例如,贝尔态 $|\Phi^+\rangle = \frac{1}{\sqrt{2}}(|00\rangle + |11\rangle)$ 就是纠缠态,因为第一个量子比特的测量结果会立即决定第二个量子比特的结果,不论它们相隔多远——如果量子比特态仅仅是经典关联(例如,独立制备但依据某个共同概率分布),这种关联模式是无法实现的。形式上,对于双分希尔伯特空间 $\mathcal{H}_A \otimes \mathcal{H}_B$ 中的纯态 $|\psi\rangle$,若存在 $|\phi_A\rangle \in \mathcal{H}_A$ 且 $|\phi_B\rangle \in \mathcal{H}_B$ 使其可写成 $|\psi\rangle = |\phi_A\rangle \otimes |\phi_B\rangle$ 的形式,则该状态是可分离的。否则,它是纠缠的。对于由密度矩阵 $\rho$ 描述的混合态,可分离性表示该状态可以写成乘积态的凸组合: $$ \rho = \sum_i p_i \rho_A^{(i)} \otimes \rho_B^{(i)} $$ 其中 $p_i \ge 0$,$\sum_i p_i = 1$,且 $\rho_A^{(i)}$ 和 $\rho_B^{(i)}$ 分别是子系统 A 和 B 的密度矩阵。如果一个混合态不能以这种方式表示,那么它就是纠缠的。在计算和机器学习的背景下,纠缠常被视作一种资源,原因如下:产生复杂关联: 纠缠态包含的关联通常需要指数级的经典资源才能描述或模拟。这种形成复杂关联的特性,被认为有助于对复杂数据模式进行建模。访问更广的态空间: 纠缠操作使量子电路能够比仅由单量子比特门构成的电路更有效地运用 $N$ 个量子比特的完整 $2^N$ 维希尔伯特空间。支持某些量子算法: 纠缠是许多量子算法的必要组成部分,这些算法在速度上超越了经典方法,尽管其在量子机器学习中取得量子优势的具体作用仍在研究中。量子机器学习电路中的纠缠量子机器学习模型,特别是那些基于变分量子算法(第四章)和量子神经网络(第五章)中使用的参数化量子电路(PQCs)的模型,明确地运用能产生纠缠的门。常见例子包括应用于叠加态量子比特的受控非(CNOT)门或受控Z(CZ)门。考虑一个简单的参数化量子电路片段:# 使用 Qiskit 的示例 from qiskit import QuantumCircuit qc = QuantumCircuit(2) qc.h(0) # 将量子比特0置于叠加态 |+> qc.h(1) # 将量子比特1置于叠加态 |+> # 此时,状态为 |+>|+> = 1/2 (|00> + |01> + |10> + |11>),是可分离的。 qc.cx(0, 1) # 应用 CNOT 门:产生纠缠 # 最终状态是 1/sqrt(2) (|00> + |11>),即贝尔态 |Phi+> (不计全局相位)多层单量子比特旋转(参数化)和固定双量子比特纠缠门是参数化量子电路试探函数中的典型构成单元。纠缠门将一个量子比特中编码的信息分布到其他量子比特上,形成关联,模型参数可以在训练期间调整这些关联,以适应目标函数或分布。这些纠缠器的结构和放置方式极大地影响了电路表示复杂函数的能力,这一特性常被称为表达能力,我们将在特征映射(第二章)和变分量子算法(第四章)的背景下对此进行进一步审视。对量子机器学习模型的潜在影响量子电路高效产生和操控纠缠的能力,为机器学习带来多项潜在影响:模型能力/表达能力提升: 通过运用纠缠,量子机器学习模型或许可以表示那些对于同等规模(例如,参数数量)的经典模型而言难以处理的函数或概率分布。通过纠缠所达到的希尔伯特空间的高维性和关联能力,可以使量子模型捕获经典技术遗漏的细致模式。这对于设计强大的量子特征映射(第二章)和高表达能力的量子神经网络架构(第五章)特别适用。量子数据建模: 对于涉及从量子系统产生的数据的机器学习任务(例如,物质相分类、分子性质预测),纠缠通常是数据本身的固有特性。量子机器学习模型天生适合直接处理此类信息。捕获经典数据中的非经典关联: 一个待解答的研究问题是,纠缠是否为学习纯粹经典数据集中的模式提供优势。假定是,纠缠所实现的独特关联结构可能提供一种更省资源的方式来建模某些经典数据中存在的复杂依赖关系,与经典机器学习模型相比,这可能带来更好的泛化能力或更快的训练速度。非局域性与贝尔不等式非局域性指的是量子力学预测的(并经实验验证的)违反贝尔不等式的关联。这些不等式界定了在局域实在论假定下(即物理属性独立于测量而存在,且影响不能比光速快)可能达到的关联强度上限。纠缠是展示非局域性的一个先决条件。尽管非局域性是量子理论的一个深刻方面,但其在典型量子机器学习算法中的直接应用不如纠缠本身的运用普遍。量子机器学习模型通常通过在量子计算机内制备纠缠态,然后测量局域可观测值来运行。计算过程中,重点常在于纠缠态空间所提供的表示能力,而非明确测试贝尔不等式。然而,认识非局域性使得纠缠所实现的关联的根本非经典性质更为明确。实际障碍与考量尽管存在理论潜力,在量子机器学习中有效运用纠缠仍面临不少实际障碍:对噪声的脆弱性: 纠缠态极易受到环境退相干和不完美门操作产生的噪声影响。在当前的噪声中等规模量子(NISQ)硬件上,维持足以提供计算优势的纠缠是一个重要的挑战(第七章将进一步讨论)。量化有用纠缠: 对于特定的机器学习任务,并非总是清楚何种程度或何种类型的纠缠会有益。在计算上测量纠缠通常很困难,而将纠缠度量与模型性能联系起来是一个活跃的研究方向。纠缠并非万能药: 纠缠的存在并不能自动保证卓越性能。数据编码方案的选择(第二章)、参数化量子电路试探函数结构(第四章)、经典优化例程(第四章)以及学习任务本身的性质,都是非常重要的因素。纠缠与这些其他组成部分之间的关系决定了量子机器学习模型的整体效用。总之,纠缠为量子机器学习模型提供了访问复杂关联结构和经典物理无法触及的计算空间的途径。虽然其作为一种能力提供了增强机器学习能力的可能性,但在有噪声的情况下有效创建、控制和运用纠缠,仍然是该领域的核心难题和持续活跃的研究方向。后续章节将以这些思想为基础,说明纠缠如何在量子核方法、变分量子算法和量子神经网络等特定量子机器学习算法中被运用。