虽然纯态矢量 $|\psi\rangle$ 提供了孤立量子系统的根本描述,但它们代表了一种理想化的情形。在实际操作中,特别是当处理受环境作用影响的量子计算,或者我们只对系统制备有部分信息时,我们需要一个更普适的工具:密度矩阵。掌握密度矩阵对于准确模拟QML算法中的噪声以及解读其在真实硬件上的结果非常重要。量子态的描述:态矢量希尔伯特空间 $\mathcal{H}$ 中的纯量子态 $|\psi\rangle$ 可以用一个密度算符(或密度矩阵)$\rho$ 来描述,其定义为外积:$$ \rho = |\psi\rangle\langle\psi| $$此算符投影到由 $|\psi\rangle$ 张成的子空间。它具有以下一些重要性质:厄米性: $\rho^\dagger = \rho$。迹为1: $\text{Tr}(\rho) = 1$。这反映了态矢量的归一化,即 $\langle\psi|\psi\rangle = 1$。半正定性: 对于任意矢量 $|\phi\rangle$,$\langle\phi|\rho|\phi\rangle \ge 0$。幂等性(对于纯态): $\rho^2 = \rho$。这直接源于归一化:$(|\psi\rangle\langle\psi|)(|\psi\rangle\langle\psi|) = |\psi\rangle(\langle\psi|\psi\rangle)\langle\psi| = |\psi\rangle(1)\langle\psi| = \rho$。密度矩阵形式体系的真正作用在处理混合态时显现出来。混合态代表了纯态的统计系综。设想一个源以概率 $p_i$ 制备量子态 $|\psi_i\rangle$,其中 $\sum_i p_i = 1$。这种系综通常不能用单个态矢量描述。此时,我们使用密度矩阵:$$ \rho = \sum_i p_i |\psi_i\rangle\langle\psi_i| $$这是纯态密度矩阵的凸组合。这种更普适的密度矩阵仍然满足性质1、2和3(厄米性、迹为1、半正定性)。然而,它通常不是幂等的($\rho^2 \neq \rho$)。区分纯态和混合态的一个有用量度是纯度,定义为 $\text{Tr}(\rho^2)$。对于纯态 $\rho = |\psi\rangle\langle\psi|$,$\text{Tr}(\rho^2) = \text{Tr}(|\psi\rangle\langle\psi||\psi\rangle\langle\psi|) = \text{Tr}(|\psi\rangle\langle\psi|) = 1$。对于混合态,可以证明 $\text{Tr}(\rho^2) < 1$。最小值取决于希尔伯特空间的维度。一个最大混合态(例如,处于任意基态的概率相等)具有最低纯度。对于单个量子比特,其状态可以在布洛赫球上进行可视化。纯态位于表面,而混合态占据内部。{"layout": {"title": "布洛赫球:纯态 vs. 混合态", "showlegend": false, "scene": {"xaxis": {"title": "X轴", "range": [-1.1, 1.1]}, "yaxis": {"title": "Y轴", "range": [-1.1, 1.1]}, "zaxis": {"title": "Z轴", "range": [-1.1, 1.1]}, "aspectmode": "cube", "camera": {"eye": {"x": 1.2, "y": 1.2, "z": 0.8}}}}, "data": [{"type": "scatter3d", "x": [0, 0, 1, 0.5, -0.3], "y": [0, 1, 0, 0.2, 0.4], "z": [1, 0, 0, -0.1, 0.1], "mode": "markers", "marker": {"color": ["#1c7ed6", "#1c7ed6", "#1c7ed6", "#fa5252", "#fa5252"], "size": [8, 8, 8, 6, 6], "symbol": ["circle", "circle", "circle", "diamond", "diamond"]}, "name": "态"}, {"type": "surface", "x": [[-1, 1]], "y": [[-1, 1]], "z": [[0, 0]], "opacity": 0.1, "colorscale": [["0", "#adb5bd"], ["1", "#adb5bd"]], "showscale": false}, {"type": "mesh3d", "x": [0], "y": [0], "z": [0], "opacity": 0.1, "color": "#adb5bd", "alphahull": 0, "radius": 1, "hoverinfo": "none"}]}纯态(蓝色圆点)位于布洛赫球表面($\text{Tr}(\rho^2)=1$),而混合态(红色菱形)位于球体内部($\text{Tr}(\rho^2)<1$)。期望值与动力学计算由 $\rho$ 描述的系统可观测量 $M$(由厄米算符表示)的期望值很简单:$$ \langle M \rangle = \text{Tr}(\rho M) $$你可以验证,如果 $\rho = |\psi\rangle\langle\psi|$,这会简化为我们熟悉的 $\text{Tr}(|\psi\rangle\langle\psi| M) = \langle\psi| M |\psi\rangle$。对于混合态 $\rho = \sum_i p_i |\psi_i\rangle\langle\psi_i|$,期望值为 $\text{Tr}(\sum_i p_i |\psi_i\rangle\langle\psi_i| M) = \sum_i p_i \text{Tr}(|\psi_i\rangle\langle\psi_i| M) = \sum_i p_i \langle\psi_i| M |\psi_i\rangle$,这正是系综中每个纯态期望值的加权平均值,如预期。由哈密顿量 $H$ 支配的封闭系统,其密度矩阵的时间演化由刘维尔-冯诺依曼方程给出:$$ i\hbar \frac{d\rho}{dt} = [H, \rho] = H\rho - \rho H $$这是密度矩阵对应的薛定谔方程。对于与环境产生作用的开放量子系统(会引入噪声和退相干),需要更复杂的主方程,如林德布拉德方程,来描述 $\rho$ 的演化。在讨论第7章的硬件噪声和错误缓解时,我们将遇到这些内容。子系统与部分迹在量子计算和QML中,我们经常处理复合系统(多个量子比特),但只对系统的一部分感兴趣。考虑一个由作用于希尔伯特空间 $\mathcal{H}_A \otimes \mathcal{H}B$ 的联合密度矩阵 $\rho{AB}$ 描述的双体系统AB。如果只描述子系统A的状态,忽略子系统B,我们使用对B的部分迹运算,记作 $\text{Tr}_B$:$$ \rho_A = \text{Tr}B(\rho{AB}) $$如果 ${|b_j\rangle_B}$ 是 $\mathcal{H}_B$ 的正交归一基,则部分迹计算如下:$$ \rho_A = \sum_j ({B\langle b_j|}) \rho{AB} (|b_j\rangle_B) $$所得的 $\rho_A$ 是子系统A的约化密度矩阵。重要的是,即使复合系统AB处于纯纠缠态,约化密度矩阵 $\rho_A$ 和 $\rho_B$ 通常也会表示混合态。这表明纠缠如何导致关联,使得子系统的状态无法独立地以纯态描述。部分迹对描述量子比特子集上的测量结果或量子比特丢失到环境中的影响非常重要。在量子机器学习中的相关性密度矩阵在QML中必不可少,原因有以下几点:噪声建模: 近期量子计算机存在噪声。退相干、门操作不完美和测量误差导致纯态演化为混合态。密度矩阵模拟常用于实际预测QML算法在真实硬件上的表现。去极化噪声或振幅阻尼等特性,很自然地可以通过对密度矩阵的操作来表达。算法规范: 有些QML算法本身就可能包含混合态。例如,量子生成模型的输出可能是一个表示不确定性的混合态,或者源自有噪声物理过程的输入数据最好由密度矩阵表示。理论分析: 分析QML模型的性质,如它们的表达能力或可训练性,通常需要完整的密度矩阵形式体系,尤其是在考虑噪声或量子电路不同部分之间的纠缠时。信息几何: 给定系统所有有效密度矩阵的集合形成一个几何空间。信息几何的工具,如量子费希尔信息度量,作用于密度矩阵并为变分量子算法(VQA)的参数空间提供理解,帮助我们理解优化难题,例如贫瘠高原(第4章涵盖)。总而言之,虽然态矢量提供了最初的直觉,但掌握密度矩阵形式体系对推进量子机器学习的实际运用和理论深度是必需的。它提供了处理统计不确定性、环境噪声和子系统的语言,所有这些都是设计、实施和分析QML算法时常见考量。