趋近智
QR分解是一种非常有用的矩阵分解方法,类似于SVD和LU分解。对于一个矩阵(通常且列线性无关),QR分解会找到两个特定的矩阵和,使得:
其中,是一个的正交标准列矩阵,而是一个的上三角矩阵。让我们更仔细地看看这些组成部分。
矩阵具有一个特殊性质:它的列构成一个正交标准集。回顾第四章,这意味着两点:
综合这些,我们可以使用矩阵乘法简洁地陈述正交标准列矩阵的定义性质:
其中是的单位矩阵。
满足此条件的矩阵被称为正交矩阵。(严格来说,如果是方阵,也意味着,使得成为的逆,即)。
正交矩阵的一个重要几何意义是,通过(或)进行乘法运算会保持长度和角度不变。正交矩阵表示的变换是刚性运动,例如旋转或反射。在QR分解中,的列构成了原始矩阵的列空间的规范正交基。这个过程类似于格拉姆-施密特过程,它接受一组线性无关向量(的列)并产生一个跨越相同空间的正交标准集()。
矩阵是一个的上三角矩阵。这意味着主对角线以下的所有元素都为零:
矩阵基本上编码了矩阵的原始列与中的正交标准基向量 (vector)之间的关系。具体而言,的每个列都可以表示为的前个列的线性组合,其系数来自的第列。
的上三角结构在计算上具有优势,尤其是在求解线性方程组时,我们将在后面看到这一点。
QR分解将矩阵A分解为一个正交矩阵Q(其列是正交标准向量)和一个上三角矩阵R。
QR分解最重要的应用之一是求解线性最小二乘问题。回顾一下,这些问题经常出现在机器学习 (machine learning)中拟合模型时,例如线性回归,我们希望找到一个向量 (vector),使与目标向量之间的差异最小化,即最小化。
标准方法涉及求解正规方程组:
然而,计算有时可能导致数值稳定性问题,特别是当的列接近线性相关时。矩阵可能会变成病态(条件数很大),使解对小误差敏感。
QR分解提供了一种数值更稳定的替代方案。如果我们将代入原始的最小二乘目标函数(或者对于存在解的系统,直接代入),我们得到:
现在,两边乘以:
由于,这完美地简化为:
这为我们提供了一个带有上三角矩阵的线性方程组。这样的系统非常容易且数值稳定地使用一个称为回代的过程来求解。我们首先求解的最后一个分量,然后将该值代回倒数第二个方程以求解下一个分量,依此类推,向上回溯。
由于此方法避免形成,它通常比直接使用正规方程组具有更好的数值特性,使其成为许多数值计算库中的首选方法。
尽管QR分解的原理可以通过格拉姆-施密特过程来理解,但实际实现通常使用数值更稳定的算法,如豪斯霍尔德变换或吉文斯旋转。这些方法迭代地构建和。幸运的是,您很少需要自己实现这些算法;像NumPy和SciPy这样的数值计算库提供了高效且可靠的函数来计算QR分解,我们将在实践部分使用它们。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•