在之前的章节中,我们学习了矩阵如何表示线性变换,通过旋转、缩放或剪切来改变向量。现在,我们关注这些变换的一个引人之处:有些向量在特定矩阵变换后,方向不会改变。它们可能会变长、变短,甚至反向,但仍与原来的直线保持对齐。这些特殊向量及其相关的缩放因子是矩阵本身的固有性质。
对于一个给定的大小为 n×n 的方阵 A,我们寻找满足以下方程的非零向量 x 和标量 λ:
Ax=λx
这个方程是事情的核心所在。我们来分解一下它的组成部分:
- A:一个 n×n 的方阵。它表示我们正在分析的线性变换。特征值和特征向量是为方阵定义的,因为变换将 Rn 中的向量映射回 Rn,使得输出 Ax 可能与输入 x 平行。
- x:Rn 中的一个非零向量。这被称为矩阵 A 的特征向量。它是方向在变换 A 下保持不变(可能方向相反)的向量。我们要求 x 非零,因为如果 x 是零向量,则方程 A0=λ0 对任何 λ 值都成立(0=0)。这种平凡的情况不会告诉我们关于矩阵 A 或其固有方向的任何具体信息。
- λ:一个标量(实数或复数)。这被称为与特征向量 x 相关联的特征值。它表示特征向量 x 在经过 A 变换时被缩放的因子。
- 如果 λ>1,特征向量被拉伸。
- 如果 0<λ<1,特征向量被收缩。
- 如果 λ<0,特征向量的方向被反转,其大小按 ∣λ∣ 缩放。
- 如果 λ=1,特征向量在变换后保持不变。
- 如果 λ=0,特征向量被映射到零向量(这意味着它位于 A 的零空间中)。
简单来说,将矩阵 A 作用于其特征向量 x 的效果,与仅将 x 乘以特征值 λ 的效果相同。矩阵乘法 Ax 得到的向量与原始向量 x 平行。
“eigen” 一词源于德语,意为“自己的”或“特有的”。特征值和特征向量确实是矩阵 A 固有的属性,显示了它所表示的变换的本质。
一个特征值 λ 及其对应的特征向量 x 构成一个特征对 (λ,x)。一个矩阵可以有多个不同的特征值,每个特征值可以与一个或多个线性无关的特征向量相关联。但是,一个单独的非零特征向量 x 仅对应一个特征值。
考虑一个简单例子。设 A 是单位矩阵 I=(1001)。将 A 作用于任何向量 x=(x1x2) 得到:
Ax=Ix=(1001)(x1x2)=(x1x2)=1x
在这里,Ax=1x。这符合 Ax=λx 的定义,其中 λ=1。这意味着对于单位矩阵,每个非零向量都是特征值为 1 的特征向量。这在几何上是合理的:单位变换不会改变任何向量。
现在考虑一个缩放矩阵 B=(3003)。将 B 作用于任何向量 x:
Bx=(3003)(x1x2)=(3x13x2)=3(x1x2)=3x
在这种情况下,Bx=3x。同样,每个非零向量都是特征向量,但这次的特征值是 λ=3。该变换将每个向量均匀缩放 3 倍,同时保持所有方向不变。
这些例子都很直接。对于大多数矩阵,只有特定的方向(特征向量)得以保留,找到它们需要更系统的方法。接下来的章节将研究特征向量的几何含义,并介绍计算特征值和特征向量的常用方法,从特征方程开始。