当一个矩阵作用于一个向量时,它通常会改变向量的方向。但对于大多数方阵,某些非零向量是特别的。这种变换只会拉伸或收缩它们,保持它们原来的方向不变。这些特殊向量被称为特征向量,而它们被缩放的因子则是它们对应的特征值。
这种独特的关系用一个简单而有力的方程表示:
Av=λv
这个方程说明,当矩阵 A 作用于其特征向量 v 时,结果等同于将 v 乘以一个标量,即特征值 λ。
让我们分解每个组成部分:
- A 是表示线性变换的方阵。
- v 是特征向量,一个非零向量,其方向在变换中保持不变。
- λ (希腊字母 lambda) 是特征值,一个标量,它表示特征向量 v 被拉伸、收缩或翻转的倍数。
本质上,特征向量定义了变换的“轴”。其他向量以复杂的方式旋转和缩放,而特征向量指向变换仅作为缩放操作的那些方向。
对于一般向量,矩阵变换会改变其方向。对于特征向量,变换只会沿着同一条线(其“特征空间”)对其进行缩放。
一个具体示例
让我们用数字来具体说明。考虑以下矩阵 A:
A=(41−21)
现在,我们来测试向量 v=(21) 是否是 A 的一个特征向量。我们通过应用变换(将 A 乘以 v)并查看结果是否是 v 的一个缩放版本来完成此操作。
首先,计算方程的左侧,Av:
Av=(41−21)(21)=(4(2)+(−2)(1)1(2)+1(1))=(8−22+1)=(63)
变换的结果是向量 (63)。现在,我们检查这个结果是否是我们原始向量 v=(21) 的倍数。
是否存在一个标量 λ,使得 (63)=λ(21)?
是的,存在。我们可以看出:
(63)=3(21)
因为我们找到了这样一个标量,我们已经确认 v=(21) 是矩阵 A 的一个特征向量。对应的特征值是 λ=3。变换 A 将这个特定向量拉伸了 3 倍,而没有改变其方向。
特征值的解释
λ 的值提供了关于变换如何作用于相应特征向量的重要信息:
- 如果 λ>1,特征向量被拉伸。
- 如果 0<λ<1,特征向量被收缩。
- 如果 λ=1,特征向量在变换中保持不变。
- 如果 λ<0,特征向量被翻转到相反方向,然后进行缩放。
- 如果 λ=0,特征向量会坍缩到原点(零向量)。
非零条件
值得注意的是,特征向量必须是非零向量。为什么?如果我们允许 v 为零向量,方程 Av=λv 将变为 A0=λ0,简化后为 0=0。这个方程对任何矩阵 A 和任何标量 λ 都成立。它无法提供关于变换的有用信息,因此我们根据定义排除了零向量。