趋近智
我们已经明确,对于一个特征向量 v,变换 A 仅通过其对应的特征值 λ 对其进行缩放。这种关系由方程 Av=λv 表述。虽然此方程完美描绘了特征值和特征向量的性质,但它并未直接指明如何针对给定矩阵 A 来求取它们。为此,我们需要一种代数方法,该方法始于重新整理这个基本方程。
我们的目标是求出使此方程对某个非零向量 v 成立的 λ 值(即特征值)。我们首先将所有项移至方程的一侧:
Av−λv=0
乍看之下,我们似乎可以将向量 v 提取出来,但这里有一个小障碍。在项 Av 中,v 与矩阵 A 相乘,而在 λv 中,它与标量 λ 相乘。我们不能从矩阵中减去一个标量。为了解决这个问题,我们可以使用单位矩阵 I。回想一下,将任意向量 v 乘以单位矩阵 I 会使其保持不变,因此 v=Iv。我们可以将其代入我们的方程:
Av−λ(Iv)=0
现在,两项都涉及矩阵与向量 v 相乘,这使得我们能够将 v 提取出来:
(A−λI)v=0
这个单一的方程提供了很多信息。它告诉我们,当我们将向量 v 乘以矩阵 (A−λI) 时,结果是零向量。
方程 (A−λI)v=0 的一个显而易见的解是 平凡解,即 v 是零向量。然而,特征向量的定义要求它是一个非零向量。毕竟,零向量的方向未定义,所以其方向在变换下保持不变的说法并没有太大用处。
这意味着我们正在寻找一个满足此方程的非零向量 v。形如 Mx=0 的线性方程组仅当矩阵 M 奇异时才存在非零解 x。奇异矩阵是没有逆矩阵的矩阵。检查方阵是否奇异的一种便捷方法是计算其行列式。如果行列式为零,则该矩阵是奇异的。
将此应用于我们的情况,要使方程 (A−λI)v=0 存在非零解 v,矩阵 (A−λI) 必须是奇异的。这直接引出了我们所需的条件:
det(A−λI)=0
此方程被称为矩阵 A 的特征方程。
从初始特征值定义推导特征方程的过程。
我们来为一个简单的 2x2 矩阵求取特征值,以看特征方程如何运用。假设我们有矩阵 A:
A=(2112)步骤 1:构建矩阵 (A−λI)
首先,我们从 A 中减去 λI:
A−λI=(2112)−λ(1001)=(2−λ112−λ)步骤 2:计算行列式并将其设为零
接下来,我们求此新矩阵的行列式。对于一个 2x2 矩阵 (acbd),其行列式为 ad−bc。
det(A−λI)=(2−λ)(2−λ)−(1)(1)=0步骤 3:求解特征方程以求取 λ
展开此方程会得到一个关于 λ 的多项式,此多项式被称为特征多项式。
(4−4λ+λ2)−1=0 λ2−4λ+3=0我们可以通过因式分解来求解这个二次方程:
(λ−3)(λ−1)=0这为我们提供了 λ 的两个解。这些解即为矩阵 A 的特征值:
λ1=3,λ2=1通过求解特征方程,我们成功求得了矩阵 A 的特征值。这些是矩阵 A 定义的线性变换的两个特殊缩放因子。下一步(我们将在稍后讲解)是将这些特征值中的每一个代回方程 (A−λI)v=0,以求取它们对应的特征向量。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造