当一个矩阵作用于一个向量时,它通常会改变向量的方向。但对于大多数方阵,某些非零向量是特别的。这种变换只会拉伸或收缩它们,保持它们原来的方向不变。这些特殊向量被称为特征向量,而它们被缩放的因子则是它们对应的特征值。这种独特的关系用一个简单而有力的方程表示:$$ Av = \lambda v $$这个方程说明,当矩阵 $A$ 作用于其特征向量 $v$ 时,结果等同于将 $v$ 乘以一个标量,即特征值 $\lambda$。让我们分解每个组成部分:$A$ 是表示线性变换的方阵。$v$ 是特征向量,一个非零向量,其方向在变换中保持不变。$\lambda$ (希腊字母 lambda) 是特征值,一个标量,它表示特征向量 $v$ 被拉伸、收缩或翻转的倍数。本质上,特征向量定义了变换的“轴”。其他向量以复杂的方式旋转和缩放,而特征向量指向变换仅作为缩放操作的那些方向。digraph G { compound=true; node [shape=box, style=rounded, fontname="Helvetica", color="#495057", fontcolor="#495057"]; edge [fontname="Helvetica", color="#495057", fontcolor="#495057"]; graph [fontname="Helvetica"]; subgraph cluster_A { label="一般向量变换"; bgcolor="#e9ecef"; fontcolor="#495057"; u [label="向量 u", shape=ellipse, style="filled", fillcolor="#bac8ff"]; Au [label="变换后的向量 Au", shape=ellipse, style="filled", fillcolor="#b2f2bb"]; u -> Au [label=" 应用矩阵 A\n(方向和长度改变)"]; } subgraph cluster_B { label="特征向量变换"; bgcolor="#e9ecef"; fontcolor="#495057"; v [label="特征向量 v", shape=ellipse, style="filled", fillcolor="#ffc9c9"]; Av [label="变换后的向量 λv", shape=ellipse, style="filled", fillcolor="#ffc9c9"]; v -> Av [label=" 应用矩阵 A\n(方向保持不变,只改变长度)"]; } }对于一般向量,矩阵变换会改变其方向。对于特征向量,变换只会沿着同一条线(其“特征空间”)对其进行缩放。一个具体示例让我们用数字来具体说明。考虑以下矩阵 $A$:$$ A = \begin{pmatrix} 4 & -2 \ 1 & 1 \end{pmatrix} $$现在,我们来测试向量 $v = \begin{pmatrix} 2 \ 1 \end{pmatrix}$ 是否是 $A$ 的一个特征向量。我们通过应用变换(将 $A$ 乘以 $v$)并查看结果是否是 $v$ 的一个缩放版本来完成此操作。首先,计算方程的左侧,$Av$:$$ Av = \begin{pmatrix} 4 & -2 \ 1 & 1 \end{pmatrix} \begin{pmatrix} 2 \ 1 \end{pmatrix} = \begin{pmatrix} 4(2) + (-2)(1) \ 1(2) + 1(1) \end{pmatrix} = \begin{pmatrix} 8 - 2 \ 2 + 1 \end{pmatrix} = \begin{pmatrix} 6 \ 3 \end{pmatrix} $$变换的结果是向量 $\begin{pmatrix} 6 \ 3 \end{pmatrix}$。现在,我们检查这个结果是否是我们原始向量 $v = \begin{pmatrix} 2 \ 1 \end{pmatrix}$ 的倍数。是否存在一个标量 $\lambda$,使得 $\begin{pmatrix} 6 \ 3 \end{pmatrix} = \lambda \begin{pmatrix} 2 \ 1 \end{pmatrix}$?是的,存在。我们可以看出:$$ \begin{pmatrix} 6 \ 3 \end{pmatrix} = 3 \begin{pmatrix} 2 \ 1 \end{pmatrix} $$因为我们找到了这样一个标量,我们已经确认 $v = \begin{pmatrix} 2 \ 1 \end{pmatrix}$ 是矩阵 $A$ 的一个特征向量。对应的特征值是 $\lambda = 3$。变换 $A$ 将这个特定向量拉伸了 3 倍,而没有改变其方向。特征值的解释$\lambda$ 的值提供了关于变换如何作用于相应特征向量的重要信息:如果 $\lambda > 1$,特征向量被拉伸。如果 $0 < \lambda < 1$,特征向量被收缩。如果 $\lambda = 1$,特征向量在变换中保持不变。如果 $\lambda < 0$,特征向量被翻转到相反方向,然后进行缩放。如果 $\lambda = 0$,特征向量会坍缩到原点(零向量)。非零条件值得注意的是,特征向量必须是非零向量。为什么?如果我们允许 $v$ 为零向量,方程 $A v = \lambda v$ 将变为 $A\mathbf{0} = \lambda\mathbf{0}$,简化后为 $\mathbf{0} = \mathbf{0}$。这个方程对任何矩阵 $A$ 和任何标量 $\lambda$ 都成立。它无法提供关于变换的有用信息,因此我们根据定义排除了零向量。