特征值与特征向量
矩阵A \mathbf AA的特征值与特征向量满足A x = λ x \mathbf A\mathbf x=\lambda\mathbf xAx=λx,即( A − λ I ) x = 0 (\mathbf A-\lambda\mathbf I)\mathbf x=0(A−λI)x=0,且x ≠ 0 \mathbf x\neq0x=0
- 特征值:d e t ( A − λ I ) = 0 det(\mathbf A-\lambda\mathbf I)=0det(A−λI)=0的根,其中p ( λ ) = d e t ( A − λ I ) p(\lambda)=det(\mathbf A-\lambda\mathbf I)p(λ)=det(A−λI)为特征多项式
A \mathbf AA全体所有特征值也称为A \mathbf AA的谱,记为λ ( A ) \lambda(\mathbf A)λ(A) - 特征向量:( A − λ I ) x = 0 (\mathbf A-\lambda\mathbf I)\mathbf x=0(A−λI)x=0的非零解,可见特征向量可能充满一整个子空间,该子空间就是零空间N ( A − λ I ) N(\mathbf A-\lambda\mathbf I)N(A−λI),称为特征子空间
不同特征值对应的特征子空间的交为{0}
相关的小技巧:若A \mathbf AA的特征值为λ \lambdaλ,则A − k I \mathbf A-k\mathbf IA−kI的特征值为λ − k \lambda-kλ−k
代数重数与几何重数
首先注意,代数重数与几何重数的概念,都是针对某一个特征值λ i \lambda_iλi而言的
将n nn阶矩阵A \mathbf AA的特征多项式写为p ( t ) = det ( A − t I ) = ( λ 1 − t ) β 1 ⋯ ( λ k − t ) β k p(t)=\operatorname{det}(A-t I)=\left(\lambda_{1}-t\right)^{\beta_{1}} \cdots\left(\lambda_{k}-t\right)^{\beta_{k}}p(t)=det(A−tI)=(λ1−t)β1⋯(λk−t)βk
其中,β 1 + β 2 + . . . β k = n \beta_1+\beta_2+...\beta_k=nβ1+β2+...βk=n(n nn阶多项式,有n nn个根)
- 特征值λ i \lambda_iλi的代数重数为β i \beta_iβi
ps. 代数重数也可以定义为β i = d i m [ N ( ( A − λ i I ) n ) ] \beta_i=dim[N((\mathbf A-\lambda_i\mathbf I)^n)]βi=dim[N((A−λiI)n)],见特征值的代数重数与几何重数 - 特征值λ i \lambda_iλi的几何重数为其特征子空间的维数,即d i m [ N ( A − λ i I ) ] dim[N(\mathbf A-\lambda_i\mathbf I)]dim[N(A−λiI)]
对于任一特征值λ i \lambda_iλi,几何重数<=代数重数
- 当特征值有重根时,就可能有几何重数<代数重数,此时“缺少”特征向量,对应降维变换,并且矩阵无法相似对角化
相似对角化和Jordan标准型
- 当所有特征值的几何重数=代数重数,有d i m [ N ( A − λ 1 I ) ] + . . . + d i m [ N ( A − λ k I ) ] = n dim[N(\mathbf A-\lambda_1\mathbf I)]+...+dim[N(\mathbf A-\lambda_k\mathbf I)]=ndim[N(A−λ1I)]+...+dim[N(A−λkI)]=n,矩阵可相似对角化:
可以用n nn个线性无关的特征向量组成可逆矩阵P \mathbf PP,使A = P Λ P − 1 \mathbf A=\mathbf P\mathbf \Lambda\mathbf P^{-1}A=PΛP−1
此时,A \mathbf AA的特征向量可以给出C n \mathbb{C}^{n}Cn空间的一组基
或者说,A \mathbf AA的所有特征子空间给出了整个空间的直和分解:N ( A − λ 1 I ) ⊕ ⋯ ⊕ N ( A − λ k I ) = C n N\left(A-\lambda_{1} I\right) \oplus \cdots \oplus N\left(A-\lambda_{k} I\right)=\mathbb{C}^{n}N(A−λ1I)⊕⋯⊕N(A−λkI)=Cn
实对称矩阵(n个正交的特征向量)、幂等矩阵(证明见后文)必然可以相似对角化
- 更一般的,矩阵没有n nn个线性无关的特征向量,则无法相似对角化,此时只能求Jordan标准型J \mathbf JJ,使A = P J P − 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1}A=PJP−1
此时仅满足d i m [ N ( ( A − λ 1 I ) n ) ] + . . . + d i m [ N ( ( A − λ k I ) n ) ] = n dim[N((\mathbf A-\lambda_1\mathbf I)^n)]+...+dim[N((\mathbf A-\lambda_k\mathbf I)^n)]=ndim[N((A−λ1I)n)]+...+dim[N((A−λkI)n)]=n(代数重数的定义2)
定义特征值λ i \lambda_iλi的广义特征向量为( A − λ I ) n x = 0 (\mathbf A-\lambda\mathbf I)^n\mathbf x=0(A−λI)nx=0的非零解,
将N ( ( A − λ i I ) n ) N((\mathbf A-\lambda_i\mathbf I)^n)N((A−λiI)n)称为广义特征子空间(其维数=代数重数,β i = d i m [ N ( ( A − λ i I ) n ) ] \beta_i=dim[N((\mathbf A-\lambda_i\mathbf I)^n)]βi=dim[N((A−λiI)n)])
那么,可以用n nn个线性无关的广义特征向量组成可逆矩阵P \mathbf PP,使A = P J P − 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1}A=PJP−1,见Jordan 标准型-寻找广义特征向量
此时,广义特征子空间给出了整个空间的直和分解:N ( ( A − λ 1 I ) n ) ⊕ ⋯ ⊕ N ( ( A − λ k I ) n ) = C n N\left(\left(A-\lambda_{1} I\right)^{n}\right) \oplus \cdots \oplus N\left(\left(A-\lambda_{k} I\right)^{n}\right)=\mathbb{C}^{n}N((A−λ1I)n)⊕⋯⊕N((A−λkI)n)=Cn
例题:证明幂等矩阵一定可以相似对角化
对于幂等矩阵P \mathbf PP有P 2 = P \mathbf P^2=\mathbf PP2=P,幂等矩阵的特征值只可能为0和1(由P x = λ x \mathbf P\mathbf x=\lambda\mathbf xPx=λx和P 2 x = λ 2 x \mathbf P^2\mathbf x=\lambda^2\mathbf xP2x=λ2x可知)
另外,( I − P ) \mathbf {(I-P)}(I−P)也是幂等矩阵(( I − P ) 2 = I − P \mathbf {(I-P)^2}=\mathbf {I-P}(I−P)2=I−P)
因此有N ( P n ) = N ( P ) N(\mathbf P^n)=N(\mathbf P)N(Pn)=N(P)和N ( ( I − P ) n ) = N ( I − P ) N(\mathbf{(I-P)}^n)=N(\mathbf {I-P})N((I−P)n)=N(I−P),由上面的知识,特征值0的代数重数等于几何重数,特征值1的代数重数也等于几何重数,故幂等矩阵一定可以相似对角化