矩阵理论| 基础:特征值与特征向量、代数重数/几何重数、相似对角化和Jordan标准型

特征值与特征向量

矩阵A \mathbf AA的特征值与特征向量满足A x = λ x \mathbf A\mathbf x=\lambda\mathbf xAx=λx,即( A − λ I ) x = 0 (\mathbf A-\lambda\mathbf I)\mathbf x=0(AλI)x=0,且x ≠ 0 \mathbf x\neq0x=0

  • 特征值d e t ( A − λ I ) = 0 det(\mathbf A-\lambda\mathbf I)=0det(AλI)=0的根,其中p ( λ ) = d e t ( A − λ I ) p(\lambda)=det(\mathbf A-\lambda\mathbf I)p(λ)=det(AλI)特征多项式
    A \mathbf AA全体所有特征值也称为A \mathbf AA,记为λ ( A ) \lambda(\mathbf A)λ(A)
  • 特征向量( A − λ I ) x = 0 (\mathbf A-\lambda\mathbf I)\mathbf x=0(AλI)x=0的非零解,可见特征向量可能充满一整个子空间,该子空间就是零空间N ( A − λ I ) N(\mathbf A-\lambda\mathbf I)N(AλI),称为特征子空间

不同特征值对应的特征子空间的交为{0}

相关的小技巧:若A \mathbf AA的特征值为λ \lambdaλ,则A − k I \mathbf A-k\mathbf IAkI的特征值为λ − k \lambda-kλk

代数重数与几何重数

首先注意,代数重数与几何重数的概念,都是针对某一个特征值λ i \lambda_iλi而言的

n nn阶矩阵A \mathbf AA的特征多项式写为p ( t ) = det ⁡ ( A − t I ) = ( λ 1 − t ) β 1 ⋯ ( λ k − t ) β k p(t)=\operatorname{det}(A-t I)=\left(\lambda_{1}-t\right)^{\beta_{1}} \cdots\left(\lambda_{k}-t\right)^{\beta_{k}}p(t)=det(AtI)=(λ1t)β1(λkt)βk
其中,β 1 + β 2 + . . . β k = n \beta_1+\beta_2+...\beta_k=nβ1+β2+...βk=nn nn阶多项式,有n nn个根)

  • 特征值λ i \lambda_iλi代数重数β i \beta_iβi
    ps. 代数重数也可以定义为β i = d i m [ N ( ( A − λ i I ) n ) ] \beta_i=dim[N((\mathbf A-\lambda_i\mathbf I)^n)]βi=dim[N((AλiI)n)],见特征值的代数重数与几何重数
  • 特征值λ i \lambda_iλi几何重数为其特征子空间的维数,即d i m [ N ( A − λ i I ) ] dim[N(\mathbf A-\lambda_i\mathbf I)]dim[N(AλiI)]

对于任一特征值λ i \lambda_iλi几何重数<=代数重数

  • 当特征值有重根时,就可能有几何重数<代数重数,此时“缺少”特征向量,对应降维变换,并且矩阵无法相似对角化

相似对角化和Jordan标准型

  • 当所有特征值的几何重数=代数重数,有d i m [ N ( A − λ 1 I ) ] + . . . + d i m [ N ( A − λ k I ) ] = n dim[N(\mathbf A-\lambda_1\mathbf I)]+...+dim[N(\mathbf A-\lambda_k\mathbf I)]=ndim[N(Aλ1I)]+...+dim[N(AλkI)]=n,矩阵可相似对角化
    可以用n nn个线性无关的特征向量组成可逆矩阵P \mathbf PP,使A = P Λ P − 1 \mathbf A=\mathbf P\mathbf \Lambda\mathbf P^{-1}A=P1

此时,A \mathbf AA的特征向量可以给出C n \mathbb{C}^{n}Cn空间的一组基
或者说,A \mathbf AA的所有特征子空间给出了整个空间的直和分解:N ( A − λ 1 I ) ⊕ ⋯ ⊕ N ( A − λ k I ) = C n N\left(A-\lambda_{1} I\right) \oplus \cdots \oplus N\left(A-\lambda_{k} I\right)=\mathbb{C}^{n}N(Aλ1I)N(AλkI)=Cn

实对称矩阵(n个正交的特征向量)、幂等矩阵(证明见后文)必然可以相似对角化

  • 更一般的,矩阵没有n nn个线性无关的特征向量,则无法相似对角化,此时只能求Jordan标准型J \mathbf JJ,使A = P J P − 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1}A=PJP1
    此时仅满足d i m [ N ( ( A − λ 1 I ) n ) ] + . . . + d i m [ N ( ( A − λ k I ) n ) ] = n dim[N((\mathbf A-\lambda_1\mathbf I)^n)]+...+dim[N((\mathbf A-\lambda_k\mathbf I)^n)]=ndim[N((Aλ1I)n)]+...+dim[N((AλkI)n)]=n(代数重数的定义2)

定义特征值λ i \lambda_iλi广义特征向量( A − λ I ) n x = 0 (\mathbf A-\lambda\mathbf I)^n\mathbf x=0(AλI)nx=0的非零解,
N ( ( A − λ i I ) n ) N((\mathbf A-\lambda_i\mathbf I)^n)N((AλiI)n)称为广义特征子空间(其维数=代数重数,β i = d i m [ N ( ( A − λ i I ) n ) ] \beta_i=dim[N((\mathbf A-\lambda_i\mathbf I)^n)]βi=dim[N((AλiI)n)]

那么,可以用n nn个线性无关的广义特征向量组成可逆矩阵P \mathbf PP,使A = P J P − 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1}A=PJP1,见Jordan 标准型-寻找广义特征向量
此时,广义特征子空间给出了整个空间的直和分解:N ( ( A − λ 1 I ) n ) ⊕ ⋯ ⊕ N ( ( A − λ k I ) n ) = C n N\left(\left(A-\lambda_{1} I\right)^{n}\right) \oplus \cdots \oplus N\left(\left(A-\lambda_{k} I\right)^{n}\right)=\mathbb{C}^{n}N((Aλ1I)n)N((AλkI)n)=Cn

例题:证明幂等矩阵一定可以相似对角化

对于幂等矩阵P \mathbf PPP 2 = P \mathbf P^2=\mathbf PP2=P,幂等矩阵的特征值只可能为0和1(由P x = λ x \mathbf P\mathbf x=\lambda\mathbf xPx=λxP 2 x = λ 2 x \mathbf P^2\mathbf x=\lambda^2\mathbf xP2x=λ2x可知)
另外,( I − P ) \mathbf {(I-P)}(IP)也是幂等矩阵(( I − P ) 2 = I − P \mathbf {(I-P)^2}=\mathbf {I-P}(IP)2=IP
因此有N ( P n ) = N ( P ) N(\mathbf P^n)=N(\mathbf P)N(Pn)=N(P)N ( ( I − P ) n ) = N ( I − P ) N(\mathbf{(I-P)}^n)=N(\mathbf {I-P})N((IP)n)=N(IP),由上面的知识,特征值0的代数重数等于几何重数,特征值1的代数重数也等于几何重数,故幂等矩阵一定可以相似对角化


版权声明:本文为Insomnia_X原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。