上一篇:线性代数预习自学笔记-21:根子空间分解
一、若尔当块与若尔当标准型
简单总结一下我们在上一篇中得到的成果:一个矩阵不能对角化的原因实质上是其所有特征子空间的直和不能充满整个作用空间,因而我们使用了“根子空间”这个推广概念(特征子空间是它的子空间),并发现任一方阵(线性算子)的所有根子空间的直和就是整个空间,做到了特征子空间做不到的事情;而可对角化矩阵,就是那些对于其任一特征值
仔细琢磨,这似乎与我们前面提到的一个论断非常相似:方阵任一特征值的几何重数小于等于代数重数,矩阵可对角化当且仅当其所有特征值的几何重数都等于代数重数。
据此提出关于代数重数的意义的一个猜想?
不过暂时将这个猜想放在一旁,我们先解决一个近在眼前的问题。既然根子空间的直和是全空间,那么就可以通过根子空间来寻找空间的一组基;回想我们定义根子空间的动机——推广对角化的概念,让所有矩阵都能相似于某类形式简洁的矩阵。这就是说,对每个线性算子,都能找到一组基,使得它在这组基下的表达是最简的。
因此,需要解决的问题就是:这类“形式简洁”的矩阵究竟是什么形式(即如何找这组基)?是否真的能使所有矩阵都相似于这类矩阵?
要解决这两个问题,首先留意由于根子空间的和是直和,所以我们如果对于每个根子空间找到一组基,那么将每个根子空间的基“拼”到一起,就是全空间的一组基了,因此下面我们就只需关注向量空间
既然要从根子空间中找基,那就必然要关注根子空间中的向量——广义特征向量的定义,而其中的核心就是这个式子:
借助对这个式子的变形,我们还提出了广义特征向量链(下面简称特征向量链):
链上的所有向量也都在
当然,这条链可能还可以往前拓展,也就是某个存在
或等价地写成
但由于
这样一来,假设我们要开始找
假设已经找到了一组包含
写成矩阵形式就是
这样就得到了
定义形如
的
如果
定义 设
的
若尔当标准型的特征是:对角线上为任意元素,下方(也有写在上方的;事实上,只要重排基向量的顺序就可以得到这样的若尔当标准型)次对角线上为1或0,其它元素均为0。
如果再将各个根子空间
其中
可以发现
但可惜的是,对于第二个向量
这意味着如果要将链上的元素加入到基中,特征向量链不一定能走到尾。其实,特征向量链的线性无关的尾的最大个数就等于特征子空间的维数,也就是相应特征值的几何重数。我们想要从这些“尾”(也就是一般特征向量)“生长”出可以能构成全空间的基的特征向量链,但这似乎没有那么容易证明。
二、若尔当标准型分解
不过尽管如此,我们依然有别的方法证明这个结论,那就是我们之前在证明根子空间分解时用过的数学归纳法。
定理22.1 令
这些向量且满足
其中
证 该定理描述的就是我们前面所讲的内容(
先注意到
为
都有
准备工作完成,接下来我们对
得
若定理对
因
并由定义,存在
并注意到
而向量组
在用
个向量,它们都属于
而且我们还可以证明它们线性无关;如果承认这点,那么上面两个向量组拼起来就组成了
总结一下我们在该证明中做了什么:用归纳假设取像空间的一组基,然后往向量组中加入
个原像,再加入
的一些向量(使得整个向量组中含有核空间的一组基),所得的向量组即为所求。
为证明该结论,我们推广地证明对任何线性算子
即,若向量
这是简单的,因为若设
则对等式两边同时作用
由于它们是
同样由于它们是一组基向量,
结合根子空间分解定理,我们就可以得到下面的最终结论:
定理22.2(表述一)令
至此,我们终于回到了矩阵。
我们来研究这个若尔当标准型
其中每个小若尔当形
也就是说,特征值
这就是在本篇文章开头以猜想形式所提示的。
自然而然,几何重数不大于代数重数
此外,观察矩阵
而对于
这意味着
根据定义,此即特征值
从定理22.2的证明方法中可以看出一些问题:我们证明了若尔当标准型存在,但对于一个特定的矩阵,我们去如何求解它?换句话说,如何确定次对角线上哪些元素是0,哪些元素是1?转移矩阵
事实上,若要学习有关特定矩阵的若尔当标准型的求解办法,还需要下一点功夫(求解法也不只有一种);另外,我们这里所采用的的证明走的是几何路径,而若尔当标准型还有另外一种代数路径的推导方法,不过那就是
而且,若做过一定的题目,就会发现即使我们不知道如何具体求出这个若尔当标准型,也不影响我们在数学证明和研究中应用它。(很多时候我们也并不想求解它,因为即使知道了方法,它也具有相当的计算量和复杂性。其实,有兴趣的读者可以从“广义特征向量”的定义出发琢磨出若尔当标准型的一个求解方法。)