矩阵的迹(Trace)
n × n n\times nn×n的方阵A的n个对角线元素的和称为方阵A的迹,记作tr(A).
A = ( a 11 ⋯ a 1 n ⋮ ⋮ a n 1 ⋯ a n n ) A=\begin{pmatrix}a_{11}&\cdots &a_{1n}\\\vdots&\ &\vdots\\a_{n1}&\cdots&a_{nn}\end{pmatrix}A=⎝⎜⎛a11⋮an1⋯ ⋯a1n⋮ann⎠⎟⎞
由定义知,t r ( A ) = a 11 + a 22 + ⋯ + a n n = ∑ j = 0 n a j j tr(A)=a_{11}+a_{22}+\cdots +a_{nn}=\displaystyle\sum\limits_{j=0}^n a_{jj}tr(A)=a11+a22+⋯+ann=j=0∑najj
矩阵的秩(Rank)
定义1(比较晦涩):域F FF上n × m n\times mn×m的非零矩阵A的所有子式中必有一个阶数最大的非零子式,其阶数称为矩阵A的秩,记作r a n k ( A ) rank(A)rank(A). 零矩阵的秩定义为零。
定义2:矩阵A AA的秩是A AA的列空间的维数,记作r a n k ( A ) rank(A)rank(A)。(因为A AA的主元列形成A AA的列空间C o l A Col\space ACol A的一个基,所以A AA的秩正好是A AA的主元列的个数。)
由于矩阵A的子式阶数不超过A的行数及列数,所以域F FF上n × m n\times mn×m的非零矩阵A的秩有:
(1)0 ≤ r a n k ( A ) ≤ m i n ( n , m ) 0\leq rank(A)\leq min(n,m)0≤rank(A)≤min(n,m);
(2)r a n k ( c A ) = r a n k ( A ) rank(cA)=rank(A)rank(cA)=rank(A),其中c为不等于0的常数;
(3)r a n k ( A T ) = r a n k ( A ) rank(A^T)=rank(A)rank(AT)=rank(A);
(4)r a n k ( A ‾ ) = r a n k ( A ) rank(\overline{A})=rank(A)rank(A)=rank(A), r a n k ( A ∗ ) = r a n k ( A ) rank(A^{*})=rank(A)rank(A∗)=rank(A). 其中A ‾ \overline{A}A为A AA的共轭矩阵,A ∗ A^{*}A∗为A AA的伴随矩阵。
使用MATLAB求矩阵的秩(RANK)
若要求矩阵A AA的秩,可以先将矩阵A AA化简为简化阶梯阵(reduced echelon form),然后数其主元列(pivot columns)数即为A AA的秩。
>>A = [1 2 3 4;4 5 6 7;6 9 12 15;1 1 1 1]
A =
1 2 3 4
4 5 6 7
6 9 12 15
1 1 1 1
>>rref(A) //求简化阶梯阵
ans =
1 0 -1 -2
0 1 2 3
0 0 0 0
0 0 0 0
//可见A的简化阶梯阵有2个主元列---第一列和第二列,所以秩为2. 可以使用rank()函数快速求矩阵的秩,进行验算
>>rank(A)
ans =
2
//验算结果和计算的主元列数一致。
可见,对于上例的矩阵A AA,有两个主元列(第一和第二列),所以秩为2。由于上述矩阵化为简化阶梯阵后,有2列不是主元列,所以有方程A x = 0 Ax=0Ax=0有2个自由变量(非主元列对应于方程A x = 0 Ax=0Ax=0的自由变量),所以主元列加非主元列正好等于矩阵A AA的列数。所以可以得出一下秩定理:
秩定理:如果矩阵A AA有n nn列,那么r a n k A + d i m N u l A = n rank\space A+dim\space Nul\space A=nrank A+dim Nul A=n。
共轭矩阵(Conjugate Matrix)
n × m n\times mn×m的复矩阵A的共轭矩阵是m × n m\times nm×n的矩阵(形如其转置矩阵),记作A ∗ A^{*}A∗:
A = ( a 11 ⋯ a 1 m ⋮ ⋮ a n 1 ⋯ a n m ) A=\begin{pmatrix}a_{11}&\cdots &a_{1m}\\\vdots&\ &\vdots\\a_{n1}&\cdots&a_{nm}\end{pmatrix}A=⎝⎜⎛a11⋮an1⋯ ⋯a1m⋮anm⎠⎟⎞
A ‾ = ( a 11 ‾ ⋯ a 1 m ‾ ⋮ ⋮ a n 1 ‾ ⋯ a n m ‾ ) \overline{A}=\begin{pmatrix}\overline{a_{11}}&\cdots &\overline{a_{1m}}\\\vdots&\ &\vdots\\\overline{a_{n1}}&\cdots&\overline{a_{nm}}\end{pmatrix}A=⎝⎜⎛a11⋮an1⋯ ⋯a1m⋮anm⎠⎟⎞
A ∗ = ( a 11 ‾ ⋯ a n 1 ‾ ⋮ ⋮ a 1 m ‾ ⋯ a n m ‾ ) A^{*}=\begin{pmatrix}\overline{a_{11}}&\cdots &\overline{a_{n1}}\\\vdots&\ &\vdots\\\overline{a_{1m}}&\cdots&\overline{a_{nm}}\end{pmatrix}A∗=⎝⎜⎛a11⋮a1m⋯ ⋯an1⋮anm⎠⎟⎞
共轭矩阵求法是,先将A转置,再对每个元素求共轭即可:
A ∗ = A T ‾ A^{*}=\overline{A^T}A∗=AT
共轭矩阵也叫自共轭矩阵、Hermite矩阵,要求元素a j k a_{jk}ajk与a k j a_{kj}akj共轭,即a j k ‾ = a k j ‾ \overline{a_{jk}}=\overline{a_{kj}}ajk=akj如:
( 1 3 + 2 i 3 − 2 i 1 ) \begin{pmatrix}1&3+2i\\3-2i&1\end{pmatrix}(13−2i3+2i1)中,a 12 = 3 + 2 i a_{12}=3+2ia12=3+2i与a 21 = 3 − 2 i a_{21}=3-2ia21=3−2i共轭相等,所以此矩阵为共轭矩阵。
伴随矩阵(Adjugate Matrix)
设矩阵A为域F上的n阶方阵:
A = ( a 11 ⋯ a 1 n ⋮ ⋮ a n 1 ⋯ a n n ) A=\begin{pmatrix}a_{11}&\cdots &a_{1n}\\\vdots&\ &\vdots\\a_{n1}&\cdots&a_{nn}\end{pmatrix}A=⎝⎜⎛a11⋮an1⋯ ⋯a1n⋮ann⎠⎟⎞
记A j k A_{jk}Ajk为元素a j k a_{jk}ajk的代数余子式,用域F上n 2 n^2n2个数A j k A_{jk}Ajk构成的n阶方阵即方阵A的伴随方阵,记作A ( ∗ ) A^{(*)}A(∗)。求法,先构成代数余子式矩阵:
( A 11 A 12 ⋯ A 1 n A 21 A 22 ⋮ A 2 n ⋮ ⋮ ⋮ A n 1 A n 2 ⋯ A n n ) \begin{pmatrix}A_{11}&A_{12}&\cdots &A_{1n}\\A_{21}&A_{22}&\vdots&A_{2n}\\\vdots&\vdots&\ &\vdots\\A_{n1}&A_{n2}&\cdots&A_{nn}\end{pmatrix}⎝⎜⎜⎜⎜⎛A11A21⋮An1A12A22⋮An2⋯⋮ ⋯A1nA2n⋮Ann⎠⎟⎟⎟⎟⎞
再将其转置即可得到A的伴随矩阵A ( ∗ ) A^{(*)}A(∗):
( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋮ A n 2 ⋮ ⋮ ⋮ A 1 n A 2 n ⋯ A n n ) \begin{pmatrix}A_{11}&A_{21}&\cdots &A_{n1}\\A_{12}&A_{22}&\vdots&A_{n2}\\\vdots&\vdots&\ &\vdots\\A_{1n}&A_{2n}&\cdots&A_{nn}\end{pmatrix}⎝⎜⎜⎜⎜⎛A11A12⋮A1nA21A22⋮A2n⋯⋮ ⋯An1An2⋮Ann⎠⎟⎟⎟⎟⎞
基底(Basis)维数(Dimension)与秩(Rank)
基底(或称基,basis):如果向量空间H HH中的一组线性无关向量可以把该空间内所有向量通过线性组合的方式表示出来,那么这组向量成为该空间的一个基。
由定义知,基是一组向量的组合。
相对某个基的坐标的计算方法:如果B = { b 1 , … , b p } B=\{b_1,\dots ,b_p\}B={b1,…,bp}是子空间H HH的一组基,对H HH中每一个向量x xx,相对于基B = { b 1 , … , b p } B=\{b_1,\dots ,b_p\}B={b1,…,bp}的坐标是使得x = c 1 b 1 + ⋯ + c p b p x=c_1b_1+\dots +c_pb_px=c1b1+⋯+cpbp成立的权c 1 , … , c p c_1,\dots,c_pc1,…,cp,且R p R^pRp中的向量[ x ] B = [ c 1 ⋮ c p ] [x]_B=\begin{bmatrix}c_1\\\vdots\\c_p\end{bmatrix}[x]B=⎣⎢⎡c1⋮cp⎦⎥⎤称为x xx相对于基B BB的坐标向量,或称x xx的B BB-坐标向量。
例:设v 1 = [ 3 6 2 ] v_1=\begin{bmatrix}3\\6\\2\end{bmatrix}v1=⎣⎡362⎦⎤,v 2 = [ − 1 0 1 ] v_2=\begin{bmatrix}-1\\0\\1\end{bmatrix}v2=⎣⎡−101⎦⎤,x = [ 3 12 7 ] x=\begin{bmatrix}3\\12\\7\end{bmatrix}x=⎣⎡3127⎦⎤,B = { v 1 , v 2 } B=\{v_1,v_2\}B={v1,v2},因为v 1 , v 2 v_1,v_2v1,v2显然线性无关,所以B BB是H = S p a n { v 1 , v 2 } H=Span\{v_1,v_2\}H=Span{v1,v2}的基。请判断x xx是否在空间H HH中,如果在,请求出x xx相对于B BB的坐标向量。
解:
如果x xx在空间H HH中(空间H HH是v_1和v_2确定的平面),则方程c 1 v 1 + c 2 v 2 = x c_1v_1+c_2v_2=xc1v1+c2v2=x,c 1 c_1c1和c 2 c_2c2称为权,即:
c 1 [ 3 6 2 ] + c 2 [ − 1 0 1 ] = [ 3 12 7 ] c_1\begin{bmatrix}3\\6\\2\end{bmatrix}+c_2\begin{bmatrix}-1\\0\\1\end{bmatrix}=\begin{bmatrix}3\\12\\7\end{bmatrix}c1⎣⎡362⎦⎤+c2⎣⎡−101⎦⎤=⎣⎡3127⎦⎤是有解的(或说相容的)
如果权c 1 c_1c1、c 2 c_2c2存在,那么它们是x xx的B BB-坐标。
下面解方程:c 1 v 1 + c 2 v 2 = x c_1v_1+c_2v_2=xc1v1+c2v2=x对应的增广矩阵:
[ 3 − 1 3 6 0 12 2 1 7 ] → [ 1 0 2 0 1 3 0 0 0 ] \begin{bmatrix}3&-1 &3\\6&0&12\\2&1&7\end{bmatrix}\rightarrow \begin{bmatrix}1&0&2\\0&1&3\\0&0&0\end{bmatrix}⎣⎡362−1013127⎦⎤→⎣⎡100010230⎦⎤
即:c = [ c 1 c 2 ] = [ 2 3 ] c=\begin{bmatrix}c_1\\c_2\end{bmatrix}=\begin{bmatrix}2\\3\end{bmatrix}c=[c1c2]=[23]
所以[ x ] B = [ c 1 c 2 ] = [ 2 3 ] [x]_B=\begin{bmatrix}c_1\\c_2\end{bmatrix}=\begin{bmatrix}2\\3\end{bmatrix}[x]B=[c1c2]=[23]就是x xx相对于基B BB的坐标向量,或称x xx的B BB-坐标向量。
即:x = 2 v 1 + 3 v 2 x=2v_1+3v_2x=2v1+3v2,画图如下:
总结:
虽然H HH中的点也在R 3 R^3R3中,但是它们完全由属于R 2 R^2R2的坐标向量确定(因为本例中H HH是v_1和v_2确定的平面,属于R 2 R^2R2)。映射x ∣ → [ x ] B x|\rightarrow [x]_Bx∣→[x]B是使H HH和R 2 R^2R2之间保持线性组合关系的一一映射,那么可以称这种映射是同构的,本例中H HH与R 2 R^2R2同构。
一般地,如果B = { b 1 , … , b p } B=\{b_1,\dots ,b_p\}B={b1,…,bp}是子空间H HH的一组基,则映射x ∣ → [ x ] B x|\rightarrow [x]_Bx∣→[x]B是使H HH和R p R^pRp的形态一样的一一映射(H HH中的向量可能多于p pp个元素)。