一、线性空间
给定非空集合V \bm{V}V和域F \bm{F}F,若存在映射
σ : V × V → V ( V 1 , V 2 ) ↦ σ ( V 1 , V 2 ) \begin{aligned} & \bm{σ} : \bm{V} × \bm{V} \rightarrow \bm{V}\\ & \ \ \ \ \ \ (V_1, V_2)\mapsto\bm{σ}(V_1, V_2) \end{aligned}σ:V×V→V (V1,V2)↦σ(V1,V2)则称σ \bm{σ}σ为V \bm{V}V上的加法。
其中V × V \bm{V} × \bm{V}V×V的运算称为集合的卡氏积【Cartesian product】,又名笛卡尔积,形如S 1 × S 2 = { ( s 1 , s 2 ) ∣ s 1 ∈ S 1 , s 2 ∈ S 2 } \bm{S_1} × \bm{S_2} = \{(s_1, s_2)|s_1\in \bm{S_1},s_2\in \bm{ S_2}\}S1×S2={(s1,s2)∣s1∈S1,s2∈S2}这些有序对的全体构成了新的集合,称为其卡氏积。
在一个运算系统中,如果该系统是封闭的,则称该系统为一个域。典型的有有理数域,实数域与复数域,而自然数等集合无法完全进行基本运算,并非封闭,不能成为域。
先回顾通常的运算规则,包括加法的交换律v 1 + v 2 = v 2 + v 1 v_1 + v_2 = v_2 + v_1v1+v2=v2+v1加法的结合律( v 1 + v 2 ) + v 3 = v 1 + ( v 2 + v 3 ) (v_1 + v_2) + v_3 = v_1 + (v_2 + v_3)(v1+v2)+v3=v1+(v2+v3)加法的有零元∃ e ∈ V , e + v = v \exists e\in \bm{V}, e + v = v∃e∈V,e+v=v加法的有负元∀ v ∈ V , ∃ a ∈ V , v + a = e \forall v\in \bm{V}, \exists a\in \bm{V}, v + a = e∀v∈V,∃a∈V,v+a=e记a = − v a = - va=−v。以及数乘法的向量与数分配律( v 1 + v 2 ) k = v 1 k + v 2 k (v_1 + v_2)k = v_1k + v_2k(v1+v2)k=v1k+v2kv ( k 1 + k 2 ) = v k 1 + v k 2 v(k_1 + k_2) = vk_1 + vk_2v(k1+k2)=vk1+vk2数乘法的结合律v ( k l ) = ( v k ) l v(kl) = (vk)lv(kl)=(vk)l其中k kk与l ll是域F \bm{F}F的任意数。乘法的1元v 1 = v v1 = vv1=v其中在数乘中,若向量为列向量,数乘法的数写在右侧;反之亦然,如此这般可以将数化为1×1的向量,由此等效为矩阵乘法。
给定非空集合V \bm{V}V和域F \bm{F}F,在集合V \bm{V}V的元素之间定义加法与数乘法,若满足以上四条加法法则与四条数乘法法则,则称集合V \bm{V}V为域F \bm{F}F的线性空间。
将几何空间作为线性空间,来理解线性空间。定义V \bm{V}V为有向线段的全体,F \bm{F}F为实数域,考察加法为平行四边形法则,数乘法为正反向伸缩,并考察八条运算规律。
再考虑函数空间,以一定区间X XX为定义域,具有n个分量的n维向量值函数,将该向量作为一个元素,则所有这些函数的集合称为函数空间,记F ( X , R n ) = { f ∣ f = [ f 1 ( x ) , . . . , f n ( x ) ] T , x ∈ X } F(X, \bm{R}^n) = \{ \bm{f}|\bm{f} = [f_1(x), ..., f_n(x)]^T, x\in X \}F(X,Rn)={f∣f=[f1(x),...,fn(x)]T,x∈X}并考虑向量加法与数乘法,以考察八条运算规则。
二、向量空间与线性相关性
定义向量组,由p个元素排列组成的有限序列a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap及向量组运算得到的抽象矩阵( a 1 , a 2 , . . . , a p ) \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right )(a1,a2,...,ap),并定义若∃ k = [ k 1 , k 2 , . . . , k p ] T ≠ 0 , k ∈ F p \exists \bm{k} = [k_1, k_2 , ..., k_p]^T \ne \bm{0}, \bm{k} \in \bm{F}^p∃k=[k1,k2,...,kp]T=0,k∈Fp,使得( a 1 , a 2 , . . . , a p ) k = 0 \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{0}(a1,a2,...,ap)k=0则称向量组a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap为线性相关;若向量组a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap不是线性相关的,则成为线性无关。再考虑线性相关性的矩阵描述,即方程组( a 1 , a 2 , . . . , a p ) ( x 1 , x 2 , . . . , x p ) T = 0 \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{0}(a1,a2,...,ap)(x1,x2,...,xp)T=0当向量组a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap线性相关时,该方程组有非零解;反之,则仅有零解。
考虑两个向量组a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap与b 1 , b 2 , . . . , b q \bm{b_1}, \bm{b_2}, ..., \bm{b_q}b1,b2,...,bq,以及向量b \bm{b}b,若∃ k = [ k 1 , k 2 , . . . , k p ] T , k ∈ F p \exists \bm{k} = [k_1, k_2 , ..., k_p]^T, \bm{k} \in \bm{F}^p∃k=[k1,k2,...,kp]T,k∈Fp,使得( a 1 , a 2 , . . . , a p ) k = b \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \bm{k} = \bm{b}(a1,a2,...,ap)k=b则称b \bm{b}b可由a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap线性表示。而每个b i \bm{b_i}bi都可以由a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap线性表示,则称b 1 , b 2 , . . . , b q \bm{b_1}, \bm{b_2}, ..., \bm{b_q}b1,b2,...,bq可由a 1 , a 2 , . . . , a p \bm{a_1}, \bm{a_2}, ..., \bm{a_p}a1,a2,...,ap线性表示。矩阵表示为( a 1 , a 2 , . . . , a p ) ( x 1 , x 2 , . . . , x p ) T = b \left( \begin{matrix}\bm{a_1}, \bm{a_2}, ..., \bm{a_p} \end{matrix} \right ) \left( \begin{matrix}x_1, x_2, ..., x_p \end{matrix} \right )^T = \bm{b}(a1,a2,...,ap)(x1,x2,...,xp)T=b当b \bm{b}b可由a i \bm{a_i}ai线性表示时,该非齐次线性方程组有解。同样,向量组之间的线性关系由矩阵表示为A X p × q = B \bm{A}\bm{X}_{p×q} = \bm{B}AXp×q=B当向量组之间线性相关时,该矩阵方程组有解。
线性表示关系具有传递性。考虑三个向量组{ a i } , { b j } , { c k } \{\bm{a_i}\}, \{\bm{b_j}\}, \{\bm{c_k}\}{ai},{bj},{ck},记当A \bm{A}A可由B \bm{B}B组合为A ≤ l i n B \bm{A} \le_{lin} \bm{B}A≤linB则有若b j ≤ l i n a i , c k ≤ l i n b j \bm{b_j} \le_{lin} \bm{a_i}, \bm{c_k} \le_{lin} \bm{b_j}bj≤linai,ck≤linbj,则c k ≤ l i n a i \bm{c_k} \le_{lin} \bm{a_i}ck≤linai,其矩阵方程的表示为A X = B B Y = C \bm{A}\bm{X} = \bm{B} \\ \bm{B}\bm{Y} = \bm{C}AX=BBY=C有解,则A Z = C \bm{A}\bm{Z} = \bm{C}AZ=C自然有解Z = X Y \bm{Z} = \bm{X}\bm{Y}Z=XY 从母序列中挑出一个子序列构成向量组,这个子序列构成的向量组为原来母序列的子组。取{ a i } \{\bm{a_i}\}{ai}的子组{ b j } \{\bm{b_j}\}{bj},若{ b j } \{\bm{b_j}\}{bj}线性无关,且当满足{ a i } \{\bm{a_i}\}{ai}的子组{ c k } \{\bm{c_k}\}{ck},{ b j } \{\bm{b_j}\}{bj}也是{ c k } \{\bm{c_k}\}{ck}的子组时,若对于s < t s < ts<t,其中s , t s, ts,t是两向量组{ b j } \{\bm{b_j}\}{bj},{ c k } \{\bm{c_k}\}{ck}的维度,都有{ c k } \{\bm{c_k}\}{ck}线性相关,则此时称{ b j } \{\bm{b_j}\}{bj}为{ a i } \{\bm{a_i}\}{ai}的最大无关组。母组可由其极大线性无关组线性表示。极大线性无关组具有无关性与表示性,即组向量之间线性无关,并且母序列的任意向量组可由极大线性无关组线性表示。
极大线性无关组的向量是不唯一的,但向量数是唯一的。考虑母序列A = { a i } \bm{A} = \{\bm{a_i}\}A={ai}的极大线性无关组B = { b j } \bm{B} = \{\bm{b_j}\}B={bj}与C = { c k } \bm{C} = \{\bm{c_k}\}C={ck},其维度分别为s , t s, ts,t,有B X = A A Y = C \bm{B}\bm{X} = \bm{A} \\ \bm{A}\bm{Y} = \bm{C}BX=AAY=C有解,于是B Z = C \bm{B}\bm{Z} = \bm{C}BZ=C有解,解为Z s × t \bm{Z}_{s×t}Zs×t,考虑严格的s < t s < ts<t,则Z s × t \bm{Z}_{s×t}Zs×t可以看成不定方程,即方程数小于未知数个数的方程的系数矩阵。而易证不定方程有无数的非零解。考虑矩阵方程Z W = 0 \bm{Z}\bm{W} = \bm{0}ZW=0显然,该方程有非零解。带入上述方程,有B Z W = C W \bm{B}\bm{Z}\bm{W} = \bm{C}\bm{W}BZW=CW可以得到C W = 0 \bm{C}\bm{W} = \bm{0}CW=0有非零解。然而C = { c k } \bm{C} = \{\bm{c_k}\}C={ck}是一个线性无关组,C W = 0 \bm{C}\bm{W} = \bm{0}CW=0不存在非零解,故矛盾,而s > t s > ts>t亦然,证毕。
向量组的极大线性无关组所含向量的个数称为向量组的秩【Rank】。秩是向量组的内在性质,不随极大线性无关组的选择而改变。
三、基与坐标
取域F \bm{F}F上的线性空间V \bm{V}V,如果有正整数N \bm{N}N及V \bm{V}V中的向量组A = { a i } \bm{A} = \{\bm{a_i}\}A={ai},使得A \bm{A}A线性无关,并且∀ a ∈ V \forall \bm{a} \in \bm{V}∀a∈V都可以由{ a i } \{\bm{a_i}\}{ai}线性表示,即a = A n × n k n × 1 \bm{a} = \bm{A}_{n×n}\bm{k}_{n×1}a=An×nkn×1则称V \bm{V}V是n维线性空间。则{ a i } \{\bm{a_i}\}{ai}称为V \bm{V}V的一个基向量。而k ∈ F n \bm{k} \in \bm{F}^nk∈Fn称为a ∈ V \bm{a} \in \bm{V}a∈V沿着该基的坐标向量。 一个空间的不同基向量的个数是相同的,因为基都是该空间的极大线性无关组,即空间的维度是固定的。
基或坐标系实现了抽象线性空间到标准线性空间之间的一一对应,即∀ τ : S 1 → S 2 \forall τ:S_1\rightarrow S_2∀τ:S1→S2,∃ ρ : S 2 → S 1 \exists ρ:S_2\rightarrow S_1∃ρ:S2→S1,使得τ ρ τρτρ是S 1 S_1S1的恒等映射,而ρ τ ρτρτ是S 2 S_2S2的恒等映射。这就认为这两个抽象集合是重构的。
考虑n维空间V \bm{V}V的基{ a i } \{\bm{a_i}\}{ai},与该基下的坐标k \bm{k}k,则抽象空间V \bm{V}V与标准线性空间F n \bm{F}^nFn的映射关系,即v ∈ V \bm{v} \in \bm{V}v∈V可以映射为k \bm{k}k。∀ k ∈ F n \forall \bm{k} \in \bm{F}^n∀k∈Fn,其在V \bm{V}V的映射为v = a k = [ a 1 , . . . , a n ] [ k 1 , . . . , k n ] T \bm{v} = \bm{a}\bm{k} = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^Tv=ak=[a1,...,an][k1,...,kn]T;对应的,若v \bm{v}v与v ′ \bm{v}'v′的映射均为k \bm{k}k,则有v ′ = [ a 1 , . . . , a n ] [ k 1 ′ , . . . , k n ′ ] T \bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^Tv′=[a1,...,an][k1′,...,kn′]T,由于线性无关性,有[ a 1 , . . . , a n ] [ k 1 ′ − k 1 , . . . , k n ′ − k n ] T = 0 [\bm{a}_1, ..., \bm{a}_n][k_1'-k_1, ..., k_n'-k_n]^T = 0[a1,...,an][k1′−k1,...,kn′−kn]T=0,故v ′ = [ a 1 , . . . , a n ] [ k 1 ′ , . . . , k n ′ ] T = [ a 1 , . . . , a n ] [ k 1 , . . . , k n ] T \bm{v}' = [\bm{a}_1, ..., \bm{a}_n][k_1', ..., k_n']^T = [\bm{a}_1, ..., \bm{a}_n][k_1, ..., k_n]^Tv′=[a1,...,an][k1′,...,kn′]T=[a1,...,an][k1,...,kn]T,即v = v ′ \bm{v} = \bm{v}'v=v′。
标准线性空间的基称为标准基,标准基组成的基矩阵称为单位矩阵,单位矩阵的列向量组是标准基向量组。再考虑任意的线性空间的基。所谓基者,就是一个无关向量组。对于n维空间,其秩为n,即线性无关。而对于表示性,即对任意的线性无关向量组A \bm{A}A,A x = b \bm{A}\bm{x} = \bm{b}Ax=b一定有解,这显然成立。而该方程组亦可以看作b \bm{b}b沿着基向量A \bm{A}A展开的问题。
考虑理解无限维空间, 定义F n [ x ] F_n[x]Fn[x]是以x为未知项的小于n次的多项式的函数空间,则F n [ x ] F_n[x]Fn[x]的维度为n,其基为[ 1 , x , . . . , x n − 1 ] [1, x, ..., x^{n-1}][1,x,...,xn−1],其中1 ∈ F n [ x ] 1 \in F_n[x]1∈Fn[x],是一个函数。则任意多项式可以由该基表示。其线性无关性,考虑证明[ 1 , . . . , x n − 1 ] [ a 1 , . . . , a n ] T = 0 [1, ..., x^{n-1}][a_1, ..., a_n]^T = 0[1,...,xn−1][a1,...,an]T=0,则a i = 0 a_i=0ai=0。其中0 ∈ F n [ x ] 0 \in F_n[x]0∈Fn[x]。分别令x = 1 , 2 , . . . , n x = 1, 2, ..., nx=1,2,...,n,对于[ x 0 , . . . , x n − 1 ] [ a 1 , . . . , a n ] T = 0 [x^0, ..., x^{n-1}][a_1, ..., a_n]^T = 0[x0,...,xn−1][a1,...,an]T=0,有( 1 0 1 1 . . . 1 n − 1 2 0 2 1 . . . 2 n − 1 . . . n 0 n 1 . . . n n − 1 ) ( a 1 a 2 . . . a n ) = ( 0 0 . . . 0 ) \left( \begin{matrix}1^0 & 1^1 & ... & 1^{n-1} \\ 2^0 & 2^1 & ... & 2^{n-1} \\... & & & \\n^0 & n^1 & ... & n^{n-1} \end{matrix} \right )\left( \begin{matrix}a_1 \\ a_2 \\...\\a_{n} \end{matrix} \right ) = \left( \begin{matrix} 0 \\ 0 \\...\\ 0 \end{matrix} \right )⎝⎜⎜⎛1020...n01121n1.........1n−12n−1nn−1⎠⎟⎟⎞⎝⎜⎜⎛a1a2...an⎠⎟⎟⎞=⎝⎜⎜⎛00...0⎠⎟⎟⎞考虑范德蒙行列式,则a i = 0 a_i=0ai=0。而考虑F ∞ [ x ] F_\infty[x]F∞[x],其不是有限维的,任意有限个向量都不是其基。考虑n维基与n次项,考虑表示性,有[ x 0 , . . . , x n − 1 ] [ a 1 , . . . , a n ] T = x n [x^0, ..., x^{n-1}][a_1, ..., a_n]^T = x^{n}[x0,...,xn−1][a1,...,an]T=xn,即[ x 0 , . . . , x n − 1 , x n ] [ a 1 , . . . , a n , − 1 ] T = 0 [x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, -1]^T = 0[x0,...,xn−1,xn][a1,...,an,−1]T=0,再考虑无关性,有[ x 0 , . . . , x n − 1 , x n ] [ a 1 , . . . , a n , a n + 1 ] T = 0 [x^0, ..., x^{n-1}, x^n][a_1, ..., a_n, a_{n+1}]^T = 0[x0,...,xn−1,xn][a1,...,an,an+1]T=0,得到解为a n + 1 = − 1 a_{n+1} = -1an+1=−1,这与线性无关组的条件a i = 0 a_i = 0ai=0矛盾,显然不是线性无关组。于是该n维不是一个基,即没有有限维基,即该空间不是一个有限维空间。
四、子空间
考虑线性空间V \bm{V}V,以及V \bm{V}V的非空子集W \bm{W}W,其对加法封闭,即∀ a , b ∈ W , a + b ∈ W \forall a,b \in \bm{W}, a+b \in \bm{W}∀a,b∈W,a+b∈W;以及对数乘法封闭,∀ a ∈ W , ∀ k ∈ R , k a ∈ W \forall a \in \bm{W}, \forall k \in \bm{R}, ka \in \bm{W}∀a∈W,∀k∈R,ka∈W,则称W \bm{W}W是V \bm{V}V的子空间。W \bm{W}W也是线性空间。
考虑线性空间V \bm{V}V,取向量组为{ a p } \{\bm{a}_p\}{ap},取集合s p a n { a p } = { a 1 c 1 + . . . + a p c p ∣ c i ∈ F } span\{\bm{a}_p\} = \{\bm{a}_1c_1 + ... +\bm{a}_pc_p|c_i \in \bm{F}\}span{ap}={a1c1+...+apcp∣ci∈F},则s p a n { a p } span\{\bm{a}_p\}span{ap}是V \bm{V}V的一个子空间,并称为{ a p } \{\bm{a}_p\}{ap}的生成子空间。反而言之,对于V \bm{V}V的子空间W \bm{W}W与{ a p } \{\bm{a}_p\}{ap},有W = s p a n { a p } \bm{W} = span\{\bm{a}_p\}W=span{ap},则{ a p } \{\bm{a}_p\}{ap}是W \bm{W}W的一个生成组。生成组提供了子空间的一种表现方式。
考虑矩阵A ∈ R m × n \bm{A} \in \bm{R}^{m×n}A∈Rm×n,则{ x ∣ A x = 0 , x ∈ F n } \{\bm{x}|\bm{A}\bm{x} = \bm{0}, \bm{x}\in \bm{F}^n\}{x∣Ax=0,x∈Fn}是F n \bm{F}^nFn的子空间,其封闭性易证。即齐次方程组的解集合是F n \bm{F}^nFn的子空间。定义k e r A = { x ∣ A x = 0 , x ∈ F n } ker \bm{A} = \{\bm{x}|\bm{A}\bm{x} = \bm{0},\bm{x}\in \bm{F}^n\}kerA={x∣Ax=0,x∈Fn},称为A \bm{A}A的核,用来代表以A \bm{A}A为系数矩阵的线性方程组的解空间。再考虑{ A x ∣ x ∈ F n } \{\bm{A}\bm{x}|\bm{x}\in \bm{F}^n\}{Ax∣x∈Fn},其是F m \bm{F}^mFm的子空间。定义i m A im \bm{A}imA,称为A \bm{A}A的像,表示A \bm{A}A的列向量组以x \bm{x}x为系数的线性组合,即A \bm{A}A的列向量组的生成子空间。
考虑线性空间V \bm{V}V的子空间W \bm{W}W与U \bm{U}U,则W \bm{W}W与U \bm{U}U的交集也是子空间,W \bm{W}W与U \bm{U}U的和也是子空间。
五、线性映射
V 1 \bm{V_1}V1和V 2 \bm{V_2}V2时R \bm{R}R上的线性空间,对于映射σ : V 1 → V 2 σ:\bm{V_1}\rightarrow\bm{V_2}σ:V1→V2,若有σ ( e 1 + e 2 ) = σ ( e 1 ) + σ ( e 2 ) σ(\bm{e}_1 + \bm{e}_2) = σ(\bm{e}_1) + σ(\bm{e}_2)σ(e1+e2)=σ(e1)+σ(e2)的保加性,与σ ( e k ) = k σ ( e ) σ(\bm{e}k) = kσ(\bm{e})σ(ek)=kσ(e)的保数乘性,则称该映射为V 1 \bm{V_1}V1到V 2 \bm{V_2}V2的线性映射。当V 1 = V 2 = V \bm{V_1} = \bm{V_2} = \bm{V}V1=V2=V时,则称为V \bm{V}V上的线性变换。
若线性映射σ σσ是可逆映射,则称σ σσ为线性同构。即任一元素存在像且像唯一,任一像都有原像且原像唯一,则该两个线性空间的结构完全相同。有限维的线性空间即与同维的标准线性空间同构。
考虑矩阵与标准线性空间之间的线性映射,两者之间的等同性,即取矩阵A ∈ F m × n \bm{A}\in\bm{F}^{m×n}A∈Fm×n,则线性映射可表示为A : F n → F m x ↦ y = A x \begin{aligned} \bm{A}:&\bm{F}^{n}\rightarrow\bm{F}^{m} \\ &\bm{x} \mapsto\bm{y} = \bm{A}\bm{x}\end{aligned}A:Fn→Fmx↦y=Ax反之,记F n \bm{F}^{n}Fn的标准基e 1 , . . . , e n \bm{e}_1, ..., \bm{e}_ne1,...,en,则对于线性映射A \bm{A}A,考虑矩阵A = ( A ( e 1 ) , . . . , A ( e n ) ) \bm{A} = (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))A=(A(e1),...,A(en)),则任取x ∈ F n \bm{x} \in \bm{F}^nx∈Fn,有x = I x = e 1 x 1 + . . . + e n x n \begin{aligned} \bm{x} &= \bm{I}\bm{x} \\ &= \bm{e}_1x_1 + ... + \bm{e}_nx_n \end{aligned}x=Ix=e1x1+...+enxn则x \bm{x}x的映射A ( x ) = A ( e 1 x 1 ) + . . . + A ( e n x n ) = x 1 A ( e 1 ) + . . . + x n A ( e n ) = ( A ( e 1 ) , . . . , A ( e n ) ) x = A x \begin{aligned} \bm{A}(\bm{x}) &= \bm{A}(\bm{e}_1x_1) + ... + \bm{A}(\bm{e}_nx_n) \\ &= x_1\bm{A}(\bm{e}_1) + ... + x_n\bm{A}(\bm{e}_n) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= \bm{A}\bm{x} \end{aligned}A(x)=A(e1x1)+...+A(enxn)=x1A(e1)+...+xnA(en)=(A(e1),...,A(en))x=Ax即任一抽象的线性映射都可由矩阵实现。
再考虑线性映射的矩阵表示,给定线性映射A : V → W , d i m ( V ) = n , d i m ( W ) = m \bm{A}:\bm{V}\rightarrow\bm{W},dim(\bm{V}) = n, dim(\bm{W}) = mA:V→W,dim(V)=n,dim(W)=m取V \bm{V}V的基e 1 , . . . , e n \bm{e}_1, ..., \bm{e}_ne1,...,en,称其为入口基;与W \bm{W}W的基η 1 , . . . , η m \bm{η}_1, ..., \bm{η}_mη1,...,ηm,称为出口基。记第j个入口基向量e j \bm{e}_jej的像A ( e j ) \bm{A}(\bm{e}_j)A(ej)在出口基下的坐标为( a 1 j , . . . , a m j ) T (a_{1j}, ...,a_{mj})^T(a1j,...,amj)T,则A ( e j ) = ( η 1 , . . . , η m ) ( a 1 j , . . . , a m j ) T \bm{A}(\bm{e}_j) = (\bm{η}_1, ..., \bm{η}_m)(a_{1j}, ...,a_{mj})^TA(ej)=(η1,...,ηm)(a1j,...,amj)T共考虑n个原像向量,则A = ( a 11 . . . a 1 n . . . . . . a m 1 . . . a m n ) \bm{A} = \left( \begin{matrix}a_{11} & ... & a_{1n} \\ ...&&...\\a_{m1} &...& a_{mn} \end{matrix} \right )A=⎝⎛a11...am1......a1n...amn⎠⎞则称矩阵A \bm{A}A为映射A \bm{A}A的矩阵表示,有A ( ( e 1 , . . . , e n ) ) = ( η 1 , . . . , η m ) A \bm{A}((\bm{e}_1, ..., \bm{e}_n)) = (\bm{η}_1, ..., \bm{η}_m)\bm{A}A((e1,...,en))=(η1,...,ηm)A对于入口基坐标下的x \bm{x}x,其映射在出口基的坐标为A x \bm{A}\bm{x}Ax,即A ( x ) = A ( ( e 1 , . . . , e n ) x ) = ( A ( e 1 ) , . . . , A ( e n ) ) x = ( η 1 , . . . , η m ) A x = ( η 1 , . . . , η m ) ( A x ) \begin{aligned} \bm{A}(\bm{x}) &= \bm{A}((\bm{e}_1, ..., \bm{e}_n)\bm{x}) \\ &= (\bm{A}(\bm{e}_1), ..., \bm{A}(\bm{e}_n))\bm{x} \\ &= (\bm{η}_1, ..., \bm{η}_m)\bm{A}\bm{x} \\&= (\bm{η}_1, ..., \bm{η}_m)(\bm{A}\bm{x}) \end{aligned}A(x)=A((e1,...,en)x)=(A(e1),...,A(en))x=(η1,...,ηm)Ax=(η1,...,ηm)(Ax) 考虑矩阵分析表示几何空间的旋转,其角度为θ θθ,其出口基与入口基均是3维空间,将轴的正向定义为e 3 \bm{e}_3e3,其他为e 1 , e 2 \bm{e}_1, \bm{e}_2e1,e2,则旋转映射B = ( e 1 , e 2 , e 3 ) ( c o s ( θ ) − s i n ( θ ) 0 s i n ( θ ) c o s ( θ ) 0 0 0 1 ) \bm{B} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}cos(θ) & -sin(θ) & 0 \\ sin(θ) & cos(θ) & 0 \\0 &0& 1 \end{matrix} \right )B=(e1,e2,e3)⎝⎛cos(θ)sin(θ)0−sin(θ)cos(θ)0001⎠⎞ 考虑矩阵论表示几何空间的反射,将镜面的正法向定义为e 3 \bm{e}_3e3,其他为e 1 , e 2 \bm{e}_1, \bm{e}_2e1,e2,则镜面映射C = ( e 1 , e 2 , e 3 ) ( 1 0 0 0 1 0 0 0 − 1 ) \bm{C} = (\bm{e}_1, \bm{e}_2, \bm{e}_3)\left( \begin{matrix}1 & 0 & 0 \\ 0 & 1 & 0 \\0 &0& -1 \end{matrix} \right )C=(e1,e2,e3)⎝⎛10001000−1⎠⎞
六、矩阵等价与相似
对于A , B ∈ F m × n \bm{A}, \bm{B}\in\bm{F}^{m×n}A,B∈Fm×n,存在可逆矩阵P ∈ F n × n \bm{P}\in\bm{F}^{n×n}P∈Fn×n与Q ∈ F m × m \bm{Q}\in\bm{F}^{m×m}Q∈Fm×m,使得A P = Q B \bm{A}\bm{P}=\bm{Q}\bm{B}AP=QB则称A \bm{A}A与B \bm{B}B等价。在线性代数中,等价描述为T A S = B \bm{T}\bm{A}\bm{S}=\bm{B}TAS=B,以刻画初等行列变换,即A \bm{A}A可由初等变换得到B \bm{B}B。而从矩阵分析考虑,有A ( P 1 , . . . , P n ) = ( Q 1 , . . . , Q m ) B \bm{A}(\bm{P}_1, ...,\bm{P}_n) = (\bm{Q}_1, ...,\bm{Q}_m)\bm{B}A(P1,...,Pn)=(Q1,...,Qm)B将矩阵A \bm{A}A视为线性映射A : x ↦ y = A x \bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x}A:x↦y=Ax,满秩矩阵P \bm{P}P的列向量为n维空间的一般基,满秩矩阵Q \bm{Q}Q的列向量为m维空间的一般基,则有线性映射A \bm{A}A在入口基P \bm{P}P与出口基Q \bm{Q}Q下的矩阵表示是B \bm{B}B。
考虑选择基以最简表示,即A P = Q ( I r 0 0 0 ) \bm{A}\bm{P} = \bm{Q}\left( \begin{matrix}\bm{I}_r & \bm{0} \\ \bm{0} & \bm{0} \end{matrix} \right )AP=Q(Ir000)有A P 1 = Q 1 . . . A P r = Q r A P r + 1 = 0 . . . A P n = 0 \bm{A}\bm{P}_1 = \bm{Q_1} \\ ... \\ \bm{A}\bm{P}_r = \bm{Q_r} \\ \bm{A}\bm{P}_{r+1} = \bm{0}\\... \\ \bm{A}\bm{P}_n = \bm{0}AP1=Q1...APr=QrAPr+1=0...APn=0在标准基I n \bm{I}_nIn与I m \bm{I}_mIm下,A : x ↦ y = A x \bm{A}:\bm{x} \mapsto \bm{y} = \bm{Ax}A:x↦y=Ax;但在基P \bm{P}P与Q \bm{Q}Q下,B : x ′ ↦ y ′ = B x ′ \bm{B}:\bm{x}' \mapsto \bm{y}' = \bm{Bx}'B:x′↦y′=Bx′,其中B \bm{B}B是最简表示,则有y 1 ′ = x 1 ′ . . . y r ′ = x r ′ y r + 1 ′ = 0 . . . y m ′ = 0 \bm{y}'_1 =\bm{x}'_1\\ ...\\ \bm{y}'_r =\bm{x}'_r\\ \bm{y}'_{r+1} = \bm{0}\\ ...\\ \bm{y}'_{m} = \bm{0}y1′=x1′...yr′=xr′yr+1′=0...ym′=0使得分量完全解耦。
对于A , B ∈ F n × n \bm{A}, \bm{B}\in\bm{F}^{n×n}A,B∈Fn×n,若存在n阶可逆矩阵P \bm{P}P使得A P = P B \bm{AP} = \bm{PB}AP=PB则称A \bm{A}A与B \bm{B}B相似。将矩阵A \bm{A}A视为线性变换A : x ↦ y = A x \bm{A}:\bm{x}\mapsto\bm{y} = \bm{A}\bm{x}A:x↦y=Ax,满秩矩阵P \bm{P}P的列向量为n维空间的一般基,则有线性变换A \bm{A}A在入口基与出口基P \bm{P}P下的矩阵表示是B \bm{B}B。
首先定义方阵的不变子空间,若A ∈ F n × n \bm{A}\in\bm{F}^{n×n}A∈Fn×n,W ∈ F n \bm{W}\in\bm{F}^nW∈Fn是F n \bm{F}^nFn的子空间,若A ( W ) ⊆ W \bm{A}(\bm{W}) \subseteq \bm{W}A(W)⊆W,则称W \bm{W}W是A \bm{A}A的不变子空间。
考虑不变子空间与相似最简化的等价性,对于A P = P B \bm{AP} = \bm{PB}AP=PB,令P = ( P 1 , P 2 ) \bm{P} = (\bm{P}_1, \bm{P}_2)P=(P1,P2),相应的,B = ( B 11 B 12 B 21 B 22 ) \bm{B} = \left( \begin{matrix}\bm{B}_{11} & \bm{B}_{12} \\ \bm{B}_{21} & \bm{B}_{22} \end{matrix} \right )B=(B11B21B12B22)有B 21 = 0 \bm{B}_{21} = \bm{0}B21=0,则i m P 1 im\bm{P}_1imP1是A \bm{A}A的不变子空间,而B 12 = 0 \bm{B}_{12} = \bm{0}B12=0,则i m P 2 im\bm{P}_2imP2是A \bm{A}A的不变子空间。证明如下A P 1 = ( P 1 , P 2 ) ( B 11 , B 21 ) T A P 2 = ( P 1 , P 2 ) ( B 12 , B 22 ) T \bm{AP}_1 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{11}, \bm{B}_{21})^T \\ \bm{AP}_2 = (\bm{P}_1, \bm{P}_2)(\bm{B}_{12}, \bm{B}_{22})^TAP1=(P1,P2)(B11,B21)TAP2=(P1,P2)(B12,B22)T要证,i m P 1 im\bm{P}_1imP1是A \bm{A}A的不变子空间,则A i m P 1 ⊆ i m P 1 \bm{A}im\bm{P}_1 \subseteq im\bm{P}_1AimP1⊆imP1,其中i m P 1 im \bm{P}_1imP1是P 1 \bm{P}_1P1列向量的线性组合。当B 21 = 0 \bm{B}_{21} = \bm{0}B21=0,有A P 1 = ( p 1 , . . . , p n ) B = P 1 B , A p j ∈ i m P 1 , j = 1 , . . . , n \bm{AP}_1 = (\bm{p}_1, ... , \bm{p}_n)\bm{B}= \bm{P}_1\bm{B}, \bm{Ap}_j \in im \bm{P}_1, j = 1, ..., nAP1=(p1,...,pn)B=P1B,Apj∈imP1,j=1,...,n显然成立。B 12 = 0 \bm{B}_{12} = \bm{0}B12=0同理。
反之,若有不变子空间,就一定有可以三角化的矩阵。考虑A \bm{A}A的不变子空间W = s p a n { v 1 , . . . , v t } \bm{W} = span\{\bm{v}_1, ... , \bm{v}_t\}W=span{v1,...,vt},则有可逆矩阵P \bm{P}P使得A \bm{A}A三角化为B \bm{B}B,即P 1 = ( v 1 , . . . , v t ) , P 2 = ( u 1 , . . . , u n − t ) \bm{P}_1 = (\bm{v}_1, ... , \bm{v}_t), \bm{P}_2 = (\bm{u}_1, ... , \bm{u}_{n - t})P1=(v1,...,vt),P2=(u1,...,un−t)记P = ( P 1 , P 2 ) \bm{P} = (\bm{P}_1, \bm{P}_2)P=(P1,P2),则A P \bm{A}\bm{P}AP就是一个三角矩阵。其中P 2 \bm{P}_2P2是一个扩充矩阵,其使得P \bm{P}P是一个可逆方阵。
考虑相似对角化的条件。取A P = P Λ \bm{AP} = \bm{PΛ}AP=PΛ,则P \bm{P}P的每一维度向量张成的空间i m p j im\bm{p}_jimpj都是A \bm{A}A的不变子空间。由此,定义特征值与特征向量,考虑A p = p λ \bm{Ap} = \bm{p}λAp=pλ,则称λ λλ是矩阵的一个特征值,而p \bm{p}p是其相应的一个特征向量。其意义为一维不变子空间的映射仍在该子空间,即一维向量的线性组合。那么,P \bm{P}P的每一维度向量张成的空间i m p j im\bm{p}_jimpj都是A \bm{A}A的不变子空间,等效为A \bm{A}A可以相似,等价于存在有n个线性无关的向量。