Professional Documents
Culture Documents
CH6線性轉換與特徵值問題
CH6線性轉換與特徵值問題
最後更新日期:2009 年 2 月 18 日
本章介紹線性轉換(linear transformation)
,將線性系統看成一個函數,探討
在不同向量空間裡之向量的對應情形。定義函數時,定義域與值域是重要的
元素,在線性轉換中,對應前者的是轉換矩陣的核(kernel)
,而對應後者的
是轉換矩陣的值域(range)
。特徵值問題(eigenvalue and eigenvector)是線性
轉換的一個重要的應用,而對稱矩陣的對角化(diagonalization)則是該問題
的直接應用。對稱矩陣對角化讓矩陣的運算擴展到指數、三角函數等超越函
數。本章的內容安排如下:
6.1 線性轉換
6.2 核心與值域
6.3 轉換矩陣
6.4 特徵值與特徵向量
6.5 矩陣對角化
6.1 線性轉換
對一個線性系統而言,線性轉換(linear transformation)是以函數的觀點來看線性系統。
考慮以下線性系統
⎡x⎤
⎡2 3 1 ⎤ ⎡7 ⎤
Ax = b 其中 A=⎢ ⎥ , x = ⎢ y ⎥⎥ , b = ⎢ ⎥
⎢
⎣ 4 1 −3⎦ ⎢⎣ z ⎥⎦ ⎣9 ⎦
線性轉換如同下圖的黑盒子,我們需決定輸進去的 ( x, y, z ) ∈ R 3 ,使得經過黑盒子轉換
後,產出 R 2 的 ( 7,9 ) :
⎡ x⎤
⎡7 ⎤
x = ⎢⎢ y ⎥⎥ ∈ R 3 b = ⎢ ⎥ ∈ R2
⎣9 ⎦
⎣⎢ z ⎦⎥
L
3
R
( 7,9 )
( x, y , z ) R2
以數學符號來表示則為
⎡7 ⎤
L : R3 → R 2 或 L (x) = ⎢ ⎥
⎣9 ⎦
當然,轉換或函數 L 必須滿足某些條件才可以稱為線性轉換或線性函數。
定義 (線性轉換)
令 V 、 W 為兩向量空間, L 為以 V 為定義域、 W 為值域的函數,若任意 u, v ∈ V ,
c ∈ R 滿足以下兩性質
(a) L (u + v ) = L (u ) + L ( v ) (6-1)
(b) L ( cu ) = cL ( u ) (6-2)
,記為 L : V → W 。
則 L 稱為 V 對應至 W 的線性轉換(linear transformation) █
例題 6-1 (驗證線性轉換)
令 L : M m×n → M n×m ,定義如下
L ( A ) = AT
試驗證 L 是否為線性轉換。
【解答】
令 A, B ∈ M m×n , c ∈ R ,則
( a ) L ( A + B ) = ( A + B )T = A T + B T = L ( A ) + L ( B )
( b ) L ( cA ) = ( cA )T = cA T = cL ( A )
例題 6-2 (驗證線性轉換)
令 L : M n×n → R ,定義如下
L(A) = A
試驗證 L 是否為線性轉換。
【解答】
令 A, B ∈ M n×n , c ∈ R ,則
(a) L (A + B) = A + B ≠ A + B = L ( A) + L (B)
故 L 不是一個線性轉換。 █
例題 6-3 (驗證線性轉換)
令 L : R m → R n ,定義如下
L ( x ) = Ax
【解答】
令 x, y ∈ R m , c ∈ R ,則
( a ) L ( x + y ) = A ( x + y ) = Ax + Ay = L ( x ) + L ( y )
( b ) L ( cx ) = A ( cx ) = cAx = cL ( x )
故 L 是一個線性轉換。 █
定理 6-1 (線性轉換之性質)
若 L : V → W 為一線性轉換,則
( a ) L ( c1v1 + c2 v 2 + + ck v k ) = c1L ( v1 ) + c2 L ( v 2 ) + + ck L ( v k ) (6-3)
( b ) L ( 0V ) = L ( 0W )
(c ) L (u − v ) = L (u ) − L ( v )
其中, v1 , v 2 ,…, v k , u, v ∈V , c1 , c2 ,…, ck ∈ R , 0V 、 0W 分別為 V 、 W 的加法單位元
素,而 −v 為 v 之加法反元素。
【證明】
自行練習吧。
加法反元素的定義: v + ( − v ) = 0 。 █
定理 6-2 (以基底轉換表示)
若 L : V → W 為線性轉換, S = { v1 , v 2 ,… , v n } 為 V 的基底,且 u ∈ V ,則 L ( u ) 可由
{L ( v1 ) , L ( v 2 ) ,…, L ( v n )} (以線性組合)來表示。
【證明】
將 u 表示成 u = c1 v1 + c2 v 2 + + cn v n ,則經由(6-3)自然可將 L ( u ) 表示為
L ( u ) = c1 L ( v1 ) + c2 L ( v 2 ) + + cn L ( v n ) 。 █
L ( u ) = A LS [u ]S
其中
A S = [ v1 v 2 vn ]
A LS = ⎡⎣ L ( v1 ) L ( v 2 ) L ( v n ) ⎤⎦
例題 6-4 (利用基底的線性轉換)
令 L : R 2 → R 3 為線性轉換, S = { v1 , v 2 } 是 R 2 的基底,其中
v1 = (1, 2 ) 、 v 2 = ( 2,1) 而且 L ( v1 ) = ( −1,3, 4 ) , L ( v 2 ) = (1,3,5 )
試求 L ( u ) , u = ( 5, 4 ) 。
【解答】
先求 [u ]S ,其為以下線性系統的解
⎡1 2 5 ⎤ ⎡1 0 1 ⎤
[AS u] = ⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ ⎥
⎣2 1 4⎦ ⎣0 1 2 ⎦
⎡1 ⎤
⇒ [u ]S = ⎢ ⎥
⎣ 2⎦
⎡ −1 1⎤ ⎡1⎤
⎢ ⎥ ⎡1 ⎤ ⎢ ⎥
L ( u ) = A LS [u ]S = ⎢ 3 3⎥ ⎢ ⎥ = ⎢ 9 ⎥
⎢⎣ 4 5⎥⎦ ⎣ ⎦ ⎢⎣14 ⎥⎦
2
例題 6-5 (利用基底的線性轉換)
令 L : R 2 → R 2 為線性轉換,且已知 L (1,1) = (1, 2 ) 、 L (1, −1) = ( 3, 2 ) ,試求
( a ) L ( 3, 4 ) ;
( b ) L ( s, t ) 。
【解答】
⎡1 1 ⎤ ⎡1 3 ⎤
令 S = {(1,1) , (1, −1)} , A S = ⎢ ⎥ , A LS = ⎢ ⎥。
⎣1 −1⎦ ⎣2 2⎦
( a ) ⎡⎣( 3, 4 )⎤⎦ S 為以下線性系統的解
⎡1 1 3 ⎤ ⎡1 0 72 ⎤
⎢1 −1 4 ⎥ ⎯⎯⎯⎯基本列運算
→ ⎢ 1⎥
⎣ ⎦ ⎣0 1 − 2 ⎦
⎡ 7 ⎤
⇒ ⎡⎣( 3, 4 ) ⎤⎦ = ⎢ 21 ⎥
⎣− 2 ⎦
S
⎡1 3 ⎤ ⎡ 72 ⎤ ⎡ 2 ⎤
L ( 3, 4 ) = A LS ⎡⎣( 3, 4 ) ⎤⎦ = ⎢ ⎥⎢ 1⎥ = ⎢ ⎥
⎣2 2⎦ ⎣ − 2 ⎦ ⎣6⎦
S
⎡1 1 s ⎤ ⎡1 0 s2+t ⎤
⎢1 −1 t ⎥ ⎯⎯⎯⎯基本列運算
→ ⎢ s −t ⎥
⎣ ⎦ ⎣0 1 2 ⎦
⎡ s +t ⎤
⇒ ⎡⎣( s, t ) ⎤⎦ = ⎢ s2−t ⎥
S
⎣ 2 ⎦
⎡1 3 ⎤ ⎡ s 2+t ⎤ ⎡ 2s − t ⎤
L ( s, t ) = A LS ⎣⎡( s, t ) ⎦⎤ = ⎢ ⎥ ⎢ s −t ⎥ = ⎢ ⎥
⎣2 2⎦ ⎣ 2 ⎦ ⎣ 2s ⎦
S
就是 R n 的基底了。這也就是我們可以將座標變換視為一個運算的道理。 █
6.2 核心與值域
(對向量空間應該是維度才恰當)
。這牽涉到函數的映射是否一對一(one-to-one)與映
成(onto)的觀念
定義 (一對一)
令 L : V → W 為線性轉換,對任意元素 u, v ∈ V ,若
u≠v ⇒ L (u ) ≠ L ( v ) 或 L (u ) = L ( v ) ⇒ u = v
則稱 L 為一對一(one-to-0ne)
。 █
定義 (核心)
令 L : V → W 為線性轉換,則 V 所有映射到 0W 之元素所成的集合稱為 L 的核心
(kernel)
,標記為 ker L ,
{
ker L = v L ( v ) = 0W , v ∈V } █
定義 (值域、映成)
令 L : V → W 為線性轉換,則所有映射的元素 L ( v ) , v ∈V 所成的集合稱為 L 的值域
(range)
,標記為 range L ,
range L = { L ( v ) v ∈ V }
定理 6-3 (核心、值域與一對一之性質)
令 L : V → W 為線性轉換,則
( a ) ker L 為 V 之次空間。
圖 6-1
圖 6-2
函數(inverse function)的意思,因此,正式的說法為,一對一且映成的函數才存
在其反函數。 █
書的抽象題材,介紹完值域、核心的定義後,當然還是要透過將它們與已經學過的
東西結合。若 L : R m → R n , L ( x ) = Ax ,則
( a ) range L = A 之行空間
( b ) ker L = A 之零空間
既然我們將 range L 、 ker L 比擬為矩陣的行空間、零空間,則線性轉換 L 有零度、
秩的概念也是理所當然的了。
( c ) dim ( range L ) 稱為 L 之秩(rank of L ),即 dim ( range L ) = rank A ;
( d ) dim ( ker L ) 稱為 L 之零度(nullity of L ),即 dim ( ker L ) = nullity A 。
將以上 ( a ) 至 ( d ) 放在心裡,並結合定理 6-3 的各性質,我們可以用簡單求解本章
的題目。 █
例題 6-6 (值域、核心)
令 L : R 4 → R 3 為線性轉換,其中
⎛⎡x⎤⎞
⎜⎢ ⎥⎟ ⎡x + y + z⎤
L ⎜ ⎢ ⎥ ⎟ = ⎢⎢ y + z + w⎥⎥
y
⎜⎢ z⎥⎟
⎜⎜ ⎢ ⎥ ⎟⎟ ⎢⎣ x − z ⎥⎦
⎝ ⎣ w⎦ ⎠
試求 ( a ) range L ; ( b ) ker L ; ( c ) L 是否一對一 ; ( d ) L 是否映成 。
【解答】
首先,改寫函數
⎛⎡x⎤⎞ ⎡x⎤
⎜ ⎢ ⎥ ⎟ ⎡ x + y + z ⎤ ⎡1 1 1 0 ⎤⎢ ⎥
L ⎜ ⎢ ⎥ ⎟ = ⎢⎢ y + z + w⎥⎥ = ⎢⎢0 1 1 1 ⎥⎥ ⎢ ⎥
y y
⎜⎢ z ⎥⎟ ⎢z⎥
⎜⎜ ⎢ ⎥ ⎟⎟ ⎢⎣ x − z ⎥⎦ ⎢⎣1 0 0 −1⎥⎦ ⎢ ⎥
⎝ ⎣ w⎦ ⎠ ⎣ w⎦
⎡1 1 1 0 ⎤ ⎡1 1 1 0 ⎤
A = ⎢⎢0 1 1 1 ⎥⎥ ⎯⎯⎯⎯ 基本列運算
→ ⎢0 1 1 1⎥
⎢ ⎥
⎢⎣1 0 0 −1⎥⎦ ⎢⎣ 0 0 0 0 ⎥⎦
( a ) range L ( A 的行空間)
⎡ x ⎤ ⎡ −1⎤ ⎡ −1⎤
⎢ y⎥ ⎢ 1 ⎥ ⎢ ⎥
⎢ ⎥ = ⎢ ⎥ s + ⎢ 0 ⎥ t , s, t ∈ R
⎢z⎥ ⎢ 0 ⎥ ⎢1⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ w⎦ ⎣ −1⎦ ⎣ −1⎦
⇒ ker L = span {( −1,1,0, −1) , ( −1,0,1, −1)}
例題 6-7 (值域、核心)
令 L : R 4 → R 3 為線性轉換,其中
L ( x, y, z , w ) = ( x + y, z + w, x + z )
試求: ( a ) range L 之基底; ( b ) ker L 之基底; ( c ) L 是否一對一 ; ( d ) L 是否映成 。
【解答】
首先,改寫函數
⎡x⎤
⎡1 1 0 0 ⎤ ⎢ ⎥
L ( x, y, z , w ) = ( x + y, z + w, x + z ) = ⎢⎢ 0 0 1 1 ⎥⎥ ⎢ ⎥
y
⎢z⎥
⎢⎣1 0 1 0 ⎥⎦ ⎢ ⎥
⎣ w⎦
⎡1 1 0 0 ⎤ ⎡1 1 0 0 ⎤
A = ⎢0 0 1 1 ⎥ ⎯⎯⎯⎯→ ⎢⎢ 0 −1 1 0 ⎥⎥
⎢ ⎥ 基本列運算
⎢⎣1 0 1 0 ⎥⎦ ⎢⎣ 0 1 0 1 ⎥⎦
( a ) range L ( A 的行空間)
( b ) ker L ( A 的零空間)
6.3 轉換矩陣
本節整合線性轉換與上一章介紹的座標變換。首先,請牢記以下基本觀念:
座標變換,兩個基底(座標系統)間的座標變換,只涉及一個向量空間;
線性轉換,兩個向量空間之間的座標變換,可能涉及不同基底。
另外,我們會與一堆數學符號周旋,這是沒有辦法的事;請先參考圖 6-3。
L :V → W
V W
S = { v1 , v 2 ,…, v m } T = {w1 , w 2 ,…, w n }
u w = L (u )
L ( u ) = A LS [u ]S
u = A S [ u ]S w = AT [ w ]T
⎡⎣ L ( u ) ⎤⎦ = [ A LS ]T [u ]S
T
圖 6-3
首先,我們將符號歸成五類,向量空間、向量、基底、座標、轉換矩陣:
其中,轉換矩陣要特別注意,依據不同內容間的轉換,又分成好幾類:
向量 ← 座標: u = A S [u ]S 、 L ( u ) = AT ⎡⎣ L ( u ) ⎤⎦ 、 L ( u ) = A LS [u ]S ;
T
座標 ← 座標: ⎡⎣ L ( u ) ⎤⎦ = [ A LS ]T [u ]S 。
T
請注意,轉換矩陣並不見得都存在反矩陣! A S 、 AT 可以有反矩陣,但 A LS 、 [ A LS ]T 就
不一定有,為什麼?動點腦筋想想吧。最後,要熟記這些轉換矩陣如何以及由哪些向量
(座標)所組成:
A S = [ v1 v2 vm ] ;
AT = [ w1 w2 wn ] ;
A LS = ⎡⎣ L ( v1 ) L ( v 2 ) L ( v m ) ⎤⎦ ;
好了,我們已經介紹完座標變換與線性轉換的符號與基本關係式。剩下來的就是眼睛放
亮一點,發揮創意由這些基本關係式組成我們要的東西。
A LS 則表示轉換的結果是一個向量。
好了,我們練習一下沒有出現的符號: [ A S ]T 。看出來了嗎?這是一個將 S 座標轉
換成 T 座標的座標變換矩陣,關係式寫出來應如 [u ]T = [ A S ]T [u ]S 。 █
定義 (表示 L 之轉換矩陣)
令 L : V → W 為線性轉換, S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w n } 分別為 V 、 W 之
⎡⎣ L ( u ) ⎤⎦ = [ A LS ]T [u ]S
T
( A S 、 AT 、 A LS )組合而來。以下是推導過程:
⎡⎣ L ( u ) ⎤⎦ = AT−1 L ( u ) = AT−1A LS [u ]S
T
⇒ [ A LS ]T = AT−1A LS
,而 AT−1 則進一步將向量
可以這樣想, A LS 轉換後的結果是向量(把 A LS 看成向量)
( A LS )轉換成 T 之座標: AT−1A LS 。相同道理,若 S 、 T 為在同一個向量空間上
的基底,則 [ A S ]T 的推導如下
上一章,我們將這個座標變換矩陣 [ A S ]T 標記為 PT ← S 。 █
題外話(計算課題:不要直接找 A −1 ) 在座標變換或線性轉換的計算,我們常常有
面臨反矩陣的場合,不要真的直接去找反矩陣,那會煩死人。以下是建議作法:
(1) 已知 u = A S [u ]S 、 u 、 A S ,求 [u ]S = A −S1u 。
作法為處理以下增廣矩陣
[AS u ] ⎯⎯⎯⎯
基本列運算
→ ⎡⎣ A −S1A S A −S1u ⎤⎦ = ⎡⎣I A −S1u ⎤⎦
以基本列運算將左方轉換為單位矩陣,則右方即為所求之 [u ]S 。
(2) 已知 AT 、 A LS ,求 [ A LS ]T = AT−1A LS 。
處理以下增廣矩陣
有沒有捉到重點?將需要求反矩陣的矩陣(如 A S 、 AT )擺在增廣矩陣的左方,
其它部分擺在右方,然後以基本列運算將左方轉換成單位矩陣即可。 █
例題 6-8 (避開直接找反矩陣)
令 L : V → W 為線性轉換, S = { v1 , v 2 , v 3 } 、 T = {w1 , w 2 } 分別為 V 、 W 基底,其中
v1 = (1,1,0 ) , v 2 = ( 0,1,1) , v 3 = ( 0,0,1) ,
w1 = (1, 2 ) , w 2 = (1,3)
而且已知
L ( v1 ) = ( 2,3) , L ( v 2 ) = ( 2,1) , L ( v 3 ) = (1,3)
試求 S 座標與 T 座標間的轉換矩陣 [ A LS ]T 。
【解答】
我們知道 [ A LS ]T = AT−1A LS 。
由題目資訊,我們有
⎡ 1 1⎤ ⎡ 2 2 1⎤
AT = [ w1 w1 ] = ⎢ ⎥, A LS = ⎡⎣ L ( v1 ) L ( v1 ) L ( v1 ) ⎤⎦ = ⎢ ⎥
⎣ 2 3⎦ ⎣ 3 1 3⎦
處理以下增廣矩陣
⎡ 1 1 2 2 1⎤ ⎡1 0 3 4 0 ⎤
⎢ 2 3 3 1 3⎥ ⎯⎯⎯⎯→ ⎢ 0 1 −1 −3 1 ⎥
基本列運算
⎣ ⎦ ⎣ ⎦
⎡ 3 4 0 ⎤
⇒ [ A LS ]T = ⎢ ⎥
⎣ −1 −3 1 ⎦
還記得反矩陣的數值解過程嗎?是不是與這裡處理的增廣矩陣有所雷同。所以呢,
事實上,我們是有求反矩陣,間接的啦。 █
向量空間內的線性轉換
本小節討論線性轉換 L : V → V (定義域與對應域的空間相同)的轉換矩陣。這時,
基底 S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w m } 在相同的向量空間,因此有座標變換的可
能性。我們將討論相同基底座標間的線性轉換矩陣, [ A LS ]S 與 [ A LT ]T ,並建立這兩個
定理 6-4 (線性轉換矩陣之座標變換)
令 L : V → V 為線性轉換, S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w m } 為 V 之基底,若
轉換矩陣 A LS 已知如下
A LS = ⎡⎣ L ( v1 ) L ( v 2 ) L ( v m ) ⎤⎦
則對任意 u ∈V ,
( a ) [ A LS ]S = A −S1A LS
( b ) [ A LT ]T = [ AT ]−S1 [ A LS ]S [ AT ]S
其中,
A S = [ v1 v2 v m ] , A T = [ w1 w2 w n ], [ AT ]S = A −S1AT
【證明】
(a)
由定義 L ( u ) = A LS [u ]S 、 L ( u ) = A S ⎡⎣ L ( u ) ⎤⎦ ,故
S
L ( u ) = A LS [u ]S = A S ⎡⎣ L ( u ) ⎤⎦ ⇒ ⎡⎣ L ( u ) ⎤⎦ = A −S1A LS [u ]S (6-4)
S S
可得到
[ A LS ]S = A −S1A LS (6-5)
(b)
由定義 u = A S [u ]S = AT [u ]T 、 L ( u ) = A S ⎡⎣ L ( u ) ⎤⎦ = AT ⎡⎣ L ( u ) ⎤⎦ ,故
S T
[u ]S = A −S1AT [u ]T
⎡⎣ L ( u ) ⎤⎦ = A −S1AT ⎡⎣ L ( u ) ⎤⎦
S T
將這兩式代入(6-4),可得
(
A −S1AT ⎡⎣ L ( u ) ⎤⎦ = A −S1A LS A −S1AT [u ]T
T
)
( ) (A )( A ) [u ] = [ A ] [ A ] [ A ] [u ]
−1
⇒ ⎡⎣ L ( u ) ⎤⎦ = A −S1AT −1 −1 −1
T S A LS S AT T T S LS S T S T
也就是
再利用(6-6)就可以了。 █
例題 6-9 (驗證轉換矩陣)
令 L : R 2 → R 2 為線性轉換,
⎛ ⎡x⎤ ⎞ ⎡ x + y ⎤
L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥;
⎝ ⎣ y⎦ ⎠ ⎣x − 2 y⎦
又令
⎧⎪ ⎡1⎤ ⎡ 2 ⎤ ⎫⎪ ⎧⎪ ⎡ 1 ⎤ ⎡ 1 ⎤ ⎫⎪
S = ⎨⎢ ⎥ , ⎢ ⎥ ⎬ , T = ⎨⎢ ⎥ , ⎢ ⎥ ⎬
⎩⎪ ⎣1⎦ ⎣ −1⎦ ⎭⎪ ⎪⎩ ⎣ −1⎦ ⎣ 2⎦ ⎭⎪
為 R 2 的基底。則
(1)基本轉換矩陣如下
⎡1 2 ⎤ ⎡ 1 1⎤ ⎡ 2 1⎤ ⎡0 3 ⎤
AS = ⎢ ⎥ , AT = ⎢ ⎥, A LS = ⎢ ⎥ A LT = ⎢ ⎥
⎣1 −1⎦ ⎣ −1 2 ⎦ ⎣ −1 4 ⎦ ⎣ 3 −3⎦
其中
⎛ ⎡1⎤ ⎞ ⎡ 2 ⎤ ⎛ ⎡ 2 ⎤ ⎞ ⎡1 ⎤ ⎛ ⎡ 1 ⎤ ⎞ ⎡ 0⎤ ⎛ ⎡1 ⎤ ⎞ ⎡ 3 ⎤
L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥ , L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥ , L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥ , L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥
⎝ ⎣1⎦ ⎠ ⎣ −1⎦ ⎝ ⎣ −1⎦ ⎠ ⎣ 4⎦ ⎝ ⎣ −1⎦ ⎠ ⎣ 3⎦ ⎝ ⎣ 2⎦ ⎠ ⎣ −3⎦
⎡1 2 2 1 ⎤ ⎡1 0 0 3 ⎤
⎢1 −1 −1 4 ⎥ ⎯⎯⎯⎯→ ⎢ 0 1 1 −1⎥
基本列運算
⎣ ⎦ ⎣ ⎦
⎡0 3 ⎤
⇒ [ A LS ]S = ⎢ ⎥
⎣1 −1⎦
⎣ ⎦ ⎣ ⎦
⎡ −1 3⎤
⇒ [ A LT ]T = ⎢ ⎥
⎣ 1 0⎦
⎡1 2 1 1 ⎤ ⎡1 0 − 13 5 ⎤
⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ 3
⎥
⎣1 −1 −1 2 ⎦ ⎣0 1 3
2 − 13 ⎦
⎡ − 13 5 ⎤
⇒ [ A T ]S = ⎢ 2
3
⎥
− 13 ⎦
⎣ 3
(5)求 [ A LT ]T = [ AT ]−S1 [ A LS ]S [ AT ]S
⎡ 0 3 ⎤ ⎡ − 13 5 ⎤
⎡ 2 −1⎤
[ LS ]S [ T ]S ⎢1 −1⎥ ⎢ 2
A A = 3
⎥
− 13 ⎦
=⎢ ⎥
⎣ ⎦⎣ 3 ⎣ −1 2 ⎦
處理以下增廣矩陣
⎡ − 13 5 −1⎤
2 ⎡1 0 −1 3⎤
⎥ ⎯⎯⎯⎯→ ⎢
3 基本列運算
⎢ 2 ⎥
⎣ 3 − 13
−1 2 ⎦ ⎣0 1 1 0 ⎦
⎡ −1 3⎤
⇒ [ A LT ]T = ⎢ ⎥
⎣ 1 0⎦
(3)與(5)求到的 [ A LT ]T 相同。 █
6.4 特徵值與特徵向量
本節介紹同向量空間的一個非常特殊的線性轉換: L : V → V ,
L ( u ) = λu (6-7)
其中, u ∈V , λ ∈ R 。線性轉換的結果沒有改變向量的方向,只是將它的大小作比例 λ 之
改變。若持續作相同的線性轉換,如
Ln ( u ) = λ n u
則向量的大小會趨近於 0 或 ∞ :
⎧0 若 λ <1
⎪
lim L ( u ) = ⎨ u
n
若 λ =1
n →∞
⎪∞ 若 λ >1
⎩
上面(會使向量大小並為無限大的)性質應用在許多領域,例如,工程建物的共振。
滿足(6-7)。沒有錯,就是與 V 的維度有關。還有更有趣的,這些向量都伴隨著特定的 λ
值。我們稱這些特殊向量為特徵向量(eigenvector,characteristic vector)
,而這些伴隨
著的 λ 值為特徵值(eigenvalue,characteristic value)
。
根據上一節的結果,若 V = R n ,則存在一表示 L 之轉換矩陣 A ∈ M n×n ,使得(6-7)
變成如下的線性系統:
L ( x ) = Ax = λ x (6-8)
例題 6-10 (驗證特徵向量、特徵值)
令
⎡1 2⎤
A=⎢ ⎥
⎣2 1⎦
試驗證 ( a ) v1 = [1 1] , ( b ) v 2 = [1 −1] 為 A 之特徵向量。
T T
【解答】
驗證如下
故 v1 、 v 2 為 A 之特徵向量,且其特徵值分別為 λ1 = 3 、 λ2 = −1 。 █
【證明】
Au = λ u ⇒ c ( Au ) = c ( λ u ) ⇒ A ( cu ) = λ ( cu ) ⇒ Aw = λ w 。 █
題外話(特徵向量不可以為零向量) 決定特徵向量的是以下齊次系統:
( A − λI ) x = 0
量:
⎡1 2 ⎤ ⎡ −2 ⎤ ⎡1 2 ⎤ ⎡ −2 ⎤ ⎡ 0⎤ ⎡ −2⎤
A=⎢ ⎥ , x=⎢ ⎥ ⇒ Ax = ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ = 0⎢ ⎥
⎣1 2 ⎦ ⎣1⎦ ⎣1 2 ⎦ ⎣ 1 ⎦ ⎣ 0⎦ ⎣1⎦
這個情況,我們認定特徵值 λ = 0 。也就是說,特徵值可以為零,但特徵向量不可
以為零向量。 █
例題 6-11 (驗證特徵向量、特徵值)
令
⎡ 7 −2 −1⎤
A = ⎢⎢ −2 10 2 ⎥⎥
⎢⎣ −1 2 7 ⎥⎦
試驗證 ( a ) λ1 = 12 , ( b ) λ2 = 6 為 A 之特徵值。
【解答】
我們需將 λ 代入,並檢測下列線性系統(齊次系統)的解:
Ax = λ x ⇒ Ax − λ x = 0 ⇒ ( A − λI ) x = 0
⎡ 7 − 12 −2 −1 0⎤ ⎡0 1 −2 0 ⎤
⎢ −2 10 − 12 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯
基本列運算
⎢
⎢⎣ −1 2 7 − 12 0 ⎥⎦ ⎢⎣1 0 1 0 ⎥⎦
⎡ −1⎤
⇒ x = ⎢⎢ 2 ⎥⎥ s, s ∈ R
⎢⎣ 1 ⎥⎦
故 λ1 = 12 為特徵值,而其特徵向量為 xλ1 = [ −1 2 1] 。
T
( b ) λ2 = 6 ,處理以下線性系統
⎡7 − 6 −2 −1 0⎤ ⎡ 1 −2 − 1 0 ⎤
⎢ −2 10 − 6 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯基本列運算
⎢
⎢⎣ −1 2 7−6 0 ⎥⎦ ⎢⎣0 0 0 0 ⎥⎦
⎡ 2⎤ ⎡1 ⎤
⇒ x = ⎢ 1 ⎥ s + ⎢⎢ 0 ⎥⎥ t ,
⎢ ⎥ s, t ∈ R
⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦
故 λ2 = 6 為特徵值,而其特徵向量有許多,上式的 x 都是。 █
λ2 = 6 的特徵向量
⎧ ⎡ 2⎤ ⎡1 ⎤ ⎫
⎪ ⎢ ⎥ ⎢ ⎥ ⎪
W = ⎨x x = ⎢ 1 ⎥ s + ⎢ 0 ⎥ t , s, t ∈ R ⎬
⎪ ⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎪
⎩ ⎭
一般我們會以該空間的基底的向量來代表,如
⎡ 2⎤ ⎡1 ⎤
x1 = ⎢1 ⎥ , x 2 = ⎢⎢ 0 ⎥⎥
⎢ ⎥
⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦
我們已經知道,一個向量空間會有許許多多的基底。現在問題來了,哪一個基底比
較好呢?答案很明顯,就是單模正交基底。以下是將一般基底轉換為單模正交基底
的 Gram-Schmidt 程序,正交步驟:
正規化步驟:
⎡2⎤
v1 1 ⎢ ⎥
w1 = = 1
v1 5⎢ ⎥
⎢⎣ 0 ⎥⎦
⎡1⎤
v2 1 ⎢ ⎥
w2 = = −2
v2 30 ⎢ ⎥
⎢⎣ 5 ⎥⎦
這個課題。 █
找特徵值與特徵向量
方陣 A ∈ M n×n 的特徵向量,為下列線性系統的解
Ax = λ x
亦即,特徵向量為下列齊次系統的非瑣碎解
( A − λI ) x = 0 (6-9)
而(6-9)有非瑣碎解的條件為
det ( A − λ I ) = A − λ I = 0 (6-10)
找方陣 A 之特徵值、特徵向量的步驟如下:
步驟一:找出特徵值
解特徵方程式
f ( λ ) = det ( A − λ I ) = 0
步驟二:找特徵向量
將步驟一得到的特徵值 λi , i = 1,…, k 分別代入(6-9):
( A − λI ) x = 0
以上齊次系統的非瑣碎解(基底向量)即為 λi 的特徵向量。
例題 6-12 (找特徵值、特徵向量)
令
⎡1 2 ⎤
A=⎢ ⎥
⎣2 1⎦
試求其特徵值、特徵向量。
【解答】
求解特徵方程式:
⎡1 2⎤ ⎡1 0 ⎤ 1 − λ 2
⎢ 2 1 ⎥ − λ ⎢0 1 ⎥ = 2 1 − λ = 0 ⇒ (1 − λ )(1 − λ ) − 4 = 0
⎣ ⎦ ⎣ ⎦
⇒ λ1 = 3, λ2 = −1
(1)令 λ1 = 3 ,處理以下線性系統:
⎡1 − 3 2 0⎤ ⎡1 −1 0 ⎤ ⎡1⎤
⎢ 2 1 − 3 0⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ ⎥ ⇒ x = ⎢ ⎥ t, t ∈ R
⎣ ⎦ ⎣0 0 0⎦ ⎣1⎦
⎡⎤
1
⇒ x1 = ⎢ ⎥
⎣1⎦
(2)令 λ2 = −1 ,處理以下線性系統:
故其特徵值為 λ1 = 3 、 λ2 = −1 ,特徵向量為 x1 = [1 1] 、 x 2 = [ −1 1] 。
T T
█
例題 6-13 (找特徵值、特徵向量)
令
⎡ 7 −2 −1⎤
A = ⎢⎢ −2 10 2 ⎥⎥
⎢⎣ −1 2 7 ⎥⎦
試求其特徵值、特徵向量。
【解答】
求解特徵方程式:
⇒ λ = 12, 6, 6
(1)令 λ1 = 12 ,處理以下線性系統:
⎡ 7 − 12 −2 −1 0⎤ ⎡0 1 −2 0 ⎤
⎢ −2 10 − 12 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯ 基本列運算
⎢
⎢⎣ −1 2 7 − 12 0 ⎥⎦ ⎢⎣1 0 1 0 ⎥⎦
⎡ −1⎤
⇒ x = ⎢⎢ 2 ⎥⎥ s, s ∈ R
⎢⎣ 1 ⎥⎦
故其特徵向量為 x1 = [ −1 2 1] 。
T
(2)令 λ2 = 6 ,處理以下線性系統:
因 λ2 = 6 為重根,有兩個特徵向量是正常的。
以 Gram-Schmidt 程序將上式的基底轉換為正交基底:
⎡1 ⎤
v1 = x1 = ⎢⎢ 0 ⎥⎥
⎢⎣1 ⎥⎦
⎡ 2⎤ ⎡1 ⎤ ⎡ 1 ⎤
x 2 i v1 ⎢ ⎥ 2⎢ ⎥ ⎢ ⎥
v 2 = x2 − v1 = ⎢ 1 ⎥ − ⎢ 0 ⎥ = ⎢ 1 ⎥
v1 i v1 2
⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣ −1⎥⎦
故其特徵向量為 v1 = [1 0 1] 、 v 2 = [1 1 −1] 。
T T
本題特徵值為 λ1 = 12 、 λ2 = 6 、 λ3 = 6 ,其特徵向量分別為 x1 = [ −1 2 1] 、
T
x 2 = [1 0 1] 、 x3 = [1 1 −1] 。
T T
█
徵方程式是必要的、非常令人討厭的步驟。一句箴言:
『不要草率的直接將行列式值乘開!』
乘開後,除了加加減減整理多項式的程序很煩,容易出錯,最要命的是配方,有些
時候就是配不出來。筆者建議先用基本列運算、基本行運算,將行列式中弄一些零
元素出來,這樣作列展開(或行展開)時會清爽許多。例如
1− λ 2 () ( )
列: 1 + 2 3−λ 3−λ ( ) ()
行: 2 − 1 3−λ 0
= 0 ⎯⎯⎯⎯ → = 0 ⎯⎯⎯⎯ → =0
2 1− λ 2 1− λ 2 −1 − λ
若所有根都是有理數,以上作法可以一路到底,直接從對角元素看出答案。當然,
如果有無理根或虛根來攪局,只好打起精神來,拼配方技巧了。 █
以下是幾個有關特徵值與特徵向量的重要性質。
【證明】
考慮特徵方程式 det ( A − λ I ) = 0,將 λ = 0 代入,則為 det ( A ) = 0;反之,由 det ( A ) = 0
可得 λ = 0 為 det ( A − λ I ) = 0 之一個解。 █
定理 6-7
若 λ1 , λ2 ,…, λn 為 A ∈ M n×n 的 n 個特徵值,則 det ( A ) = λ1 × λ2 × × λn 。
【證明】
考慮特徵方程式 det ( A − λ I ) = ( λ − λ1 )( λ − λ2 ) ( λ − λn ) = 0 ,將 λ = 0 代入,則得到
det ( A ) = λ1 × λ2 × × λn 。 █
定理 6-8
若 λ 為 A ∈ M n×n 之特徵值,且 det ( A ) ≠ 0 ,則 1 λ 為 A −1 的特徵值。
【證明】
由已知條件: Ax = λ x ,兩邊乘上 A −1 : A −1Ax = x = λ A −1x ⇒ A −1x = λ1 x 。
det ( A ) ≠ 0 告訴我們 A −1 存在,且 λ ≠ 0 。 █
定理 6-9
若 λ1 , λ2 ,…, λk 為 A ∈ M n×n 之相異特徵值,則其特徵向量 x1 , x 2 ,…, x k 互相獨立。
【證明】
其中 c1 , c2 ,…, ck −1 ∈ R ,則
Ax k = c1Ax1 + c2 Ax 2 + + ck −1Ax k −1
⇒ λk x k = c1λ1x1 + c2 λ2 x 2 + + ck −1λk −1x k −1
將該式與(6-11)的 λk 倍,則
因 λ1 , λ2 ,…, λk 互不相等,故
c1 = c2 = = ck −1
雖然涉及不同名詞,但數學意涵完全一樣:
(1) A 不是奇異矩陣(nonsingular)
。
(4) Ax = b 有唯一解。
(5) det ( A ) ≠ 0 。
(6) rank A = n 。
(7) nullity A = 0 。
(8) A 的列向量線性獨立。
(9) A 的行向量線性獨立。
(10) A 的特徵值不為零, λ ≠ 0 。 █
6.5 矩陣對角化
本節對一個特殊矩陣有興趣:對角矩陣。就特徵值與特徵向量的觀點,對角矩陣非常優
秀:其對角元素就是特徵值: λi = aii , i = 1,…, n ,而特徵向量就是自然基底向量: ei , ei
例題 6-14 (對角矩陣的特徵值、特徵向量)
令
試求其特徵值、特徵向量。
【解答】
求解特徵方程式:
2−λ 0 0
0 4−λ 0 =0 ⇒ ( 2 − λ )( 4 − λ )( 3 − λ ) = 0
0 0 3−λ
⇒ λ = 2, 4, 3
(1)令 λ1 = 2 ,處理以下線性系統:
⎡2 − 2 0 0 0⎤ ⎡0 0 0 0⎤
⎢ 0 4−2 0 0 ⎥⎥ → ⎢⎢ 0 1 0 0 ⎥⎥
⎯⎯⎯⎯
基本列運算
⎢
⎢⎣ 0 0 3− 2 0 ⎥⎦ ⎢⎣ 0 0 1 0 ⎥⎦
⎡1 ⎤
⇒ x = ⎢⎢0 ⎥⎥ s, s ∈ R
⎢⎣0 ⎥⎦
故其特徵向量為 x1 = e1 = [1 0 0] 。
T
其它特徵向量分別為: x 2 = e 2 = [ 0 1 0] 、 x3 = e3 = [ 0 0 1] 。
T T
█
以下討論的定義、性質只有一個目的:將一般矩陣與對角矩陣搭上線,好利用對角
矩陣一眼就可以看出特徵值與特徵向量的好特性。
定義 (相似矩陣)
矩陣 A, B ∈ M n×n ,若存在非奇異矩陣 P ,使得
B = P −1AP
則稱 A 、 B 為相似矩陣(similar matrix)。 █
定義 (可對角化矩陣)
若矩陣 A ∈ M n×n 與對角矩陣相似,則稱 A 為可對角化(diagonalizable)
。 █
【解答】
驗算這些矩陣
1 1
P = = −2 ≠ 0
1 −1
⎡1 2 ⎤ ⎡1 1 ⎤ ⎡3 −1⎤
AP = A = ⎢ ⎥⎢ ⎥=⎢ ⎥
⎣ 2 1 ⎦ ⎣1 −1⎦ ⎣3 1 ⎦
⎡1 1 ⎤ ⎡ 3 0 ⎤ ⎡3 −1⎤
PB = ⎢ ⎥⎢ ⎥=⎢ ⎥
⎣1 −1⎦ ⎣ 0 −1⎦ ⎣3 1 ⎦
我們有
PB = AP ⇒ B = P −1AP
故 A 、 B 相似。且 A 為可對角化矩陣。 █
定理 6-10
若 A, B ∈ M n×n ,且存在非奇異矩陣 P ∈ M n×n 使得 B = P −1AP ,則 A 、 B 有相同的特
徵值,而且 x B = P −1x A ,其中 x A 、 x B 分別為 A 、 B 之特徵向量。
【證明】
若已知 λ 、 x A 為 A 之特徵值、特徵向量,即 Ax A = λ x A 。
等號兩邊同乘 P −1 ,並令 P −1x A = y ,即 x A = Py ,則
Ax A = λ x A ⇒ P −1APy = λ P −1Py ⇒ By = λ y
故知 λ 也是 B 之特徵值,且其特徵向量 x B = y = P −1x A 。
倒過來,若已知 λ 、 x B 為 B 之特徵值、特徵向量,則
例題 6-16 (驗證相似矩陣的特徵值、特徵向量)
令
⎡1 2⎤ ⎡3 0 ⎤ ⎡1 1 ⎤
A=⎢ ⎥ , B=⎢ ⎥ , P=⎢ ⎥
⎣2 1⎦ ⎣0 −1⎦ ⎣1 −1⎦
因 B = P −1AP ,故知 A 、 B 為相似矩陣。試驗證 A 、 B 特徵值、特徵向量之關係。
【解答】
⎡1⎤ ⎡ 1 ⎤
λA = 3, − 1, xA = ⎢ ⎥, ⎢ ⎥
⎣1⎦ ⎣ −1⎦
B 是對角矩陣,其的特徵值與特徵向量可目視而得:
⎡1 ⎤ ⎡ 0 ⎤
λB = 3, − 1, xB = ⎢ ⎥ , ⎢ ⎥
⎣0 ⎦ ⎣1 ⎦
驗證 x A = Px B , x B = P −1x A :
1 ⎡ −1 −1⎤
P −1 = − ⎢ ⎥
2 ⎣ −1 1 ⎦
⎡1 1 ⎤ ⎡1 0 ⎤ ⎡1 1 ⎤
PX B = ⎢ ⎥⎢ = = XA
⎣1 −1⎦ ⎣0 1 ⎥⎦ ⎢⎣1 −1⎥⎦
1 ⎡ −1 −1⎤ ⎡1 1 ⎤ ⎡1 0 ⎤
P −1X A = − ⎢ ⎥⎢ ⎥=⎢ ⎥ = XB
2 ⎣ −1 1 ⎦ ⎣1 −1⎦ ⎣ 0 1 ⎦
定理 6-11 (將矩陣對角化的方法)
若 A ∈ M n×n 為可對角化矩陣,則 A 有 n 個相互獨立的特徵向量,反之亦然。
也就是說,若 A 為可對角化,則以下等式成立
P −1AP = D
其中, P 之行向量為由 A 之特徵向量, D 為由 A 之特徵值為對角元素的對角矩陣。
【證明】
det ( P ) ≠ 0 ,使得
P −1AP = D ⇒ AP = PD = DP (6-12)
可以 P 之各行拆開為 n 個等式
Ap1 = a11p1
Ap 2 = a22p 2
Ap n = ann p n
AP = PD = DP ⇒ P −1AP = D
故 A 為可對角化矩陣。 █
例題 6-17 (驗證可對角化矩陣)
令
⎡1 2 ⎤
A=⎢ ⎥
⎣5 4 ⎦
試驗證 A 為可對角化矩陣。
【解答】
求解特徵方程式:
1− λ 2
= 0 ⇒ λ = 6, − 1
5 4−λ
(1)令 λ1 = 6 ,處理以下線性系統:
(2)令 λ1 = −1 ,處理以下線性系統:
⎡1 − ( −1) 2 0⎤ ⎡1 1 0 ⎤ ⎡ −1⎤
⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→⎢ ⎥ ⇒ x = ⎢ ⎥ s, s ∈ R
⎣ 5 4 − ( −1) 0 ⎦ ⎣0 0 0⎦ ⎣1⎦
得到
⎡ 2 −1⎤ 2 −1 3
P = ⎢5 ⎥, P = 5 = ≠0
⎣1 1 ⎦ 1 1 5
相異實數特徵值,就可以下 A 為可對角化矩陣的結論。 █
回憶以下兩個式子:
Ax = λ x
AP = DP
並隨時提醒自己『特徵向量 x 擺在 A 的後面』,這就夠了。以下是真正要記的公式
AP = PD = DP
P −1AP = D
A = PDP −1
█
題外話(可對角化矩陣之超越函數) 矩陣的可對角化性質可以豐富矩陣運算:從四
則運算擴展到指數、對數、與三角函數等超越函數的運算。所有的這些故事根源於
兩個地方:(1)對角矩陣的 n 次方很容易求得,(2)泰勒展開式。
令 D = diag ( a11 , a22 ,…, ann ) ∈ M n×n 為對角矩陣,很容易可以驗證,其 k ∈ R 次方為
另外,以下是我們會用到的泰勒展開式(Taylor expansion)
:
1 2 1 3
ex = 1 + x + x + x +
2! 3!
1 1 1
sin x = x − x 3 + x 5 − x 7 +
3! 5! 7!
P 與,使得
A = PDP −1
(
A k = PDk P −1 = P diag λ1k , λ2k ,…, λnk P −1 )
e A = Pe D P −1 = P diag ( e λ1
, eλ2 ,… , eλn )P −1
同學可以自行練習以上各式的詳細推導。基本原則是,所有對 A 的運算都會直接
例題 6-18 (可對角化矩陣之超越函數)
令
⎡1 2 ⎤
A=⎢ ⎥
⎣5 4 ⎦
試求(1) A k ;(2) e A 。
【解答】
求得 A 之特徵值與特徵向量:
⎡ 2 ⎤ ⎡ −1⎤
λ = 6, − 1, x = ⎢ ⎥, ⎢ ⎥
⎣5⎦ ⎣ 1 ⎦
(1) A k
1 ⎡ 2 −1⎤ ⎡6 0 ⎤ ⎡ 1 1 ⎤ 1 ⎡ 2 2 ⎤ k 1 ⎡ 5 −2 ⎤
k
A k = PDk P −1 = ⎥ = 7 ⎢ 5 5 ⎥ 6 + 7 ⎢ −5 2 ⎥ ( −1)
k
⎢ ⎥
7 ⎣⎢ 5 1 ⎦⎥ ⎢ 0 k ⎢
( −1) ⎦⎥ ⎣ −5 2 ⎦ ⎣ ⎦ ⎣ ⎦
⎣
(2) e A
1 ⎡ 2 −1⎤ ⎡ e 0 ⎤ ⎡ 1 1 ⎤ 1 ⎡ 2 2 ⎤ 6 1 ⎡ 5 −2 ⎤ −1
6
e A = P e D P −1 = ⎢ ⎥⎢ ⎥= ⎢ ⎥ e + 7 ⎢ −5 2 ⎥ e
7 ⎢⎣ 5 1 ⎥⎦ ⎢⎣ 0 e −1 ⎦⎥ ⎣ −5 2 ⎦ 7 ⎣ 5 5 ⎦ ⎣ ⎦
的計算,過程有點煩。以下提供一個徒手計算時比較不會犯錯的方法。
假設我們要算出 PDQ 的結果,其中, P = ⎡⎣ pij ⎤⎦ 、Q = ⎡⎣ qij ⎤⎦ 、D = diag ( λ1 , λ2 ,… , λn ) ,
⎡ p1i ⎤
⎢p ⎥
第 i 項: λi ⎢ 2i ⎥ [ qi1 qi 2 qin ]
⎢ ⎥
⎢ ⎥
⎣ pni ⎦
例如
⎢5 1 ⎥ ⎢ ⎥
−1 ⎢ −5 2 ⎥
= e ⎢ ⎥ [1 1] + e −1 ⎢ ⎥ [ −5 2]
⎣ ⎦ ⎢⎣ 0 e ⎦⎥ ⎣ ⎦ ⎣5⎦ ⎣1⎦
⎡ 2 2 ⎤ 6 ⎡ 5 −2 ⎤ −1
=⎢ ⎥ e + ⎢ −5 2 ⎥ e
⎣5 5⎦ ⎣ ⎦
⎡ 2e + 5e
6 −1
2e − 2e −1 ⎤
6
=⎢ 6 −1
⎥
⎣⎢ 5e − 5e 5e6 + 2e−1 ⎦⎥
多算幾次就可以掌握這是怎麼一回事了。 █
有關矩陣對角化課題上,對稱矩陣(symmetric matrix)有一些非常管用的特性:(1)
對稱矩陣的特徵方程式全部是實數跟,(2)對稱矩陣一定為可對角矩陣,(3)對稱矩陣可
以找到正交特徵向量,(4)對稱矩陣的 P −1 = P T 。就計算的觀點,第(4)點最帥。
題外話(對稱矩陣) 還是囉唆一點,複習一下對稱矩陣,免得有人快到終點站前,
才搔頭、不好意思地問:
『什麼是對稱矩陣?』
矩陣 A ∈ M n×n ,若 A T = A ,則稱 A 為對稱矩陣(symmetric matrix)。
以下都是對稱矩陣:
⎡1 0 0 ⎤ ⎡2 0 0 ⎤ ⎡ 3 −4 7 ⎤
⎡1 2⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
A=⎢ ⎥ , I = ⎢ 0 1 0 ⎥ , D = ⎢ 0 5 0 ⎥ , B = ⎢ −4 2 1 ⎥
⎣ 2 3 ⎦ ⎢⎣ 0 0 1 ⎥⎦ ⎢⎣ 0 0 −3⎥⎦ ⎢⎣ 7 1 5 ⎥⎦
(S S ) ( ) ( SS ) = ( S )
T T T T
T
= ST ST = S T S, T T
S T = SS T
例如,
⎡1 4⎤
⎡1 2 3⎤ ⎢ ⎥ ⎡14 12 ⎤ ⎡ 2⎤ ⎡ 2 6⎤ ⎡ 2⎤
⎢ 4 1 2 ⎥ ⎢ 2 1 ⎥ = ⎢12 21⎥ , ⎢ 3 ⎥ [ 2 3] = ⎢ 6 9 ⎥ , [2 3] ⎢ ⎥ = [13]
⎣ ⎦ ⎢3 2⎥ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ 3⎦
⎣ ⎦
記得這個箴言:
『對稱矩陣與轉置有關!』 █
定理 6-12
若 A 為對稱矩陣,則其特徵方程式, f ( λ ) = det ( A − λ I ) = 0 ,只有實數根。 █
定理 6-13
若 A 為對稱矩陣,則 A 為可對角化矩陣。 █
首先,需瞭解以下算式成立
Axiy = y T Ax = xT A T y = xi A T y
令 ( λ1 , x1 ) 、 ( λ2 , x 2 ) 為 A 之兩個特徵值、特徵向量,且 λ1 ≠ λ2 ,即以下兩式成立
Ax1 = λ1x1 , Ax 2 = λ2 x 2
( )
λ1 ( x1 ix 2 ) = ( λ1x1 )ix 2 = ( Ax1 )ix 2 = x1 i AT x 2 = x1 i( Ax 2 ) = x1 i( λ2 x 2 ) = λ2 ( x1 i x 2 )
⇒ ( λ1 − λ2 )( x1 ix 2 ) = 0
因 λ1 ≠ λ2 ,故 x1 ix 2 = 0 ,即該兩特徵向量正交。 █
P = [ x1 x 2 xn ]
P T P = ⎡⎣ xi ix j ⎤⎦ = diag ( x1 i x1 , x 2 ix 2 , … , x n i x n )
P T P = ⎡⎣ xi ix j ⎤⎦ = diag ( x1 ix1 , x 2 i x 2 , … , x n ix n ) = I n
定義 (正交矩陣)
矩陣 A ∈ M n×n ,若 A T = A −1 ,則稱 A 為正交矩陣(orthogonal matrix)
。 █
交對角化矩陣(orthogonally diagonalizable)
。 █
定理 6-15 (對稱矩陣為可正交對角化矩陣)
若 A 為對稱矩陣,則其為可正交對角化矩陣,反之亦然。
【證明】
( ) = ( PDP )
T T
P −1AP = D ⇒ A T = PDP −1 T
= PDP T = PDP −1 = A
得證 A 為對稱矩陣。 █
例題 6-19 (驗證對稱矩陣為可正交對角化)
令
⎡ 7 −2 −1⎤
A = ⎢⎢ −2 10 2 ⎥⎥
⎢⎣ −1 2 7 ⎥⎦
試驗證 A 可正交對角化矩陣。
【解答】
(1)找 A 之特徵值
求解特徵方程式:
⇒ λ = 12, 6, 6
(2)找正交特徵向量
令 λ1 = 12 ,處理以下線性系統:
故其特徵向量為 x1 = [ −1 2 1] 。
T
令 λ2 = 6 ,處理以下線性系統:
⎡7 − 6 −2 −1 0⎤ ⎡1 −2 −1 0 ⎤
⎢ −2 10 − 6 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯基本列運算
⎢
⎢⎣ −1 2 7−6 0 ⎥⎦ ⎢⎣0 0 0 0 ⎥⎦
⎡1 ⎤ ⎡ 2⎤
⇒ x = ⎢ 0 ⎥ s + ⎢⎢ 1 ⎥⎥ t ,
⎢ ⎥ s, t ∈ R
⎢⎣1 ⎥⎦ ⎢⎣ 0 ⎥⎦
因 λ2 = 6 為重根,有兩個特徵向量是正常的。
以 Gram-Schmidt 程序將上式的基底轉換為正交基底:
⎡1 ⎤
v1 = x1 = ⎢⎢ 0 ⎥⎥
⎢⎣1 ⎥⎦
⎡ 2⎤ ⎡1 ⎤ ⎡ 1 ⎤
x 2 i v1 ⎢ ⎥ 2⎢ ⎥ ⎢ ⎥
v 2 = x2 − v1 = ⎢ 1 ⎥ − ⎢ 0 ⎥ = ⎢ 1 ⎥
v1 i v1 2
⎣⎢ 0 ⎦⎥ ⎣⎢1 ⎦⎥ ⎣⎢ −1⎦⎥
故其特徵向量為 v1 = [1 0 1] 、 v 2 = [1 1 −1] 。
T T
(3)將特徵向量正規劃
v1 = (1,0,1)i(1,0,1) = 2
v2 = (1,1, −1)i(1,1, −1) = 3
得到
驗證
⎡− 1 2 1 ⎤ ⎡− 1 1 1 ⎤
⎢ 6 6 6 ⎥⎢ 6 2 3 ⎥ ⎡1 0 0 ⎤
P T P = ⎢ 12 0 1 ⎥⎢ 2
2 ⎥⎢ 6
0 1 ⎥
3 ⎥
= ⎢⎢0 1 0 ⎥⎥
⎢
⎢ 1 1 − 13 ⎥ ⎢ 16 1 − 13 ⎥ ⎣⎢0 0 1 ⎦⎥
⎣ 3 3 ⎦⎣ 2 ⎦
⎡− 1 1 ⎤ ⎡ 1 1 ⎤
−2 −1⎤ ⎢ − 6
2 1
⎢ 6 6 6 ⎥⎡ 7 2 3 ⎥ ⎡12 0 0 ⎤
P T AP = ⎢ 12 0 1 ⎥ ⎢ −2 10 2 ⎥⎥ ⎢ 26 0 1 ⎥ = ⎢⎢ 0 6 0 ⎥⎥
⎢ 2 ⎥⎢ ⎢ 3 ⎥
⎢ 1 1 − 13 ⎥ ⎣⎢ −1 2 7 ⎦⎥ ⎢ 1 1 − 13 ⎥ ⎣⎢ 0 0 6 ⎦⎥
⎣ 3 3 ⎦ ⎣ 6 2 ⎦
█