CH6線性轉換與特徵值問題

第六章線性轉換與特徵值問題
最後更新日期：2009 年 2 月 18 日
本章介紹線性轉換（linear transformation）
，將線性系統看成一個函數，探討
在不同向量空間裡之向量的對應情形。定義函數時，定義域與值域是重要的
元素，在線性轉換中，對應前者的是轉換矩陣的核（kernel）
，而對應後者的
是轉換矩陣的值域（range）
。特徵值問題（eigenvalue and eigenvector）是線性
轉換的一個重要的應用，而對稱矩陣的對角化（diagonalization）則是該問題
的直接應用。對稱矩陣對角化讓矩陣的運算擴展到指數、三角函數等超越函
數。本章的內容安排如下：
6.1 線性轉換
6.2 核心與值域
6.3 轉換矩陣
6.4 特徵值與特徵向量
6.5 矩陣對角化
6.1 線性轉換
對一個線性系統而言，線性轉換（linear transformation）是以函數的觀點來看線性系統。
考慮以下線性系統
⎡x⎤
⎡2 3 1 ⎤ ⎡7 ⎤
Ax = b 其中 A=⎢ ⎥ , x = ⎢ y ⎥⎥ , b = ⎢ ⎥
⎢
⎣ 4 1 −3⎦ ⎢⎣ z ⎥⎦ ⎣9 ⎦
線性轉換如同下圖的黑盒子，我們需決定輸進去的 ( x, y, z ) ∈ R 3 ，使得經過黑盒子轉換
後，產出 R 2 的 ( 7,9 ) ：
⎡ x⎤
⎡7 ⎤
x = ⎢⎢ y ⎥⎥ ∈ R 3 b = ⎢ ⎥ ∈ R2
⎣9 ⎦
⎣⎢ z ⎦⎥
©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 1 / 37

我們也可以將線性系統看成下圖的函數對應關係，定義域是 R 3 ，而值域是 R 2 ：
L
3
R
( 7,9 )
( x, y , z ) R2
以數學符號來表示則為
⎡7 ⎤
L : R3 → R 2 或 L (x) = ⎢ ⎥
⎣9 ⎦
當然，轉換或函數 L 必須滿足某些條件才可以稱為線性轉換或線性函數。
定義（線性轉換）
令 V 、 W 為兩向量空間， L 為以 V 為定義域、 W 為值域的函數，若任意 u, v ∈ V ，
c ∈ R 滿足以下兩性質
(a) L (u + v ) = L (u ) + L ( v ) (6-1)
(b) L ( cu ) = cL ( u ) (6-2)
，記為 L : V → W 。
則 L 稱為 V 對應至 W 的線性轉換（linear transformation） █
題外話（線性運算子）若線性轉換 L 的定義域與值域是相同的向量空間，如

L : V → V ，則我們稱 L 為向量空間 V 的一個線性運算子（linear operator）
。 █
例題 6-1 （驗證線性轉換）
令 L : M m×n → M n×m ，定義如下
L ( A ) = AT
試驗證 L 是否為線性轉換。
【解答】
令 A, B ∈ M m×n , c ∈ R ，則
( a ) L ( A + B ) = ( A + B )T = A T + B T = L ( A ) + L ( B )
( b ) L ( cA ) = ( cA )T = cA T = cL ( A )

故 L 是一個線性轉換。 █
令 L : M n×n → R ，定義如下
L(A) = A
試驗證 L 是否為線性轉換。
【解答】
令 A, B ∈ M n×n , c ∈ R ，則
(a) L (A + B) = A + B ≠ A + B = L ( A) + L (B)
故 L 不是一個線性轉換。 █
令 L : R m → R n ，定義如下
L ( x ) = Ax
其中 A ∈ M m×n 。試驗證 L 是否為線性轉換。
【解答】
令 x, y ∈ R m , c ∈ R ，則
( a ) L ( x + y ) = A ( x + y ) = Ax + Ay = L ( x ) + L ( y )
( b ) L ( cx ) = A ( cx ) = cAx = cL ( x )
故 L 是一個線性轉換。 █
定理 6-1 (線性轉換之性質)
若 L : V → W 為一線性轉換，則
( a ) L ( c1v1 + c2 v 2 + + ck v k ) = c1L ( v1 ) + c2 L ( v 2 ) + + ck L ( v k ) (6-3)
( b ) L ( 0V ) = L ( 0W )
(c ) L (u − v ) = L (u ) − L ( v )
其中， v1 , v 2 ,…, v k , u, v ∈V ， c1 , c2 ,…, ck ∈ R ， 0V 、 0W 分別為 V 、 W 的加法單位元
素，而 −v 為 v 之加法反元素。
【證明】
自行練習吧。

記得使用(6-1)與(6-2)， ( b ) 需加上加法單位元素的定義： v + 0 = v ，而 ( c ) 則需考慮
加法反元素的定義： v + ( − v ) = 0 。 █
定理 6-2 (以基底轉換表示)
若 L : V → W 為線性轉換， S = { v1 , v 2 ,… , v n } 為 V 的基底，且 u ∈ V ，則 L ( u ) 可由
{L ( v1 ) , L ( v 2 ) ,…, L ( v n )} （以線性組合）來表示。
【證明】
將 u 表示成 u = c1 v1 + c2 v 2 + + cn v n ，則經由(6-3)自然可將 L ( u ) 表示為
L ( u ) = c1 L ( v1 ) + c2 L ( v 2 ) + + cn L ( v n ) 。 █
題外話（應用定理 6-2）定理 6-2 告訴我們，只要知道基底向量的轉換結果，

即使不知道整個轉換機制，也可以作任何向量的轉換。若 L : V → W 為線性轉
換， S = { v1 , v 2 ,… , v n } 為 V 的基底。令 u ∈V ，我們使用以下兩個公式來計算
L (u) ：
u = A S [ u ]S
L ( u ) = A LS [u ]S
其中
A S = [ v1 v 2 vn ]
A LS = ⎡⎣ L ( v1 ) L ( v 2 ) L ( v n ) ⎤⎦
我們稱 A LS 為基底 S 的轉換矩陣（matrix of a linear transformation）

。 █
例題 6-4 （利用基底的線性轉換）
令 L : R 2 → R 3 為線性轉換， S = { v1 , v 2 } 是 R 2 的基底，其中
v1 = (1, 2 ) 、 v 2 = ( 2,1) 而且 L ( v1 ) = ( −1,3, 4 ) , L ( v 2 ) = (1,3,5 )
試求 L ( u ) , u = ( 5, 4 ) 。
【解答】
先求 [u ]S ，其為以下線性系統的解
⎡1 2 5 ⎤ ⎡1 0 1 ⎤
[AS u] = ⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ ⎥
⎣2 1 4⎦ ⎣0 1 2 ⎦
⎡1 ⎤
⇒ [u ]S = ⎢ ⎥
⎣ 2⎦

則
⎡ −1 1⎤ ⎡1⎤
⎢ ⎥ ⎡1 ⎤ ⎢ ⎥
L ( u ) = A LS [u ]S = ⎢ 3 3⎥ ⎢ ⎥ = ⎢ 9 ⎥
⎢⎣ 4 5⎥⎦ ⎣ ⎦ ⎢⎣14 ⎥⎦
2
例題 6-5 （利用基底的線性轉換）
令 L : R 2 → R 2 為線性轉換，且已知 L (1,1) = (1, 2 ) 、 L (1, −1) = ( 3, 2 ) ，試求
( a ) L ( 3, 4 ) ；
( b ) L ( s, t ) 。
【解答】
⎡1 1 ⎤ ⎡1 3 ⎤
令 S = {(1,1) , (1, −1)} ， A S = ⎢ ⎥ ， A LS = ⎢ ⎥。
⎣1 −1⎦ ⎣2 2⎦
( a ) ⎡⎣( 3, 4 )⎤⎦ S 為以下線性系統的解
⎡1 1 3 ⎤ ⎡1 0 72 ⎤
⎢1 −1 4 ⎥ ⎯⎯⎯⎯基本列運算
→ ⎢ 1⎥
⎣ ⎦ ⎣0 1 − 2 ⎦
⎡ 7 ⎤
⇒ ⎡⎣( 3, 4 ) ⎤⎦ = ⎢ 21 ⎥
⎣− 2 ⎦
S
⎡1 3 ⎤ ⎡ 72 ⎤ ⎡ 2 ⎤
L ( 3, 4 ) = A LS ⎡⎣( 3, 4 ) ⎤⎦ = ⎢ ⎥⎢ 1⎥ = ⎢ ⎥
⎣2 2⎦ ⎣ − 2 ⎦ ⎣6⎦
S
( b ) 一樣的作法， ⎡⎣( s, t )⎤⎦ S 為以下線性系統的解
⎡1 1 s ⎤ ⎡1 0 s2+t ⎤
⎢1 −1 t ⎥ ⎯⎯⎯⎯基本列運算
→ ⎢ s −t ⎥
⎣ ⎦ ⎣0 1 2 ⎦
⎡ s +t ⎤
⇒ ⎡⎣( s, t ) ⎤⎦ = ⎢ s2−t ⎥
S
⎣ 2 ⎦
⎡1 3 ⎤ ⎡ s 2+t ⎤ ⎡ 2s − t ⎤
L ( s, t ) = A LS ⎣⎡( s, t ) ⎦⎤ = ⎢ ⎥ ⎢ s −t ⎥ = ⎢ ⎥
⎣2 2⎦ ⎣ 2 ⎦ ⎣ 2s ⎦
S
題外話（與座標變換比較）若 L : V → W 為線性轉換，S = { v1 , v 2 ,…, v n } 為 V 的基底，

依據定理 6-2 的結果， T = {L ( v1 ) , L ( v 2 ) ,… , L ( v n )} 也是一個基底，但不要搞錯了，

它不見得是 W 的基底！我們會在下一節處理這個問題。現在與上一章的座標變換
比較一下，若將 L 看成座標變換，則 L 是在相同空間作轉換 L : R n → R n ；這時， T
就是 R n 的基底了。這也就是我們可以將座標變換視為一個運算的道理。 █
6.2 核心與值域
對從向量空間 V 映射至向量空間 W 的轉換 L : V → W ，在本節，我們關心 V 、 W 的大小
（對向量空間應該是維度才恰當）
。這牽涉到函數的映射是否一對一（one-to-one）與映
成（onto）的觀念
定義（一對一）
令 L : V → W 為線性轉換，對任意元素 u, v ∈ V ，若
u≠v ⇒ L (u ) ≠ L ( v ) 或 L (u ) = L ( v ) ⇒ u = v
則稱 L 為一對一（one-to-0ne）
。 █
定義（核心）
令 L : V → W 為線性轉換，則 V 所有映射到 0W 之元素所成的集合稱為 L 的核心
（kernel）
，標記為 ker L ，
{
ker L = v L ( v ) = 0W , v ∈V } █
定義（值域、映成）
令 L : V → W 為線性轉換，則所有映射的元素 L ( v ) , v ∈V 所成的集合稱為 L 的值域
（range）
，標記為 range L ，
range L = { L ( v ) v ∈ V }
若值域與對應域相等， range L = W ，則稱 L 為映成（onto）

。 █
定理 6-3 (核心、值域與一對一之性質)
令 L : V → W 為線性轉換，則
( a ) ker L 為 V 之次空間。

( b ) range L 為 W 之次空間。
( c ) 若 dim ( ker L ) = 0 ，則 L 為一對一。
( d ) 若 dim ( range L ) = dimV ，則 L 為一對一。
( e ) dim ( ker L ) + dim ( range L ) = dimV 。 █
請參考圖 6-1，說明兩種不能成為函數的映射狀況。另外，圖 6-2 呈現一對一、映

成、與一對一且映成等三種情況。
圖 6-1
圖 6-2
題外話（一對一且映成的重要性）檢視圖 6-2 之各對應圖，若我們把對應的箭頭倒

過來，則只有『一對一且映成』還是一個合法的函數！這個對應箭頭倒過來就是反
函數（inverse function）的意思，因此，正式的說法為，一對一且映成的函數才存
在其反函數。 █

題外話（值域、核心 v.s. 列空間、零空間）我們一直用線性系統 Ax = b 來串連本
書的抽象題材，介紹完值域、核心的定義後，當然還是要透過將它們與已經學過的
東西結合。若 L : R m → R n ， L ( x ) = Ax ，則
( a ) range L = A 之行空間
( b ) ker L = A 之零空間
既然我們將 range L 、 ker L 比擬為矩陣的行空間、零空間，則線性轉換 L 有零度、
秩的概念也是理所當然的了。
( c ) dim ( range L ) 稱為 L 之秩（rank of L ），即 dim ( range L ) = rank A ；
( d ) dim ( ker L ) 稱為 L 之零度（nullity of L ），即 dim ( ker L ) = nullity A 。
將以上 ( a ) 至 ( d ) 放在心裡，並結合定理 6-3 的各性質，我們可以用簡單求解本章
的題目。 █
例題 6-6 （值域、核心）
令 L : R 4 → R 3 為線性轉換，其中
⎛⎡x⎤⎞
⎜⎢ ⎥⎟ ⎡x + y + z⎤
L ⎜ ⎢ ⎥ ⎟ = ⎢⎢ y + z + w⎥⎥
y
⎜⎢ z⎥⎟
⎜⎜ ⎢ ⎥ ⎟⎟ ⎢⎣ x − z ⎥⎦
⎝ ⎣ w⎦ ⎠
試求 ( a ) range L ； ( b ) ker L ； ( c ) L 是否一對一； ( d ) L 是否映成。
【解答】
首先，改寫函數
⎛⎡x⎤⎞ ⎡x⎤
⎜ ⎢ ⎥ ⎟ ⎡ x + y + z ⎤ ⎡1 1 1 0 ⎤⎢ ⎥
L ⎜ ⎢ ⎥ ⎟ = ⎢⎢ y + z + w⎥⎥ = ⎢⎢0 1 1 1 ⎥⎥ ⎢ ⎥
y y
⎜⎢ z ⎥⎟ ⎢z⎥
⎜⎜ ⎢ ⎥ ⎟⎟ ⎢⎣ x − z ⎥⎦ ⎢⎣1 0 0 −1⎥⎦ ⎢ ⎥
⎝ ⎣ w⎦ ⎠ ⎣ w⎦
⎡1 1 1 0 ⎤ ⎡1 1 1 0 ⎤
A = ⎢⎢0 1 1 1 ⎥⎥ ⎯⎯⎯⎯ 基本列運算
→ ⎢0 1 1 1⎥
⎢ ⎥
⎢⎣1 0 0 −1⎥⎦ ⎢⎣ 0 0 0 0 ⎥⎦
( a ) range L （ A 的行空間）
range L = span {(1,0,1) , ( 0,1, −1)} （基底為 A 中帶頭一相對行之行向量）

( b ) ker L （ A 的零空間）
⎡ x ⎤ ⎡ −1⎤ ⎡ −1⎤
⎢ y⎥ ⎢ 1 ⎥ ⎢ ⎥
⎢ ⎥ = ⎢ ⎥ s + ⎢ 0 ⎥ t , s, t ∈ R
⎢z⎥ ⎢ 0 ⎥ ⎢1⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ w⎦ ⎣ −1⎦ ⎣ −1⎦
⇒ ker L = span {( −1,1,0, −1) , ( −1,0,1, −1)}
( c ) dim ( ker L ) = 2 ≠ 0 ，故 L 並非一對一。

( d ) dim ( rnage L ) = 2 ≠ dim R3 ，故 L 並非映成。 █
例題 6-7 （值域、核心）
令 L : R 4 → R 3 為線性轉換，其中
L ( x, y, z , w ) = ( x + y, z + w, x + z )
試求： ( a ) range L 之基底； ( b ) ker L 之基底； ( c ) L 是否一對一； ( d ) L 是否映成。
【解答】
首先，改寫函數
⎡x⎤
⎡1 1 0 0 ⎤ ⎢ ⎥
L ( x, y, z , w ) = ( x + y, z + w, x + z ) = ⎢⎢ 0 0 1 1 ⎥⎥ ⎢ ⎥
y
⎢z⎥
⎢⎣1 0 1 0 ⎥⎦ ⎢ ⎥
⎣ w⎦
⎡1 1 0 0 ⎤ ⎡1 1 0 0 ⎤
A = ⎢0 0 1 1 ⎥ ⎯⎯⎯⎯→ ⎢⎢ 0 −1 1 0 ⎥⎥
⎢ ⎥ 基本列運算
⎢⎣1 0 1 0 ⎥⎦ ⎢⎣ 0 1 0 1 ⎥⎦
( a ) range L （ A 的行空間）
range L = span {(1,0,1) , ( 0,1,1) , ( 0,1,0 )}

基底為 {(1,0,1) , ( 0,1,1) , ( 0,1,0 )} 。
( b ) ker L （ A 的零空間）

⎡ x ⎤ ⎡ −1⎤
⎢ y⎥ ⎢ 1 ⎥
⎢ ⎥ = ⎢ ⎥ s, s ∈ R
⎢z⎥ ⎢ 1 ⎥
⎢ ⎥ ⎢ ⎥
⎣ w⎦ ⎣ −1⎦
⇒ ker L = span {( −1,1,1, −1)}
基底為 {( −1,1,1, −1)} 。
( c ) dim ( ker L ) = 1 ≠ 0 ，故 L 並非一對一。

( d ) dim ( rnage L ) = 3 = dim R3 ，故 L 為映成。 █
6.3 轉換矩陣
本節整合線性轉換與上一章介紹的座標變換。首先，請牢記以下基本觀念：
座標變換，兩個基底（座標系統）間的座標變換，只涉及一個向量空間；
線性轉換，兩個向量空間之間的座標變換，可能涉及不同基底。
另外，我們會與一堆數學符號周旋，這是沒有辦法的事；請先參考圖 6-3。
L :V → W
V W
S = { v1 , v 2 ,…, v m } T = {w1 , w 2 ,…, w n }
u w = L (u )
L ( u ) = A LS [u ]S
u = A S [ u ]S w = AT [ w ]T
⎡⎣ L ( u ) ⎤⎦ = [ A LS ]T [u ]S
T
圖 6-3
首先，我們將符號歸成五類，向量空間、向量、基底、座標、轉換矩陣：

向量空間： V 、 W ；
向量： u 、 w 、 L ( u ) ；
基底： S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w n } ；
座標： [u ]S 、 [ w ]T 、 ⎡⎣ L ( u ) ⎤⎦ ；
T
轉換矩陣： A S 、 AT 、 A LS 、 [ A LS ]T 、 A −S1 、 AT−1 。
其中，轉換矩陣要特別注意，依據不同內容間的轉換，又分成好幾類：
向量 ← 座標： u = A S [u ]S 、 L ( u ) = AT ⎡⎣ L ( u ) ⎤⎦ 、 L ( u ) = A LS [u ]S ；
T
座標 ← 向量： [u ]S = A −S1u 、 ⎡⎣ L ( u ) ⎤⎦ = AT−1 L ( u ) ；

T
座標 ← 座標： ⎡⎣ L ( u ) ⎤⎦ = [ A LS ]T [u ]S 。
T
請注意，轉換矩陣並不見得都存在反矩陣！ A S 、 AT 可以有反矩陣，但 A LS 、 [ A LS ]T 就
不一定有，為什麼？動點腦筋想想吧。最後，要熟記這些轉換矩陣如何以及由哪些向量
（座標）所組成：
A S = [ v1 v2 vm ] ；
AT = [ w1 w2 wn ] ；
A LS = ⎡⎣ L ( v1 ) L ( v 2 ) L ( v m ) ⎤⎦ ；
好了，我們已經介紹完座標變換與線性轉換的符號與基本關係式。剩下來的就是眼睛放
亮一點，發揮創意由這些基本關係式組成我們要的東西。
題外話（轉換矩陣之符號意義）我們來解讀一下 [ A LS ]T 符號的意義。 A 表示這是一
個轉換矩陣，下標的 L 表示這是一個線性轉換（若沒有 L 則為座標變換）

，下標的 S
表示輸入端是 S 基底的座標， [ i]T 表示轉換成 T 基底的座標。若沒有座標符號，如
A LS 則表示轉換的結果是一個向量。
好了，我們練習一下沒有出現的符號： [ A S ]T 。看出來了嗎？這是一個將 S 座標轉
換成 T 座標的座標變換矩陣，關係式寫出來應如 [u ]T = [ A S ]T [u ]S 。 █
定義（表示 L 之轉換矩陣）
令 L : V → W 為線性轉換， S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w n } 分別為 V 、 W 之

基底，任意 u ∈V ，若
⎡⎣ L ( u ) ⎤⎦ = [ A LS ]T [u ]S
T
則稱 [ A LS ]T 為表示線性轉換 L 之轉換矩陣（matrix representing L with respect to
the bases S and T ）

。 █
題外話（推導 [ A LS ]T ）在上面的關係式，沒有提供 [ A LS ]T ，它可以由基本轉換矩陣
（ A S 、 AT 、 A LS ）組合而來。以下是推導過程：
⎡⎣ L ( u ) ⎤⎦ = AT−1 L ( u ) = AT−1A LS [u ]S
T
⇒ [ A LS ]T = AT−1A LS
，而 AT−1 則進一步將向量
可以這樣想， A LS 轉換後的結果是向量（把 A LS 看成向量）
（ A LS ）轉換成 T 之座標： AT−1A LS 。相同道理，若 S 、 T 為在同一個向量空間上
的基底，則 [ A S ]T 的推導如下
[u ]T = AT−1u = AT−1A S [u ]S ⇒ [ A S ]T = AT−1A S
上一章，我們將這個座標變換矩陣 [ A S ]T 標記為 PT ← S 。 █
題外話（計算課題：不要直接找 A −1 ）在座標變換或線性轉換的計算，我們常常有
面臨反矩陣的場合，不要真的直接去找反矩陣，那會煩死人。以下是建議作法：
(1) 已知 u = A S [u ]S 、 u 、 A S ，求 [u ]S = A −S1u 。
作法為處理以下增廣矩陣
[AS u ] ⎯⎯⎯⎯
基本列運算
→ ⎡⎣ A −S1A S A −S1u ⎤⎦ = ⎡⎣I A −S1u ⎤⎦
以基本列運算將左方轉換為單位矩陣，則右方即為所求之 [u ]S 。
(2) 已知 AT 、 A LS ，求 [ A LS ]T = AT−1A LS 。
處理以下增廣矩陣

[ AT A LS ] ⎯⎯⎯⎯
基本列運算
→ ⎡⎣ AT−1AT AT−1A LS ⎤⎦ = ⎡⎣I AT−1A LS ⎤⎦
有沒有捉到重點？將需要求反矩陣的矩陣（如 A S 、 AT ）擺在增廣矩陣的左方，
其它部分擺在右方，然後以基本列運算將左方轉換成單位矩陣即可。 █
例題 6-8 （避開直接找反矩陣）
令 L : V → W 為線性轉換， S = { v1 , v 2 , v 3 } 、 T = {w1 , w 2 } 分別為 V 、 W 基底，其中
v1 = (1,1,0 ) , v 2 = ( 0,1,1) , v 3 = ( 0,0,1) ,
w1 = (1, 2 ) , w 2 = (1,3)
而且已知
L ( v1 ) = ( 2,3) , L ( v 2 ) = ( 2,1) , L ( v 3 ) = (1,3)
試求 S 座標與 T 座標間的轉換矩陣 [ A LS ]T 。
【解答】
我們知道 [ A LS ]T = AT−1A LS 。
由題目資訊，我們有
⎡ 1 1⎤ ⎡ 2 2 1⎤
AT = [ w1 w1 ] = ⎢ ⎥, A LS = ⎡⎣ L ( v1 ) L ( v1 ) L ( v1 ) ⎤⎦ = ⎢ ⎥
⎣ 2 3⎦ ⎣ 3 1 3⎦
⎡ 1 1 2 2 1⎤ ⎡1 0 3 4 0 ⎤
⎢ 2 3 3 1 3⎥ ⎯⎯⎯⎯→ ⎢ 0 1 −1 −3 1 ⎥
基本列運算
⎣ ⎦ ⎣ ⎦
⎡ 3 4 0 ⎤
⇒ [ A LS ]T = ⎢ ⎥
⎣ −1 −3 1 ⎦
還記得反矩陣的數值解過程嗎？是不是與這裡處理的增廣矩陣有所雷同。所以呢，
事實上，我們是有求反矩陣，間接的啦。 █
向量空間內的線性轉換
本小節討論線性轉換 L : V → V （定義域與對應域的空間相同）的轉換矩陣。這時，
基底 S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w m } 在相同的向量空間，因此有座標變換的可
能性。我們將討論相同基底座標間的線性轉換矩陣， [ A LS ]S 與 [ A LT ]T ，並建立這兩個

轉換矩陣的關係式。
定理 6-4 (線性轉換矩陣之座標變換)
令 L : V → V 為線性轉換， S = { v1 , v 2 ,…, v m } 、 T = {w1 , w 2 ,…, w m } 為 V 之基底，若
轉換矩陣 A LS 已知如下
A LS = ⎡⎣ L ( v1 ) L ( v 2 ) L ( v m ) ⎤⎦
則對任意 u ∈V ，
( a ) [ A LS ]S = A −S1A LS
( b ) [ A LT ]T = [ AT ]−S1 [ A LS ]S [ AT ]S
其中，
A S = [ v1 v2 v m ] , A T = [ w1 w2 w n ], [ AT ]S = A −S1AT
【證明】
(a)
由定義 L ( u ) = A LS [u ]S 、 L ( u ) = A S ⎡⎣ L ( u ) ⎤⎦ ，故
S
L ( u ) = A LS [u ]S = A S ⎡⎣ L ( u ) ⎤⎦ ⇒ ⎡⎣ L ( u ) ⎤⎦ = A −S1A LS [u ]S (6-4)
S S
可得到
[ A LS ]S = A −S1A LS (6-5)
(b)
由定義 u = A S [u ]S = AT [u ]T 、 L ( u ) = A S ⎡⎣ L ( u ) ⎤⎦ = AT ⎡⎣ L ( u ) ⎤⎦ ，故
S T
[u ]S = A −S1AT [u ]T
⎡⎣ L ( u ) ⎤⎦ = A −S1AT ⎡⎣ L ( u ) ⎤⎦
S T
將這兩式代入(6-4)，可得
(
A −S1AT ⎡⎣ L ( u ) ⎤⎦ = A −S1A LS A −S1AT [u ]T
T
)
( ) (A )( A ) [u ] = [ A ] [ A ] [ A ] [u ]
−1
⇒ ⎡⎣ L ( u ) ⎤⎦ = A −S1AT −1 −1 −1
T S A LS S AT T T S LS S T S T
也就是

[ A LT ]T = [ AT ]−S1 [ A LS ]S [ AT ]S (6-6)
題外話 (6-6)的意義為，我們在向量空間 V 的基底 S 上已經（辛苦地）建立一個表示

L 的線性轉換矩陣 [ A LS ]S 。現在，假如我們在 V 上定義一個新的基底 T ，那麼可不
可以利用已知的 [ A LS ]S 資訊，來建立新基底上來表示 L 的線性轉換矩陣 [ A LT ]T ？當
然答案是肯定的，我們只要先（簡單）建立 T 座標到 S 座標的座標變換矩陣 [ AT ]S ，
再利用(6-6)就可以了。 █
例題 6-9 （驗證轉換矩陣）
令 L : R 2 → R 2 為線性轉換，
⎛ ⎡x⎤ ⎞ ⎡ x + y ⎤
L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥；
⎝ ⎣ y⎦ ⎠ ⎣x − 2 y⎦
又令
⎧⎪ ⎡1⎤ ⎡ 2 ⎤ ⎫⎪ ⎧⎪ ⎡ 1 ⎤ ⎡ 1 ⎤ ⎫⎪
S = ⎨⎢ ⎥ , ⎢ ⎥ ⎬ , T = ⎨⎢ ⎥ , ⎢ ⎥ ⎬
⎩⎪ ⎣1⎦ ⎣ −1⎦ ⎭⎪ ⎪⎩ ⎣ −1⎦ ⎣ 2⎦ ⎭⎪
為 R 2 的基底。則
(1)基本轉換矩陣如下
⎡1 2 ⎤ ⎡ 1 1⎤ ⎡ 2 1⎤ ⎡0 3 ⎤
AS = ⎢ ⎥ , AT = ⎢ ⎥, A LS = ⎢ ⎥ A LT = ⎢ ⎥
⎣1 −1⎦ ⎣ −1 2 ⎦ ⎣ −1 4 ⎦ ⎣ 3 −3⎦
其中
⎛ ⎡1⎤ ⎞ ⎡ 2 ⎤ ⎛ ⎡ 2 ⎤ ⎞ ⎡1 ⎤ ⎛ ⎡ 1 ⎤ ⎞ ⎡ 0⎤ ⎛ ⎡1 ⎤ ⎞ ⎡ 3 ⎤
L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥ , L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥ , L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥ , L ⎜⎜ ⎢ ⎥ ⎟⎟ = ⎢ ⎥
⎝ ⎣1⎦ ⎠ ⎣ −1⎦ ⎝ ⎣ −1⎦ ⎠ ⎣ 4⎦ ⎝ ⎣ −1⎦ ⎠ ⎣ 3⎦ ⎝ ⎣ 2⎦ ⎠ ⎣ −3⎦
(2)求 [ A LS ]S = A −S1A LS ，處理以下增廣矩陣
⎡1 2 2 1 ⎤ ⎡1 0 0 3 ⎤
⎢1 −1 −1 4 ⎥ ⎯⎯⎯⎯→ ⎢ 0 1 1 −1⎥
基本列運算
⎣ ⎦ ⎣ ⎦
⎡0 3 ⎤
⇒ [ A LS ]S = ⎢ ⎥
⎣1 −1⎦
(3)求 [ A LT ]T = AT−1A LT ，處理以下增廣矩陣

⎡1 1 0 3⎤ ⎡1 0 −1 3⎤
⎢ −1 2 3 −3⎥ ⎯⎯⎯⎯→ ⎢0 1 1 0 ⎥
基本列運算
⎣ ⎦ ⎣ ⎦
⎡ −1 3⎤
⇒ [ A LT ]T = ⎢ ⎥
⎣ 1 0⎦
(4)求 [ AT ]S = A −S1AT ，處理以下增廣矩陣
⎡1 2 1 1 ⎤ ⎡1 0 − 13 5 ⎤
⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ 3
⎥
⎣1 −1 −1 2 ⎦ ⎣0 1 3
2 − 13 ⎦
⎡ − 13 5 ⎤
⇒ [ A T ]S = ⎢ 2
3
⎥
− 13 ⎦
⎣ 3
(5)求 [ A LT ]T = [ AT ]−S1 [ A LS ]S [ AT ]S
⎡ 0 3 ⎤ ⎡ − 13 5 ⎤
⎡ 2 −1⎤
[ LS ]S [ T ]S ⎢1 −1⎥ ⎢ 2
A A = 3
⎥
− 13 ⎦
=⎢ ⎥
⎣ ⎦⎣ 3 ⎣ −1 2 ⎦
⎡ − 13 5 −1⎤
2 ⎡1 0 −1 3⎤
⎥ ⎯⎯⎯⎯→ ⎢
3 基本列運算
⎢ 2 ⎥
⎣ 3 − 13
−1 2 ⎦ ⎣0 1 1 0 ⎦
⎡ −1 3⎤
⇒ [ A LT ]T = ⎢ ⎥
⎣ 1 0⎦
(3)與(5)求到的 [ A LT ]T 相同。 █
6.4 特徵值與特徵向量
本節介紹同向量空間的一個非常特殊的線性轉換： L : V → V ，
L ( u ) = λu (6-7)
其中， u ∈V , λ ∈ R 。線性轉換的結果沒有改變向量的方向，只是將它的大小作比例 λ 之
改變。若持續作相同的線性轉換，如

L2 ( u ) = L ( L ( u ) ) = λ 2u
Ln ( u ) = λ n u
則向量的大小會趨近於 0 或 ∞ ：
⎧0 若 λ <1
⎪
lim L ( u ) = ⎨ u
n
若 λ =1
n →∞
⎪∞ 若 λ >1
⎩
上面（會使向量大小並為無限大的）性質應用在許多領域，例如，工程建物的共振。
並不是所有向量空間 V 中的向量都有(6-7)的性質，事實上，最多只有 dim V 個向量
滿足(6-7)。沒有錯，就是與 V 的維度有關。還有更有趣的，這些向量都伴隨著特定的 λ
值。我們稱這些特殊向量為特徵向量（eigenvector，characteristic vector）
，而這些伴隨
著的 λ 值為特徵值（eigenvalue，characteristic value）
。
根據上一節的結果，若 V = R n ，則存在一表示 L 之轉換矩陣 A ∈ M n×n ，使得(6-7)
變成如下的線性系統：
L ( x ) = Ax = λ x (6-8)
我們的興趣是，找出方陣 A 的特徵值與特徵向量。一共最多有 n 對，還記得？
例題 6-10 （驗證特徵向量、特徵值）
令
⎡1 2⎤
A=⎢ ⎥
⎣2 1⎦
試驗證 ( a ) v1 = [1 1] ， ( b ) v 2 = [1 −1] 為 A 之特徵向量。
T T
【解答】
驗證如下
⎡ 1 2 ⎤ ⎡1⎤ ⎡1⎤ ⎡1 2⎤ ⎡ 1 ⎤ ⎡1⎤

Av1 = ⎢ ⎥ ⎢ ⎥ = 3 ⎢ ⎥ = 3v1 , Av 2 = ⎢ ⎥ ⎢ ⎥ = −1 ⎢ ⎥ = −1v 2
⎣ 2 1 ⎦ ⎣1⎦ ⎣1⎦ ⎣ 2 1 ⎦ ⎣ −1⎦ ⎣ −1⎦
故 v1 、 v 2 為 A 之特徵向量，且其特徵值分別為 λ1 = 3 、 λ2 = −1 。 █

定理 6-5 (特徵向量的非零倍數仍為特徵向量)
令 A ∈ M n×n ， u ∈ R n ， λ ∈ R ，使得 Au = λ u 。
若 w = cu, c ≠ 0 ，則 Aw = λ w 。
【證明】
Au = λ u ⇒ c ( Au ) = c ( λ u ) ⇒ A ( cu ) = λ ( cu ) ⇒ Aw = λ w 。 █
題外話（特徵向量不可以為零向量）決定特徵向量的是以下齊次系統：
( A − λI ) x = 0
這個系統一定有 x = 0 這個瑣碎解，在這個情況下，特徵值 λ 可以為任何實數值，

並沒有為我們帶來任何有意義的訊息。因此，特徵值不能為 0 。考慮以下矩陣與向
量：
⎡1 2 ⎤ ⎡ −2 ⎤ ⎡1 2 ⎤ ⎡ −2 ⎤ ⎡ 0⎤ ⎡ −2⎤
A=⎢ ⎥ , x=⎢ ⎥ ⇒ Ax = ⎢ ⎥ ⎢ ⎥ = ⎢ ⎥ = 0⎢ ⎥
⎣1 2 ⎦ ⎣1⎦ ⎣1 2 ⎦ ⎣ 1 ⎦ ⎣ 0⎦ ⎣1⎦
這個情況，我們認定特徵值 λ = 0 。也就是說，特徵值可以為零，但特徵向量不可
以為零向量。 █
例題 6-11 （驗證特徵向量、特徵值）
令
⎡ 7 −2 −1⎤
A = ⎢⎢ −2 10 2 ⎥⎥
⎢⎣ −1 2 7 ⎥⎦
試驗證 ( a ) λ1 = 12 ， ( b ) λ2 = 6 為 A 之特徵值。
【解答】
我們需將 λ 代入，並檢測下列線性系統（齊次系統）的解：
Ax = λ x ⇒ Ax − λ x = 0 ⇒ ( A − λI ) x = 0
若只有瑣碎解 x = 0 ，則該 λ 不是特徵值；反之若有非瑣碎解，則 λ 為特徵值，而

且該非瑣碎解為特徵向量。

( a ) λ1 = 12 ，處理以下線性系統
⎡ 7 − 12 −2 −1 0⎤ ⎡0 1 −2 0 ⎤
⎢ −2 10 − 12 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯
基本列運算
⎢
⎢⎣ −1 2 7 − 12 0 ⎥⎦ ⎢⎣1 0 1 0 ⎥⎦
⎡ −1⎤
⇒ x = ⎢⎢ 2 ⎥⎥ s, s ∈ R
⎢⎣ 1 ⎥⎦
故 λ1 = 12 為特徵值，而其特徵向量為 xλ1 = [ −1 2 1] 。
T
( b ) λ2 = 6 ，處理以下線性系統
⎡7 − 6 −2 −1 0⎤ ⎡ 1 −2 − 1 0 ⎤
⎢ −2 10 − 6 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯基本列運算
⎢
⎢⎣ −1 2 7−6 0 ⎥⎦ ⎢⎣0 0 0 0 ⎥⎦
⎡ 2⎤ ⎡1 ⎤
⇒ x = ⎢ 1 ⎥ s + ⎢⎢ 0 ⎥⎥ t ,
⎢ ⎥ s, t ∈ R
⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦
故 λ2 = 6 為特徵值，而其特徵向量有許多，上式的 x 都是。 █
題外話（特徵值空間）在例題 6-11 的 ( b ) λ2 = 6 ，以下向量空間的向量都是
λ2 = 6 的特徵向量
⎧ ⎡ 2⎤ ⎡1 ⎤ ⎫
⎪ ⎢ ⎥ ⎢ ⎥ ⎪
W = ⎨x x = ⎢ 1 ⎥ s + ⎢ 0 ⎥ t , s, t ∈ R ⎬
⎪ ⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎪
⎩ ⎭
一般我們會以該空間的基底的向量來代表，如
⎡ 2⎤ ⎡1 ⎤
x1 = ⎢1 ⎥ , x 2 = ⎢⎢ 0 ⎥⎥
⎢ ⎥
⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦
我們已經知道，一個向量空間會有許許多多的基底。現在問題來了，哪一個基底比
較好呢？答案很明顯，就是單模正交基底。以下是將一般基底轉換為單模正交基底
的 Gram-Schmidt 程序，正交步驟：

⎡ 2⎤
v1 = x1 = ⎢⎢ 1 ⎥⎥
⎢⎣ 0 ⎥⎦
⎡1 ⎤ ⎡ 2 ⎤ ⎡ 15 ⎤
x iv ⎢ ⎥
v 2 = x 2 − 2 1 v1 = ⎢⎢ 0 ⎥⎥ − ⎢⎢ 1 ⎥⎥ = ⎢ − 52 ⎥
2
v1 i v1 5
⎢⎣1 ⎥⎦ ⎢⎣ 0 ⎥⎦ ⎢⎣ 1 ⎥⎦
正規化步驟：
⎡2⎤
v1 1 ⎢ ⎥
w1 = = 1
v1 5⎢ ⎥
⎢⎣ 0 ⎥⎦
⎡1⎤
v2 1 ⎢ ⎥
w2 = = −2
v2 30 ⎢ ⎥
⎢⎣ 5 ⎥⎦
若與 ( a ) λ1 = 12 得到的特徵向量 x1 = [ −1 2 1] 比較，我們可以發現， x1 也正交於

T
w1 、 w 2 。它的門道在於 A 為對稱矩陣（symmetric matrix）

，我們在下一節會討論
這個課題。 █
找特徵值與特徵向量
方陣 A ∈ M n×n 的特徵向量，為下列線性系統的解
Ax = λ x
亦即，特徵向量為下列齊次系統的非瑣碎解
( A − λI ) x = 0 (6-9)
而(6-9)有非瑣碎解的條件為
det ( A − λ I ) = A − λ I = 0 (6-10)
其中，多項式 f ( λ ) = det ( A − λ I ) 稱為 A 的特徵多項式（characteristic polynomial）

，而方
程式 f ( λ ) = det ( A − λ I ) = 0 稱為 A 的特徵方程式（characteristic equation）
。也就是說，A

之特徵方程式的根即為其特徵值。 f ( λ ) = det ( A − λ I ) = 0 為 n = dim A 階的多項方程式，
最多有 n 個實數根，所以呢， A 最多有 n 個特徵值。
找方陣 A 之特徵值、特徵向量的步驟如下：
步驟一：找出特徵值
解特徵方程式
f ( λ ) = det ( A − λ I ) = 0
其實數根， λ1 , λ2 ,…, λk , k ≤ n ，即為特徵值。
步驟二：找特徵向量
將步驟一得到的特徵值 λi , i = 1,…, k 分別代入(6-9)：
( A − λI ) x = 0
以上齊次系統的非瑣碎解（基底向量）即為 λi 的特徵向量。
若有基底向量數目多於一，則以 Gram-Schmidt 程序找正交基底。
例題 6-12 （找特徵值、特徵向量）
令
⎡1 2 ⎤
A=⎢ ⎥
⎣2 1⎦
試求其特徵值、特徵向量。
【解答】
求解特徵方程式：
⎡1 2⎤ ⎡1 0 ⎤ 1 − λ 2
⎢ 2 1 ⎥ − λ ⎢0 1 ⎥ = 2 1 − λ = 0 ⇒ (1 − λ )(1 − λ ) − 4 = 0
⎣ ⎦ ⎣ ⎦
⇒ λ1 = 3, λ2 = −1
(1)令 λ1 = 3 ，處理以下線性系統：
⎡1 − 3 2 0⎤ ⎡1 −1 0 ⎤ ⎡1⎤
⎢ 2 1 − 3 0⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ ⎥ ⇒ x = ⎢ ⎥ t, t ∈ R
⎣ ⎦ ⎣0 0 0⎦ ⎣1⎦
⎡⎤
1
⇒ x1 = ⎢ ⎥
⎣1⎦
(2)令 λ2 = −1 ，處理以下線性系統：

⎡1 − ( −1) 2 0⎤ ⎡1 1 0 ⎤ ⎡ −1⎤
⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→ ⎢ ⎥ ⇒ x = ⎢ ⎥ t, t ∈ R
⎣ 2 1 − ( −1) 0 ⎦ ⎣0 0 0⎦ ⎣1⎦
⎡ −1⎤
⇒ x2 = ⎢ ⎥
⎣1⎦
故其特徵值為 λ1 = 3 、 λ2 = −1 ，特徵向量為 x1 = [1 1] 、 x 2 = [ −1 1] 。
T T
█
例題 6-13 （找特徵值、特徵向量）
令
⎡ 7 −2 −1⎤
A = ⎢⎢ −2 10 2 ⎥⎥
⎢⎣ −1 2 7 ⎥⎦
【解答】
7−λ −2 −1 6−λ 0 6−λ

−2 10 − λ 2 =0 ⎯⎯⎯⎯
→
基本列運算
0 6−λ −12 + 2λ = 0
−1 2 7−λ −1 2 7−λ
6−λ 0 6−λ 6−λ 0 0
0 6−λ −12 + 2λ = 0 ⎯⎯⎯⎯
→
基本行運算
0 6−λ 0 =0
−1 2 7−λ −1 2 12 − λ
⇒ λ = 12, 6, 6
⎡ 7 − 12 −2 −1 0⎤ ⎡0 1 −2 0 ⎤
⎢ −2 10 − 12 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯ 基本列運算
⎢
⎢⎣ −1 2 7 − 12 0 ⎥⎦ ⎢⎣1 0 1 0 ⎥⎦
⎡ −1⎤
⇒ x = ⎢⎢ 2 ⎥⎥ s, s ∈ R
⎢⎣ 1 ⎥⎦
故其特徵向量為 x1 = [ −1 2 1] 。
T

⎡7 − 6 −2 −1 0 ⎤ ⎡1 −2 −1 0 ⎤
⎢ −2 10 − 6 2 ⎥
0 ⎥ ⎯⎯⎯⎯ 基本列運算
→ ⎢⎢0 0 0 0 ⎥⎥
⎢
⎢⎣ −1 2 7 − 6 0 ⎥⎦ ⎢⎣0 0 0 0 ⎥⎦
⎡1 ⎤ ⎡ 2⎤
⇒ x = ⎢ 0 ⎥ s + ⎢⎢ 1 ⎥⎥ t , s, t ∈ R
⎢ ⎥
⎢⎣1 ⎥⎦ ⎢⎣ 0 ⎥⎦
因 λ2 = 6 為重根，有兩個特徵向量是正常的。
以 Gram-Schmidt 程序將上式的基底轉換為正交基底：
⎡1 ⎤
v1 = x1 = ⎢⎢ 0 ⎥⎥
⎢⎣1 ⎥⎦
⎡ 2⎤ ⎡1 ⎤ ⎡ 1 ⎤
x 2 i v1 ⎢ ⎥ 2⎢ ⎥ ⎢ ⎥
v 2 = x2 − v1 = ⎢ 1 ⎥ − ⎢ 0 ⎥ = ⎢ 1 ⎥
v1 i v1 2
⎢⎣ 0 ⎥⎦ ⎢⎣1 ⎥⎦ ⎢⎣ −1⎥⎦
故其特徵向量為 v1 = [1 0 1] 、 v 2 = [1 1 −1] 。
T T
本題特徵值為 λ1 = 12 、 λ2 = 6 、 λ3 = 6 ，其特徵向量分別為 x1 = [ −1 2 1] 、
T
x 2 = [1 0 1] 、 x3 = [1 1 −1] 。
T T
█
題外話（有關特徵方程式 A − λ I = 0 的求解）找特徵值、特徵向量的過程，求解特
徵方程式是必要的、非常令人討厭的步驟。一句箴言：
『不要草率的直接將行列式值乘開！』
乘開後，除了加加減減整理多項式的程序很煩，容易出錯，最要命的是配方，有些
時候就是配不出來。筆者建議先用基本列運算、基本行運算，將行列式中弄一些零
元素出來，這樣作列展開（或行展開）時會清爽許多。例如
1− λ 2 () ( )
列： 1 + 2 3−λ 3−λ ( ) ()
行： 2 − 1 3−λ 0
= 0 ⎯⎯⎯⎯ → = 0 ⎯⎯⎯⎯ → =0
2 1− λ 2 1− λ 2 −1 − λ
若所有根都是有理數，以上作法可以一路到底，直接從對角元素看出答案。當然，
如果有無理根或虛根來攪局，只好打起精神來，拼配方技巧了。 █
以下是幾個有關特徵值與特徵向量的重要性質。

定理 6-6
若 A ∈ M n×n 為奇異矩陣，則 λ = 0 為 A 的特徵值；反之亦然。
【證明】
考慮特徵方程式 det ( A − λ I ) = 0，將 λ = 0 代入，則為 det ( A ) = 0；反之，由 det ( A ) = 0
可得 λ = 0 為 det ( A − λ I ) = 0 之一個解。 █
定理 6-7
若 λ1 , λ2 ,…, λn 為 A ∈ M n×n 的 n 個特徵值，則 det ( A ) = λ1 × λ2 × × λn 。
【證明】
考慮特徵方程式 det ( A − λ I ) = ( λ − λ1 )( λ − λ2 ) ( λ − λn ) = 0 ，將 λ = 0 代入，則得到
det ( A ) = λ1 × λ2 × × λn 。 █
定理 6-8
若 λ 為 A ∈ M n×n 之特徵值，且 det ( A ) ≠ 0 ，則 1 λ 為 A −1 的特徵值。
【證明】
由已知條件： Ax = λ x ，兩邊乘上 A −1 ： A −1Ax = x = λ A −1x ⇒ A −1x = λ1 x 。
det ( A ) ≠ 0 告訴我們 A −1 存在，且 λ ≠ 0 。 █
定理 6-9
若 λ1 , λ2 ,…, λk 為 A ∈ M n×n 之相異特徵值，則其特徵向量 x1 , x 2 ,…, x k 互相獨立。
【證明】
x k = c1x1 + c2 x 2 + + ck −1x k −1 (6-11)
其中 c1 , c2 ,…, ck −1 ∈ R ，則
Ax k = c1Ax1 + c2 Ax 2 + + ck −1Ax k −1
⇒ λk x k = c1λ1x1 + c2 λ2 x 2 + + ck −1λk −1x k −1
將該式與(6-11)的 λk 倍，則

0 = c1 ( λ1 − λk ) x1 + c2 ( λ2 − λk ) x 2 + + ck −1 ( λk −1 − λk ) x k −1
因 λ1 , λ2 ,…, λk 互不相等，故
c1 = c2 = = ck −1
即 x k 獨立於 {x1 , x 2 ,…, x k −1} ，我們沒有特意排序，故 x1 , x 2 ,…, x k 互相獨立。 █
題外話（與 det ( A ) ≠ 0 相關的敘述）以下有關 A ∈ M n×n 的敘述散在各課題的討論，
雖然涉及不同名詞，但數學意涵完全一樣：
(1) A 不是奇異矩陣（nonsingular）
。
(2) Ax = 0 只有瑣碎解（trivial solution）

。
(3) A 與 I n 列等價（row equivalent）
。
(4) Ax = b 有唯一解。
(5) det ( A ) ≠ 0 。
(6) rank A = n 。
(7) nullity A = 0 。
(8) A 的列向量線性獨立。
(9) A 的行向量線性獨立。
(10) A 的特徵值不為零， λ ≠ 0 。 █
6.5 矩陣對角化
本節對一個特殊矩陣有興趣：對角矩陣。就特徵值與特徵向量的觀點，對角矩陣非常優
秀：其對角元素就是特徵值： λi = aii , i = 1,…, n ，而特徵向量就是自然基底向量： ei ， ei
為單位矩陣 I n 的第 i 行向量， i = 1,… , n 。
例題 6-14 （對角矩陣的特徵值、特徵向量）
令

⎡2 0 0⎤
A = ⎢⎢ 0 4 0 ⎥⎥
⎢⎣ 0 0 3⎥⎦
【解答】
2−λ 0 0
0 4−λ 0 =0 ⇒ ( 2 − λ )( 4 − λ )( 3 − λ ) = 0
0 0 3−λ
⇒ λ = 2, 4, 3
⎡2 − 2 0 0 0⎤ ⎡0 0 0 0⎤
⎢ 0 4−2 0 0 ⎥⎥ → ⎢⎢ 0 1 0 0 ⎥⎥
⎯⎯⎯⎯
基本列運算
⎢
⎢⎣ 0 0 3− 2 0 ⎥⎦ ⎢⎣ 0 0 1 0 ⎥⎦
⎡1 ⎤
⇒ x = ⎢⎢0 ⎥⎥ s, s ∈ R
⎢⎣0 ⎥⎦
故其特徵向量為 x1 = e1 = [1 0 0] 。
T
其它特徵向量分別為： x 2 = e 2 = [ 0 1 0] 、 x3 = e3 = [ 0 0 1] 。
T T
█
以下討論的定義、性質只有一個目的：將一般矩陣與對角矩陣搭上線，好利用對角
矩陣一眼就可以看出特徵值與特徵向量的好特性。
定義（相似矩陣）
矩陣 A, B ∈ M n×n ，若存在非奇異矩陣 P ，使得
B = P −1AP
則稱 A 、 B 為相似矩陣（similar matrix）。 █
定義（可對角化矩陣）
若矩陣 A ∈ M n×n 與對角矩陣相似，則稱 A 為可對角化（diagonalizable）
。 █

例題 6-15 （驗證相似矩陣）
令
⎡1 2⎤ ⎡3 0 ⎤ ⎡1 1 ⎤
A=⎢ ⎥ , B=⎢ ⎥ , P=⎢ ⎥
⎣2 1⎦ ⎣0 −1⎦ ⎣1 −1⎦
試驗證 A 、 B 為相似矩陣。
【解答】
驗算這些矩陣
1 1
P = = −2 ≠ 0
1 −1
⎡1 2 ⎤ ⎡1 1 ⎤ ⎡3 −1⎤
AP = A = ⎢ ⎥⎢ ⎥=⎢ ⎥
⎣ 2 1 ⎦ ⎣1 −1⎦ ⎣3 1 ⎦
⎡1 1 ⎤ ⎡ 3 0 ⎤ ⎡3 −1⎤
PB = ⎢ ⎥⎢ ⎥=⎢ ⎥
⎣1 −1⎦ ⎣ 0 −1⎦ ⎣3 1 ⎦
我們有
PB = AP ⇒ B = P −1AP
故 A 、 B 相似。且 A 為可對角化矩陣。 █
定理 6-10
若 A, B ∈ M n×n ，且存在非奇異矩陣 P ∈ M n×n 使得 B = P −1AP ，則 A 、 B 有相同的特
徵值，而且 x B = P −1x A ，其中 x A 、 x B 分別為 A 、 B 之特徵向量。
【證明】
若已知 λ 、 x A 為 A 之特徵值、特徵向量，即 Ax A = λ x A 。
等號兩邊同乘 P −1 ，並令 P −1x A = y ，即 x A = Py ，則
Ax A = λ x A ⇒ P −1APy = λ P −1Py ⇒ By = λ y
故知 λ 也是 B 之特徵值，且其特徵向量 x B = y = P −1x A 。
倒過來，若已知 λ 、 x B 為 B 之特徵值、特徵向量，則
Bx B = λ x B ⇒ P −1APx B = λ x B ⇒ PP −1APx B = APx B = λ Px B

故知 λ 也是 A 之特徵值，且其特徵向量 x A = Px B 。 █
例題 6-16 （驗證相似矩陣的特徵值、特徵向量）
令
⎡1 2⎤ ⎡3 0 ⎤ ⎡1 1 ⎤
A=⎢ ⎥ , B=⎢ ⎥ , P=⎢ ⎥
⎣2 1⎦ ⎣0 −1⎦ ⎣1 −1⎦
因 B = P −1AP ，故知 A 、 B 為相似矩陣。試驗證 A 、 B 特徵值、特徵向量之關係。
【解答】
我們已於例題 6-12 找出 A 的特徵值與特徵向量：
⎡1⎤ ⎡ 1 ⎤
λA = 3, − 1, xA = ⎢ ⎥, ⎢ ⎥
⎣1⎦ ⎣ −1⎦
B 是對角矩陣，其的特徵值與特徵向量可目視而得：
⎡1 ⎤ ⎡ 0 ⎤
λB = 3, − 1, xB = ⎢ ⎥ , ⎢ ⎥
⎣0 ⎦ ⎣1 ⎦
驗證 x A = Px B ， x B = P −1x A ：
1 ⎡ −1 −1⎤
P −1 = − ⎢ ⎥
2 ⎣ −1 1 ⎦
⎡1 1 ⎤ ⎡1 0 ⎤ ⎡1 1 ⎤
PX B = ⎢ ⎥⎢ = = XA
⎣1 −1⎦ ⎣0 1 ⎥⎦ ⎢⎣1 −1⎥⎦
1 ⎡ −1 −1⎤ ⎡1 1 ⎤ ⎡1 0 ⎤
P −1X A = − ⎢ ⎥⎢ ⎥=⎢ ⎥ = XB
2 ⎣ −1 1 ⎦ ⎣1 −1⎦ ⎣ 0 1 ⎦
這驗證了定理 6-10 介紹相似矩陣特徵向量的關係。 █
定理 6-11 (將矩陣對角化的方法)
若 A ∈ M n×n 為可對角化矩陣，則 A 有 n 個相互獨立的特徵向量，反之亦然。
也就是說，若 A 為可對角化，則以下等式成立
P −1AP = D
其中， P 之行向量為由 A 之特徵向量， D 為由 A 之特徵值為對角元素的對角矩陣。
【證明】

（若的部分）若 A ∈ M n×n 為可對角化矩陣，則存在 P = [p1 , p 2 , , pn ] ，
det ( P ) ≠ 0 ，使得
P −1AP = D ⇒ AP = PD = DP (6-12)
其中， pi , i = 1,…, n 為 P 之第 i 行向量， D = diag ( a11 , a22 ,… , ann ) 為對角矩陣。(6-12)
可以 P 之各行拆開為 n 個等式
Ap1 = a11p1
Ap 2 = a22p 2
Ap n = ann p n
此證明 a11 , a22 ,…, ann 為 A 之特徵值， p1 , p 2 ,…, p n 為 A 之特徵向量，又 det ( P ) ≠ 0 ，
故 {p1 , p 2 ,…, p n } 獨立。

（唯若的部分）令 P = [ x1 , x 2 , , x n ] ， D = diag ( λ1 , λ2 ,…, λn ) ，其中，λ1 , λ2 ,… , λn ，
x1 , x 2 ,…, x n 分別為 A 之特徵值、特徵向量。因 {x1 , x 2 ,…, x n } 獨立故 det ( P ) ≠ 0 ，則
AP = PD = DP ⇒ P −1AP = D
故 A 為可對角化矩陣。 █
例題 6-17 （驗證可對角化矩陣）
令
⎡1 2 ⎤
A=⎢ ⎥
⎣5 4 ⎦
試驗證 A 為可對角化矩陣。
【解答】
1− λ 2
= 0 ⇒ λ = 6, − 1
5 4−λ

⎡1 − 6 2 0⎤ ⎡1 − 52 0⎤ ⎡2⎤
⎢ 5 ⎯⎯⎯⎯
基本列運算
→⎢ ⎥ ⇒ x = ⎢ 5 ⎥ s, s ∈ R
⎣ 4 − 6 0 ⎥⎦ ⎣0 0 0⎦ ⎣1 ⎦
(2)令 λ1 = −1 ，處理以下線性系統：
⎡1 − ( −1) 2 0⎤ ⎡1 1 0 ⎤ ⎡ −1⎤
⎢ ⎥ ⎯⎯⎯⎯
基本列運算
→⎢ ⎥ ⇒ x = ⎢ ⎥ s, s ∈ R
⎣ 5 4 − ( −1) 0 ⎦ ⎣0 0 0⎦ ⎣1⎦
得到
⎡ 2 −1⎤ 2 −1 3
P = ⎢5 ⎥, P = 5 = ≠0
⎣1 1 ⎦ 1 1 5
因 A 有 2 個獨立特徵向量，故 A 為可對角化矩陣。其實， dim A = 2 ，且找到 2 個
相異實數特徵值，就可以下 A 為可對角化矩陣的結論。 █
題外話（相似矩陣中 P 的前後位置）在相似矩陣的定義、定理 6-10、以及定理 6-11
『到底應該是 P 擺前面，還是 P −1 擺前面？』以下是筆者學生時代

中，同學會頭痛：
發展的記憶法，滿管用的。記住『 P ≡ x ≡ 特徵向量』以及『 D ≡ λ ≡ 特徵值』
，然後
回憶以下兩個式子：
Ax = λ x
AP = DP
並隨時提醒自己『特徵向量 x 擺在 A 的後面』，這就夠了。以下是真正要記的公式
AP = PD = DP
P −1AP = D
A = PDP −1
█
題外話（可對角化矩陣之超越函數）矩陣的可對角化性質可以豐富矩陣運算：從四
則運算擴展到指數、對數、與三角函數等超越函數的運算。所有的這些故事根源於
兩個地方：(1)對角矩陣的 n 次方很容易求得，(2)泰勒展開式。
令 D = diag ( a11 , a22 ,…, ann ) ∈ M n×n 為對角矩陣，很容易可以驗證，其 k ∈ R 次方為

Dn = diag a11
k
( k
, a22 ,…, ann
k
)
另外，以下是我們會用到的泰勒展開式（Taylor expansion）
：
1 2 1 3
ex = 1 + x + x + x +
2! 3!
1 1 1
sin x = x − x 3 + x 5 − x 7 +
3! 5! 7!
若 A ∈ M n×n 為可對角化矩陣，即存在對角矩陣 D = diag ( λ1 , λ2 ,… , λn ) 與非奇異矩陣
P 與，使得
A = PDP −1
(
A k = PDk P −1 = P diag λ1k , λ2k ,…, λnk P −1 )
e A = Pe D P −1 = P diag ( e λ1
, eλ2 ,… , eλn )P −1
ln A = P ( ln D ) P −1 = P diag ( ln λ1 ,ln λ2 ,… ,ln λn ) P −1 , λi > 0,1 = 1,… , n

sin A = P ( sin D ) P −1 = P diag ( sin λ1 ,sin λ2 ,…,sin λn ) P −1
同學可以自行練習以上各式的詳細推導。基本原則是，所有對 A 的運算都會直接
反應到 D 上（與 P 、 P −1 無關）

，而對 D 的運算就直接寫在對角元素上即可。 █
例題 6-18 （可對角化矩陣之超越函數）
令
⎡1 2 ⎤
A=⎢ ⎥
⎣5 4 ⎦
試求(1) A k ；(2) e A 。
【解答】
求得 A 之特徵值與特徵向量：
⎡ 2 ⎤ ⎡ −1⎤
λ = 6, − 1, x = ⎢ ⎥, ⎢ ⎥
⎣5⎦ ⎣ 1 ⎦

⎡6 0 ⎤ ⎡ 2 −1⎤ 1 ⎡ 1 1⎤
D=⎢ ⎥ , P=⎢ ⎥, P −1 =
⎣ 0 −1⎦ ⎣5 1 ⎦ 7 ⎢⎣ −5 2 ⎥⎦
(1) A k
1 ⎡ 2 −1⎤ ⎡6 0 ⎤ ⎡ 1 1 ⎤ 1 ⎡ 2 2 ⎤ k 1 ⎡ 5 −2 ⎤
k
A k = PDk P −1 = ⎥ = 7 ⎢ 5 5 ⎥ 6 + 7 ⎢ −5 2 ⎥ ( −1)
k
⎢ ⎥
7 ⎣⎢ 5 1 ⎦⎥ ⎢ 0 k ⎢
( −1) ⎦⎥ ⎣ −5 2 ⎦ ⎣ ⎦ ⎣ ⎦
⎣
(2) e A
1 ⎡ 2 −1⎤ ⎡ e 0 ⎤ ⎡ 1 1 ⎤ 1 ⎡ 2 2 ⎤ 6 1 ⎡ 5 −2 ⎤ −1
6
e A = P e D P −1 = ⎢ ⎥⎢ ⎥= ⎢ ⎥ e + 7 ⎢ −5 2 ⎥ e
7 ⎢⎣ 5 1 ⎥⎦ ⎢⎣ 0 e −1 ⎦⎥ ⎣ −5 2 ⎦ 7 ⎣ 5 5 ⎦ ⎣ ⎦
題外話（有關 PDP −1 的計算）在矩陣對角化的課題裡，我們常常需要作 PDP −1 型式
的計算，過程有點煩。以下提供一個徒手計算時比較不會犯錯的方法。
假設我們要算出 PDQ 的結果，其中， P = ⎡⎣ pij ⎤⎦ 、Q = ⎡⎣ qij ⎤⎦ 、D = diag ( λ1 , λ2 ,… , λn ) ，
我們可以將整個結果寫成 n 項（每個 λi 一項）之和：
⎡ p1i ⎤
⎢p ⎥
第 i 項： λi ⎢ 2i ⎥ [ qi1 qi 2 qin ]
⎢ ⎥
⎢ ⎥
⎣ pni ⎦
例如
⎡ 2 −1⎤ ⎡e 0 ⎤ ⎡ 1 1 ⎤ 6 ⎡2⎤ ⎡ −1⎤

6
⎢5 1 ⎥ ⎢ ⎥
−1 ⎢ −5 2 ⎥
= e ⎢ ⎥ [1 1] + e −1 ⎢ ⎥ [ −5 2]
⎣ ⎦ ⎢⎣ 0 e ⎦⎥ ⎣ ⎦ ⎣5⎦ ⎣1⎦
⎡ 2 2 ⎤ 6 ⎡ 5 −2 ⎤ −1
=⎢ ⎥ e + ⎢ −5 2 ⎥ e
⎣5 5⎦ ⎣ ⎦
⎡ 2e + 5e
6 −1
2e − 2e −1 ⎤
6
=⎢ 6 −1
⎥
⎣⎢ 5e − 5e 5e6 + 2e−1 ⎦⎥
多算幾次就可以掌握這是怎麼一回事了。 █

對稱矩陣的對角化
有關矩陣對角化課題上，對稱矩陣（symmetric matrix）有一些非常管用的特性：(1)
對稱矩陣的特徵方程式全部是實數跟，(2)對稱矩陣一定為可對角矩陣，(3)對稱矩陣可
以找到正交特徵向量，(4)對稱矩陣的 P −1 = P T 。就計算的觀點，第(4)點最帥。
題外話（對稱矩陣）還是囉唆一點，複習一下對稱矩陣，免得有人快到終點站前，
才搔頭、不好意思地問：
『什麼是對稱矩陣？』
矩陣 A ∈ M n×n ，若 A T = A ，則稱 A 為對稱矩陣（symmetric matrix）。
以下都是對稱矩陣：
⎡1 0 0 ⎤ ⎡2 0 0 ⎤ ⎡ 3 −4 7 ⎤
⎡1 2⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
A=⎢ ⎥ , I = ⎢ 0 1 0 ⎥ , D = ⎢ 0 5 0 ⎥ , B = ⎢ −4 2 1 ⎥
⎣ 2 3 ⎦ ⎢⎣ 0 0 1 ⎥⎦ ⎢⎣ 0 0 −3⎥⎦ ⎢⎣ 7 1 5 ⎥⎦
對任何矩陣 S ∈ M m×n ， S T S 與 SS T 都是對稱矩陣。證明如下：
(S S ) ( ) ( SS ) = ( S )
T T T T
T
= ST ST = S T S, T T
S T = SS T
例如，
⎡1 4⎤
⎡1 2 3⎤ ⎢ ⎥ ⎡14 12 ⎤ ⎡ 2⎤ ⎡ 2 6⎤ ⎡ 2⎤
⎢ 4 1 2 ⎥ ⎢ 2 1 ⎥ = ⎢12 21⎥ , ⎢ 3 ⎥ [ 2 3] = ⎢ 6 9 ⎥ , [2 3] ⎢ ⎥ = [13]
⎣ ⎦ ⎢3 2⎥ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ 3⎦
⎣ ⎦
記得這個箴言：
『對稱矩陣與轉置有關！』 █
定理 6-12
若 A 為對稱矩陣，則其特徵方程式， f ( λ ) = det ( A − λ I ) = 0 ，只有實數根。 █
定理 6-13
若 A 為對稱矩陣，則 A 為可對角化矩陣。 █

定理 6-14 (特徵向量正交)
若 A 為對稱矩陣，則其相異特徵值之特徵向量互相正交。
【證明】
首先，需瞭解以下算式成立
Axiy = y T Ax = xT A T y = xi A T y
令 ( λ1 , x1 ) 、 ( λ2 , x 2 ) 為 A 之兩個特徵值、特徵向量，且 λ1 ≠ λ2 ，即以下兩式成立
Ax1 = λ1x1 , Ax 2 = λ2 x 2
( )
λ1 ( x1 ix 2 ) = ( λ1x1 )ix 2 = ( Ax1 )ix 2 = x1 i AT x 2 = x1 i( Ax 2 ) = x1 i( λ2 x 2 ) = λ2 ( x1 i x 2 )
⇒ ( λ1 − λ2 )( x1 ix 2 ) = 0
因 λ1 ≠ λ2 ，故 x1 ix 2 = 0 ，即該兩特徵向量正交。 █
題外話（正交向量的好處）若 {x1 , x 2 ,…, x n } ⊆ R n 正交，令
P = [ x1 x 2 xn ]
P T P = ⎡⎣ xi ix j ⎤⎦ = diag ( x1 i x1 , x 2 ix 2 , … , x n i x n )
若 x1 , x 2 ,…, x n 也都是正規化後的向量，即 xi = xi i xi = 1, i = 1,… , n ，則
P T P = ⎡⎣ xi ix j ⎤⎦ = diag ( x1 ix1 , x 2 i x 2 , … , x n ix n ) = I n
也就是說，若 {x1 , x 2 ,…, x n } ⊆ R n 為單模正交基底，則 P T = P −1 。 █
定義（正交矩陣）
矩陣 A ∈ M n×n ，若 A T = A −1 ，則稱 A 為正交矩陣（orthogonal matrix）
。 █

定義（可正交對角化矩陣）
矩陣 A ∈ M n×n ，若存在正交矩陣 P 與對角矩陣 D ，使得 P −1AP = D ，則稱 A 為可正
交對角化矩陣（orthogonally diagonalizable）
。 █
定理 6-15 (對稱矩陣為可正交對角化矩陣)
若 A 為對稱矩陣，則其為可正交對角化矩陣，反之亦然。
【證明】
（唯若的部分）若 A 為可正交對角化矩陣，則存在正交矩陣 P 與對角矩陣 D ，使
( ) = ( PDP )
T T
P −1AP = D ⇒ A T = PDP −1 T
= PDP T = PDP −1 = A
得證 A 為對稱矩陣。 █
例題 6-19 （驗證對稱矩陣為可正交對角化）
令
⎡ 7 −2 −1⎤
A = ⎢⎢ −2 10 2 ⎥⎥
⎢⎣ −1 2 7 ⎥⎦
試驗證 A 可正交對角化矩陣。
【解答】
(1)找 A 之特徵值
7−λ −2 −1 6−λ 0 6−λ

−2 10 − λ 2 =0 ⎯⎯⎯⎯
→
基本列運算
0 6−λ −12 + 2λ = 0
−1 2 7−λ −1 2 7−λ
6−λ 0 6−λ 6−λ 0 0
0 6−λ −12 + 2λ = 0 ⎯⎯⎯⎯
→
基本行運算
0 6−λ 0 =0
−1 2 7−λ −1 2 12 − λ
⇒ λ = 12, 6, 6
(2)找正交特徵向量
令 λ1 = 12 ，處理以下線性系統：

⎡ 7 − 12 −2 −1 0⎤ ⎡0 1 −2 0 ⎤
⎢ −2 10 − 12 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯ 基本列運算
⎢
⎢⎣ −1 2 7 − 12 0 ⎥⎦ ⎢⎣1 0 1 0 ⎥⎦
⎡ −1⎤
⇒ x = ⎢⎢ 2 ⎥⎥ s, s ∈ R
⎢⎣ 1 ⎥⎦
故其特徵向量為 x1 = [ −1 2 1] 。
T
令 λ2 = 6 ，處理以下線性系統：
⎡7 − 6 −2 −1 0⎤ ⎡1 −2 −1 0 ⎤
⎢ −2 10 − 6 2 0 ⎥⎥ → ⎢⎢0 0 0 0 ⎥⎥
⎯⎯⎯⎯基本列運算
⎢
⎢⎣ −1 2 7−6 0 ⎥⎦ ⎢⎣0 0 0 0 ⎥⎦
⎡1 ⎤ ⎡ 2⎤
⇒ x = ⎢ 0 ⎥ s + ⎢⎢ 1 ⎥⎥ t ,
⎢ ⎥ s, t ∈ R
⎢⎣1 ⎥⎦ ⎢⎣ 0 ⎥⎦
因 λ2 = 6 為重根，有兩個特徵向量是正常的。
以 Gram-Schmidt 程序將上式的基底轉換為正交基底：
⎡1 ⎤
v1 = x1 = ⎢⎢ 0 ⎥⎥
⎢⎣1 ⎥⎦
⎡ 2⎤ ⎡1 ⎤ ⎡ 1 ⎤
x 2 i v1 ⎢ ⎥ 2⎢ ⎥ ⎢ ⎥
v 2 = x2 − v1 = ⎢ 1 ⎥ − ⎢ 0 ⎥ = ⎢ 1 ⎥
v1 i v1 2
⎣⎢ 0 ⎦⎥ ⎣⎢1 ⎦⎥ ⎣⎢ −1⎦⎥
故其特徵向量為 v1 = [1 0 1] 、 v 2 = [1 1 −1] 。
T T
(3)將特徵向量正規劃
x1 = ( −1, 2,1)i( −1, 2,1) = 6
v1 = (1,0,1)i(1,0,1) = 2
v2 = (1,1, −1)i(1,1, −1) = 3
得到

⎡− 1 1 1 ⎤ ⎡− 1 2 1 ⎤
⎢ 6 2 3 ⎥ ⎡12 0 0 ⎤ ⎢ 6 6 6 ⎥
P = ⎢ 26 0 1 ⎥, D = ⎢⎢ 0 6 0 ⎥⎥ , P T = ⎢ 12 0 1 ⎥
⎢ 3 ⎥ ⎢ 2 ⎥
⎢ 1 1 − 13 ⎥ ⎢⎣ 0 0 6 ⎥⎦ ⎢ 1 1 − 13 ⎥
⎣ 6 2 ⎦ ⎣ 3 3 ⎦
驗證
⎡− 1 2 1 ⎤ ⎡− 1 1 1 ⎤
⎢ 6 6 6 ⎥⎢ 6 2 3 ⎥ ⎡1 0 0 ⎤
P T P = ⎢ 12 0 1 ⎥⎢ 2
2 ⎥⎢ 6
0 1 ⎥
3 ⎥
= ⎢⎢0 1 0 ⎥⎥
⎢
⎢ 1 1 − 13 ⎥ ⎢ 16 1 − 13 ⎥ ⎣⎢0 0 1 ⎦⎥
⎣ 3 3 ⎦⎣ 2 ⎦
⎡− 1 1 ⎤ ⎡ 1 1 ⎤
−2 −1⎤ ⎢ − 6
2 1
⎢ 6 6 6 ⎥⎡ 7 2 3 ⎥ ⎡12 0 0 ⎤
P T AP = ⎢ 12 0 1 ⎥ ⎢ −2 10 2 ⎥⎥ ⎢ 26 0 1 ⎥ = ⎢⎢ 0 6 0 ⎥⎥
⎢ 2 ⎥⎢ ⎢ 3 ⎥
⎢ 1 1 − 13 ⎥ ⎣⎢ −1 2 7 ⎦⎥ ⎢ 1 1 − 13 ⎥ ⎣⎢ 0 0 6 ⎦⎥
⎣ 3 3 ⎦ ⎣ 6 2 ⎦
█

CH6線性轉換與特徵值問題

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

CH6線性轉換與特徵值問題

Uploaded by

Copyright:

Available Formats

第六章 線性轉換與特徵值問題

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 1 / 37

題外話（線性運算子） 若線性轉換 L 的定義域與值域是相同的向量空間，如

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 2 / 37

其中 A ∈ M m×n 。試驗證 L 是否為線性轉換。

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 3 / 37

題外話（應用定理 6-2） 定理 6-2 告訴我們，只要知道基底向量的轉換結果，

我們稱 A LS 為基底 S 的轉換矩陣（matrix of a linear transformation）

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 4 / 37

( b ) 一樣的作法， ⎡⎣( s, t )⎤⎦ S 為以下線性系統的解

題外話（與座標變換比較） 若 L : V → W 為線性轉換，S = { v1 , v 2 ,…, v n } 為 V 的基底，

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 5 / 37

對從向量空間 V 映射至向量空間 W 的轉換 L : V → W ，在本節，我們關心 V 、 W 的大小

若值域與對應域相等， range L = W ，則稱 L 為映成（onto）

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 6 / 37

請參考圖 6-1，說明兩種不能成為函數的映射狀況。另外，圖 6-2 呈現一對一、映

題外話（一對一且映成的重要性） 檢視圖 6-2 之各對應圖，若我們把對應的箭頭倒

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 7 / 37

range L = span {(1,0,1) , ( 0,1, −1)} （基底為 A 中帶頭一相對行之行向量）

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 8 / 37

( c ) dim ( ker L ) = 2 ≠ 0 ，故 L 並非一對一。

range L = span {(1,0,1) , ( 0,1,1) , ( 0,1,0 )}

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 9 / 37

( c ) dim ( ker L ) = 1 ≠ 0 ，故 L 並非一對一。

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 10 / 37

轉換矩陣： A S 、 AT 、 A LS 、 [ A LS ]T 、 A −S1 、 AT−1 。

座標 ← 向量： [u ]S = A −S1u 、 ⎡⎣ L ( u ) ⎤⎦ = AT−1 L ( u ) ；

題外話（轉換矩陣之符號意義） 我們來解讀一下 [ A LS ]T 符號的意義。 A 表示這是一

個轉換矩陣，下標的 L 表示這是一個線性轉換（若沒有 L 則為座標變換）

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 11 / 37

則稱 [ A LS ]T 為表示線性轉換 L 之轉換矩陣（matrix representing L with respect to

the bases S and T ）

題外話（推導 [ A LS ]T ） 在上面的關係式，沒有提供 [ A LS ]T ，它可以由基本轉換矩陣

[u ]T = AT−1u = AT−1A S [u ]S ⇒ [ A S ]T = AT−1A S

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 12 / 37

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 13 / 37

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 14 / 37

題外話 (6-6)的意義為，我們在向量空間 V 的基底 S 上已經（辛苦地）建立一個表示

(2)求 [ A LS ]S = A −S1A LS ，處理以下增廣矩陣

(3)求 [ A LT ]T = AT−1A LT ，處理以下增廣矩陣

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 15 / 37

(4)求 [ AT ]S = A −S1AT ，處理以下增廣矩陣

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 16 / 37

並不是所有向量空間 V 中的向量都有(6-7)的性質，事實上，最多只有 dim V 個向量

我們的興趣是，找出方陣 A 的特徵值與特徵向量。一共最多有 n 對，還記得？

⎡ 1 2 ⎤ ⎡1⎤ ⎡1⎤ ⎡1 2⎤ ⎡ 1 ⎤ ⎡1⎤

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 17 / 37

這個系統一定有 x = 0 這個瑣碎解，在這個情況下，特徵值 λ 可以為任何實數值，

若只有瑣碎解 x = 0 ，則該 λ 不是特徵值；反之若有非瑣碎解，則 λ 為特徵值，而

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 18 / 37

題外話（特徵值空間） 在例題 6-11 的 ( b ) λ2 = 6 ，以下向量空間的向量都是

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 19 / 37

若與 ( a ) λ1 = 12 得到的特徵向量 x1 = [ −1 2 1] 比較，我們可以發現， x1 也正交於

w1 、 w 2 。它的門道在於 A 為對稱矩陣（symmetric matrix）

其中，多項式 f ( λ ) = det ( A − λ I ) 稱為 A 的特徵多項式（characteristic polynomial）

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 20 / 37

最多有 n 個實數根，所以呢， A 最多有 n 個特徵值。

其實數根， λ1 , λ2 ,…, λk , k ≤ n ，即為特徵值。

若有基底向量數目多於一，則以 Gram-Schmidt 程序找正交基底。

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 21 / 37

7−λ −2 −1 6−λ 0 6−λ

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 22 / 37

題外話（有關特徵方程式 A − λ I = 0 的求解） 找特徵值、特徵向量的過程，求解特

©2009 陳欣得（線性代數） 6 線性轉換與特徵值問題 23 / 37

第六章線性轉換與特徵值問題

題外話（線性運算子）若線性轉換 L 的定義域與值域是相同的向量空間，如

題外話（應用定理 6-2）定理 6-2 告訴我們，只要知道基底向量的轉換結果，

題外話（與座標變換比較）若 L : V → W 為線性轉換，S = { v1 , v 2 ,…, v n } 為 V 的基底，

題外話（一對一且映成的重要性）檢視圖 6-2 之各對應圖，若我們把對應的箭頭倒

題外話（轉換矩陣之符號意義）我們來解讀一下 [ A LS ]T 符號的意義。 A 表示這是一

題外話（推導 [ A LS ]T ）在上面的關係式，沒有提供 [ A LS ]T ，它可以由基本轉換矩陣

題外話（特徵值空間）在例題 6-11 的 ( b ) λ2 = 6 ，以下向量空間的向量都是

題外話（有關特徵方程式 A − λ I = 0 的求解）找特徵值、特徵向量的過程，求解特

題外話（與 det ( A ) ≠ 0 相關的敘述）以下有關 A ∈ M n×n 的敘述散在各課題的討論，

題外話（相似矩陣中 P 的前後位置）在相似矩陣的定義、定理 6-10、以及定理 6-11

題外話（有關 PDP −1 的計算）在矩陣對角化的課題裡，我們常常需要作 PDP −1 型式

題外話（正交向量的好處）若 {x1 , x 2 ,…, x n } ⊆ R n 正交，令