Professional Documents
Culture Documents
Vektorski prostori
∗*∗
Navedimo neke primjere vektorskih prostora koje smo upoznali u prijašnim pred-
metima. Na primjer, skup Mmn svih matrica tipa m × n čini vektorski prostor, uz
operacije matričnoga zbrajanja i množenja skalara s matricom.
Tako i vektor-stupci, odnosno vektor retci duljine n čine vektorski prostor, jer su
to matrice tipa n × 1 odnosno 1 × n .
Prostori V 1 , V 2 , V 3 vektora na pravcu, ravnini i u prostoru E3 , uz standardno
definirane operacije zbrajanja i množenja sa skalarom takoder - su vektorski prostori.
Nazivamo ih klasičnim vektorskim prostorima.
Vektorski prostor mogu činiti i funkcije. Neka je X skup svih funkcija definiranih
na intervalu [a, b] s vrijednostima u R . Operacije definiramo na način
(x + y)(t) := x(t) + y(t),
(α x)(t) := α x(t).
Svojstva VP1 – VP8 vrijede jer se svode na analogna svojstva za skup realnih
brojeva.
∗*∗
-
Vektorski podprostor. Pri navodenju narednih primjera često ćemo biti u situaciji
da promatramo neki podskup gore navedenih vektorskih prostora te se pitamo čini li i
taj podskup vektorski prostor? S tim je u vezi sljedeća definicija.
Neka je (X, +, ·) vektorski prostor. Podskup W ⊂ X čini vektorski podprostor
prostora X ako je on vektorski prostor uz iste operacije koje su definirane na prostoru
X.
Da bi neki podskup vektorskog prostora bio vektorski podprostor, nužno je i do-
voljno da linearne kombinacije vektora iz tog podskupa ostaju u njemu:
∗*∗
∗*∗
Po ovoj konstrukciji baze zaključujemo da se broj vektora u bazi podudara s di-
menzijom prostora. No, ta tvrdnja nije posve očita pa bi bilo korisno dati detaljniji
dokaz. Naime, baza ima beskonačno mnogo i nije očito da će svake dvije imati isti broj
elemenata.
Teorem 2. Svake dvije baze u vektorskom prostoru X imaju isti broj elemenata.
Taj se broj podudara s dimenzijom prostora.
DOKAZ. Neka je n dimenzija prostora. Broj vektora u bazi mora biti manji ili jednak
n jer su njezini elementi linearno nezavisni vektori. Pretpostavimo da postoji baza
v1 , . . . , vm kod koje je m < n .
Neka su w1 , . . . , wn linearno nezavisni vektori toga prostora. (Takav skup postoji
jer je n dimenzija prostora.) Budući da je X = L(v1 , . . . , vm ) , postoje brojevi (aij )
takvi da vrijedi
w1 = a11 v1 + . . . + am1 vm ,
..
.
wn = a1n v1 + . . . + amn vm .
Promotrimo sad linearnu kombinaciju vektora w1 , . . . , wn . Ona ima oblik
x1 w1 + . . . + xn wn = (x1 a11 + . . . + xn a1n )v1 + . . . + (x1 am1 + . . . + xn amn )vm
(pomnožimo gornje jednakosti redom s x1 , . . . , xn i zbrojimo ih). Može li ova kombi-
nacija iščezavati na netrivijalan način? Promotrimo sustav jednadžbi
a11 x1 + . . . + a1n xn = 0,
..
.
am1 x1 + . . . + amn xn = 0.
Ovo je homogeni sustav s m jednadžbi i n nepoznanica. Kako je m < n , takav sustav
uvijek ima netrivijalno rješenje (x1 , . . . , xn ) . To znači da postoji linearna kombinacija
x1 w1 + . . . + xn wn
koja iščezava na netrivijalan način, pa su w1 , . . . , wn linearno zavisni, protivno pret-
postavci.
Time smo dobili proturječje. Pretpostavka m < n nije stoga istinita i mora biti
m = n.
Iskažimo odmah i jednu važnu posljedicu ovoga teorema.
∗*∗
Interesantno je da vrijedi i obrat teorema 3. Ako ne želimo provjeravati linearnu
nezavisnost, onda možemo iskoristiti ovaj teorem:
∗*∗
Po ova dva teorema, pokazali smo da je skup v1 , . . . , vk baza u prostoru X ako
vrijede bilo koja dva od sljedeća tri uvjeta:
• k = dim X ,
• v1 , . . . , vk su linearno nezavisni,
• v1 , . . . , vk razapinju prostor X .
Treće je svojstvo u tom slučaju posljedica odabrana dva.
∗*∗
Navedimo sad još neke načine konstruiranja vektorskih prostora.
1
engl. vector space, njem. Vektorraum, franc. l’espace vectoriel, rus. vektornoe prostranstvo.
2 1. VEKTORSKI PROSTORI
Polje. U definiciji vektorskog prostora važnu ulogu igra i polje skalara. Prisjetimo
se definicije polja.
Neprazan skup K zajedno s dvije binarne operacije, zbrajanjem + i množenjem
· jest polje, ako vrijedi:
a) (K, +) je komutativna grupa (znači, ima nulu kao neutralni element)
b) (K \ {0}, · ) je komutativna grupa s obzirom na množenje (neutralni element
označavamo s 1 ),
c) za sve λ , µ , ν ∈ K vrijedi λ (µ + ν ) = λ µ + λ ν (distributivnost zbrajanja prema
množenju).
Polje označavamo kao trojac (K, +, ·) , ili kraće samo kao K ako su pripadajuće
dvije binarne operacije poznate.
Elemente nekog polja K (kod nas najčešće R ili C ) zvat ćemo skalarima. Skalar
je dakle drugi naziv za “broj”.
Sad možemo iskazati opću definiciju vektorskog prostora.
Vektorski prostor (X, +, ·) nad zadanim poljem K sastoji se od skupa vektora X
i dviju algebarskih operacija, zbrajanja vektora ( + ) i množenja vektora skalarom ( · )
tako da vrijedi:
1) zbroj dvaju vektora iz X pripada opet skupu X ,
2) umnožak bilo kojeg skalara λ ∈ K i vektora x ∈ X jest vektor λ · x koji pripada
skupu X . (U nastavku ćemo ovaj umnožak pisati bez znaka operacije: λ x .)
Pri tom ove operacije moraju imati svojstva:
a) (X, +) je aditivna Abelova grupa,
b) operacije množenja skalara u polju K i množenja skalara s vektorima u X su
-
uskladene, vrijedi
λ (µ x) = (λ µ )x, 1x = x,
za sve λ , µ ∈ K i x ∈ X ;
c) vrijede zakoni distribucije:
(λ + µ )x = λ x + µ x, λ (x + y) = λ x + λ y,
za sve λ , µ ∈ K i x, y ∈ X .
Operacija množenja · u vektorskom prostoru (X, +, ·) odnosi se na množenje
skalara iz K s vektorima iz X i ne smije se brkati s operacijom množenja skalara u
polju K , iako se označavaju na isti način.
∗*∗
Navedimo neke primjere vektorskih prostora nad nestandardnim poljima.
Primjer 11. Skup realnih brojeva R nad poljem R (nad samim sobom) je jed-
nodimenzionalan. S druge strane, isti skup R nad poljem racionalnih brojeva je
beskonačno-dimenzionalan. Npr. ako je π = 3.14 . . . Ludolphov broj, onda se poka-
zuje da je beskonačan skup 1, π , π 2 , . . . linearno nezavisan (tj. svaki njegov konačan
podskup je linearno nezavisan). Razlog je taj što je broj π transcendentan, tj. ne
može se dobiti kao nultočka nekog netrivijalnog polinoma (tj. P(x) 6≡ 0 ) s racionalnim
koeficijentima.
Primjer 12. Spomenimo i primjere vektorskih prostora koji imaju konačno mnogo
elemenata. Takav je npr. prostor X = Z2 × Z2 nad poljem K = Z2 , koji ima četiri
elementa (vektora). Njegova dimenzija jednaka je 2 . Zbroj bilo koja dva ista vektora
je nul-vektor. On ima ukupno tri netrivijalna podprostora. To su tri pravca kroz is-
hodište, a svaki pravac sastoji se od samo dva elementa. Općenitije, vektorski prostor
X = Zp × . . . × Zp ( k puta), gdje je p prost broj, je k -dimenzionalni vektorski prostor
nad poljem Zp . On ima konačno mnogo elemenata, ukupno pk .
∗*∗
Istaknimo sad najvažnije primjere vektorskih prostora realnih funkcija.
Prostor neprekinutih funkcija na otvorenom intervalu. Skup X svih nepre-
kinutih funkcija f : (a, b) → R , gdje je interval (a, b) učvršćen čini beskonačno-
dimenzionalni vektorski prostor nad poljem realnih brojeva. U beskonačnom slijedu ne-
prekinutih funkcija 1, x, x2 , . . . , xk , . . . , skup funkcija {1, x, x2 , . . . , xk } je linearno ne-
zavisan za svaki k , zato je i skup svih neprekinutih funkcija beskonačno-dimenzionalan.
Taj važan prostor označavamo sa C(a, b) i zovemo prostorom neprekinutih
funkcija na intervalu (a, b) . Ovdje se dopušta da bude a ili b beskonačno, npr.
C(0, ∞) . Primijetimo da neprekinute funkcije definirane na otvorenom intervalu mogu
imati singularitet na rubu intervala, kao npr. funkcija 1/x ∈ C(0, 1) .
Prostor jednoliko neprekinutih funkcija na zatvorenom intervalu. Sljedeći
primjer vektorskog prostora, takoder - beskonačno-dimenzionalni, je prostor nepreki-
nutih funkcija na zatvorenom intervalu [a, b] . Označavamo ga sa C[a, b] . Svaka
funkcija neprekinuta na zatvorenom intervalu je uniformno (jednoliko) neprekinuta na
tom intervalu: za svaki ε > 0 postoji δ > 0 tako da za sve x1 , x2 ∈ [a, b] iz uvjeta
|x1 − x2 | 6 δ slijedi |f (x1) − f (x2 )| 6 ε .
Zato C[a, b] zovemo prostorom uniformno neprekinutih funkcija. Neprekinuta
-
funkcija definirana na zatvorenom intervalu je uvijek omedena, pa funkcije iz C[a, b]
ne mogu imati singularitet, za razliku od funkcija iz prostora C(a, b) . Lako se vidi
da je C[a, b] ⊂ C(a, b) , tj. svaka funkcija f : [a, b] → R ujedno definira funkciju
f : (a, b) → R .
Prostori neprekinuto diferencijabilnih funkcija. Na sličan način može se defi-
nirati vektorski prostor C1 (a, b) svih funkcija f : (a, b) → R koje su svuda diferenci-
jabilne i njihova derivacija f ′ je neprekinuta. Analogno i skup C2 (a, b) svih funkcija
y = f (x) za koje su f , f ′ i f ′′ neprekinute (zapravo, dovoljno je zahtijevati samo
neprekinutost od f ′′ ).
Slično definiramo i prostor C1 [a, b] kao skup svih funkcija f ∈ C1 (a, b) takvih da
se derivacija f ′ : (a, b) → R može proširiti do neprekinute funkcije f ′ : [a, b] → R .
Poanta je u tome da su za f ∈ C1 [a, b] funkcije f i f ′ neprekinute na zatvorenom
-
intervalu (dakle i omedene), za razliku od funkcija iz C1 (a, b) . Slično definiramo
2
C [a, b] , kao vektorski prostor funkcija čije se prve i druge derivacije mogu proširiti
s intervala (a, b) do neprekinute funkcije (dakle i omedene) - na zatvorenom intervalu
[a, b] .
Prostor kvadratno integrabilnih funkcija. Za funkciju f : (a, b) → R kažemo
da je kvadratno integrabilna ako vrijedi
Z b
|f (x)|2 dx < ∞.
a
Prostor svih takvih funkcija označavamo sa L2 (a, b) i zovemo Lebesgueovim prosto-
rom kvadratno integrabilnih funkcija (kratko: L2 -prostor). Vidjet ćemo kasnije da
je to doista vektorski prostor, tj. iz f , g ∈ L2 (a, b) slijedi da je i f + g ∈ L2 (a, b) . Npr.
x−1/3 ∈ L2 (0, 1) , ali x−2/3 ∈
/ L2 (0, 1) .
Iz ovih primjera dobivamo već cijelu jednu beskonačnu skalu vektorskih podpros-
-
tora uloženih u L2 (a, b) (ovdje pretpostavljamo da je interval (a, b) omeden):
{0} ⊂ P1 ⊂ P2 ⊂ . . . ⊂ Pk . . . ⊂ C2 ([a, b]) ⊂ C1 ([a, b]) ⊂ C([a, b]) ⊂ L2 (a, b).
Primijetimo da prostor C(0, 1) nije sadržan u L2 (0, 1) , jer npr. 1/x jest u C(0, 1) , ali
nije u L2 (0, 1) .
4 1. VEKTORSKI PROSTORI
Primjer 15. Kanonsku bazu vektorskog prostora svih pravokutnih matrica zadanog
tipa m × n čini ukupno mn matrica oblika Eij tipa m × n , čiji element u i -tom retku
i j -tom stupcu je 1 , a svi ostali su 0 . dim Mm,n = mn . Skup svih gornjih trokutastih
kvadratnih matrica reda n čini vektorski dimenzije 12 n(n+1) . Jednu njegovu kanonsku
bazu čine matrice Eij gdje je i 6 j , tj. s jedinicom na dijagonali ili iznad nje. Tih
matrica ima ukupno n + (n − 1) + . . . + 1 = 12 n(n + 1) , jer na dijagonali imamo mjesta
za n jedinica, na sporednoj dijagonali n − 1 mjesta, itd.
∗*∗
Baza u svakom vektorskom prostoru ima beskonačno mnogo, sve su one medu -
sobom ravnopravne. Mi smo slobodni birati bazu po vlastitome izboru, ovisno o pro-
blemu koji rješavamo. U prostoru Rn je za većinu problema najpogodnija kanonska
baza, jer su koeficijenti vektora u toj bazi jednaki njegovim koordinatama. Medutim, -
u nekim je problemima nužno preći i na neku drugu bazu. Općeniti postupak prijelaza
opisali smo u prošloj točki. No, ako je jedna od baza kanonska, onda se taj postupak
pojednostavnjuje.
Neka je dakle e1 , . . . , en kanonska, a e′1 , . . . , e′n neka druga baza. Vektor x ima
u te dvije baze prikaz
x = x1 e1 + . . . + xn en = x′1 e′1 + . . . + x′n e′n .
Olakšanje prema općenitoj situaciji sastoji se u tome što je prikaz vektora nove baze
preko vektora stare iznimno jednostavan: koordinate vektora jednake su komponentama
u tome prikazu: Neka je
e′1 = (t11, . . . , tn1 ) = t11 e1 + . . . + tn1 en ,
..
.
e′n = (t1n, . . . , tnn ) = t1n e1 + . . . + tnn en ,
zapis vektora druge baze. Onda imamo sljedeću vezu:
x = Tx′ . (5)
odnosno
x′ = T−1 x. (6)
∗*∗
-
Primjer 20. Nadimo ortogonalnu projekciju h(x) funkcije f (x) = x na funk-
ciju g(x) = sin 2x u prostoru L2 (0, 2π ) . Najprije je h = Pf = (fkg|kg)2 g . Raču-
R 2π
namo (f | g) = 0 x sin 2x dx = −π (parcijalnom integracijom), i zatim kgk2 =
R 2π R 2π
0
(sin 2x)2 dx = 12 0 (1 − cos 4x)dx = π , pa dobivamo h(x) = − sin 2x .
Primjer 23. Neka je ℓ2 prostor kvadratno zbrojivih sljedova realnih brojeva. Pro-
vjeri je li x ∈ ℓ2 , ako je x = (xk )k>1 definiran sa
(a) xk = k−1 , tj. x = (1, 12 , 31 , . . .)
(b) xk = k−1/2 , tj. x = (1, √12 , √13 , . . .)
P P
U slučaju (a) je k x2k = Pk k−2 <P ∞ (Dirichletov red s potencijom p = 2 > 1 ),
pa je x ∈ ℓ2 . U slučaju (b) je k x2k = k k−1 = ∞ (harmonijski red), pa x ∈ / ℓ2 .
1
engl. scalar product, njem. Skalarprodukt (inneres Produkt), franc. produit scalaire, rus. skalrnoe
proizvedenie.
6 1. VEKTORSKI PROSTORI
Ako je interval (a, b) omeden - i p < q , onda je Lq (a, b) ⊂ Lp (a, b) . Nije teško vidjeti
da pritom postoje funkcije f ∈ Lq koje nisu u Lp , tj. prostori se bitno razlikuju kao
skupovi. Za p = 2 dobivamo poznati Lebesgueov prostor kvadratno integrabilnih
funkcija L2 (a, b) , koji je unitaran. Prostori Lp (a, b) za p 6= 2 nisu unitarni, tj. u tom
slučaju ne postoji skalarni produkt na Lp koji bi generirao pripadnu normu.
Spomenimo bez dokaza zanimljivu i važnu generalizaciju nejednakosti CSB, za
slučaj prostora X = Rn , kao i za i slučaj Lp -prostora.
-
Primjer 25. Pronadimo sve a ∈ R za koje je funkcija f (x) = xa sadrža-
R1 R1
na u prostoru L2 (0, 1) . Mora biti konačan integral 0 |f (x)|2 dx = 0 x2a dx =
1
x2a+1 1
[uz pretp. 2a 6= −1 ] = 2a+1 = limx→0+ 2a+1 (1 − x2a+1 ) . Taj će izraz biti ko-
x=0
načan onda i samo onda ako je 2a + 1 > 0 , tj. a > −1/2 . Ako je 2a = −1 , onda je
R1
integral beskonačan, jer je 0 x−1 dx = ln x|1x=0 = ∞ .
∗*∗
1. Prikaz operatora . . . . . . . . . . . . . . . . . . . . . . . . .
2. Promjena baze. Slične matrice . . . . . . . . . . . . . . . .
3. Primjeri operatora u ravnini i prostoru . . . . . . . . . . .
4. Algebra operatora . . . . . . . . . . . . . . . . . . . . . . . .
5. Minimalni polinom . . . . . . . . . . . . . . . . . . . . . . .
∗*∗
Zadavanje operatora s pomoću neke matrice najvažniji je primjer linearnoga operatora. Dobar
dio ovoga poglavlja biti će posvećen proučavanju veze izmedu - matrice i linearnoga operatora.
Pokazat ćemo da vrijedi i obratna tvrdnja: svakom linearnom operatoru odgovara jedna matrica.
Čitatelj bi mogao pomisliti da je stoga pojam linearnoga operatora nepotreban, ukoliko se on može
potpuno opisati matricama. Medutim, - - operatora i
situacija je nešto složenija. Preciznija veza izmedu
matrice mogla bi se ovako opisati: ako su zadane baze vektorskih prostora, onda svakome operatoru
u tom paru baza odgovara jednoznačno odredena - matrica. Medutim,- promijenimo li baze, istome
operatoru odgovarati će neka druga matrica.
Linearni operator može se zadati na način koji je neovisan o bazi prostora (vidi geometrijske
primjere u narednoj točki). Stoga tek izbor baze odreduje - koja će mu matrica odgovarati.
Najinteresantnija analiza matričnoga računa upravo se sastoji u tome da se dadu odgovori na
sljedeća dva pitanja:
(1) kako odabrati bazu prostora pa da prikaz linearnoga operatora bude po mogućnosti što
jednostavnija matrica (što sličnija dijagonalnoj);
(2) da li (i kada) dvije različite matrice A , B pripadaju istome linearnom operatoru (u različitim
bazama)?
∗*∗
Opišimo obrnutu vezu: kako linearni operator odreduje - matricu.
Neka je e1 . . . , en baza u prostoru X , a f1 , . . . , fm baza u prostoru Y . Neka je
A : X → Y linearni operator. Vektor a1 = A(e1 ) pripada prostoru Y i može se razviti
po bazi f1 , . . . , fm . Dakle, postoje skalari a11 , a21 ,. . . am1 takvi da vrijedi
A(e1 ) = a11 f1 + a21 f2 + . . . + am1 fm .
Slično vrijedi i za ostale vektore:
A(e2 ) = a12 f1 + a22 f2 + . . . + am2 fm ,
..
.
A(en ) = a1n f1 + a2n f2 + . . . + amn fm .
Pomoću ovih koeficijenata definiramo matricu A :
a11 a12 . . . a1n
a21 a22 . . . a2n
A= ...
.
am1 am2 . . . amn
Vidimo da j -ti stupac matrice A čine komponente vektora A(ej ) po bazi f1 , . . . , fm .
Tvrdimo da vrijedi A(x) = Ax , za svaki vektor x . Zaista, neka je x =
x1 e1 + . . . + xn en . Onda vrijedi
Xn n
X m
X Xm X n
A(x) = xj A(ej ) = xj aij fi = aij xj fi = Ax.
j=1 j=1 i=1 i=1 j=1
∗*∗
Ova je relacija — veza operatora i matrice — toliko važna da smo zbog jednostavnosti formule
namjerno bili nedovoljno precizni. Pažljiviji čitatelj će uočiti da u formuli (4) vektor x s lijeve i s
desne strane nema isto značenje. S lijeve strane, on je element vektorskoga prostora X i njegov prikaz
u bazi toga prostora ima oblik x = x1 e1 + . . . + xn en . S desne strane, vektor x poistovjećujemo s
vektor-stupcem x = [ x1 x2 . . . xn ]⊤ ∈ Rn , a zatim, nakon množenja s matricom A , vektor Ax
(koji pripada prostoru Y ) treba shvatiti na način (Ax)1 f 1 + . . . + (Ax)m f m .
Ove su veze prirodne i čitatelj će doći sam do odgovarajućih ispravnih interpretacija. Pogledaj-
mo primjenu teorema na primjerima.
∗*∗
d
Primjer 6. Odredimo matricu koja odgovara operatoru deriviranja A = : Pn →
dt
Pn u bazi e0 (t) = 1 , e1 (t) = t ,. . . , en (t) = tn .
Vrijednosti operatora na vektorima baze je:
A(e0 )(t) = 0(t),
A(e1 )(t) = 1 = e0 (t),
A(e2 )(t) = 2t = 2e1 (t),
..
.
A(en )(t) = ntn−1 = nen−1 .
Njegova matrica u tom paru baza glasi
0 1 0 ... 0
0 0 2 ... 0
.
A = .. .
0 0 0 ... n
0 0 0 ... 0
∗*∗
y
a
j
i
x
-j
A(a)
Sl. 2.1. Operator simetrije s ob- -y
zirom na os apscisa
A(b)
a+b
A(a)
b
A(a+b)
a
Sl. 2.2. Provjera svojstva aditivnosti
j
A( j )
ϕ A( i )
Sl. 2.3. Djelovanje operatora rotacije za ϕ
kut α i
Spomenimo još i pojam afine funkcije, koji se često susreće. Za funkciju f : X → Y , gdje
su X i Y vektorski prostori, kažemo da je afina funkcija, ako je oblika f (x) = Ax + b , gdje je
A : X → Y linearni operator. Afina funkcija je linearni operator translatiran za vektor b , i vrijedi
f (0) = b jer je A(0) = 0 . Na pr. funkcije f : R → R , f (x) = 2x + 3 , ili g : R2 → R3 ,
g(x, y) = (2x + y + 3, −x + 2y + 7, 5x) , su afine, ali nisu linearni operatori. Vrlo su važne na pr.
u opisivanju tzv. splajnova, aproskimaciji nelinearnih sustava s pomoću linearnih (tzv. linearizacija
sustava), itd.
∗*∗
∗*∗
′
Matrice A i A , koje odgovaraju istome operatoru, imaju neka zajednička svoj-
stva. Stoga je prirodno definirati: za dvije matrice A i B kažemo da su slične, ako
postoji regularna matrica T takva da vrijedi
B = T−1 AT. (9)
Ponovimo izrijek teorema u novoj terminologiji: operatoru A odgovaraju u raznim
bazama slične matrice.
∗*∗
Od zajedničkih svojstava sličnih matrica izdvojimo za sad samo ovo: slične matrice
imaju identičnu determinantu. Uistinu, po Binet-Cauchyjevom teoremu vrijedi
det(B) = det(T−1) det(A) det(T) = det(A)
pošto je det(T−1 ) = 1/ det(T) . Zato ima smisla definirati determinantu operatora:
det(A) = det(A)
gdje je A matrica operatora u bilo kojoj odabranoj bazi.
Neka nam A ∼ B označava da su matrice A i B slične, tj. postoji regularna
matrica T takva da je B = T−1 AT . Čitatelj se lako može sam uvjeriti da je relacija
sličnosti medu- matricama relacija ekvivalencije. To po definiciji znači da ona ima
sljedeća tri svojstva:
(a) za sve A je A ∼ A (refleksivnost relacije);
(b) za sve A i B iz A ∼ B slijedi B ∼ A (simetričnost);
(c) za sve A , B i C iz A ∼ B i B ∼ C slijedi A ∼ C (tranzitivnost).
Jedan od osnovnih problema linearne algebre je odrediti kada su dvije matrice
slične. Odgovor na to pitanje daje Jordanov teorem, vidi Odjeljak 3.4.
2. LINEARNI OPERATORI 9
λ 0
Primjer 12. Operator definiran matricom A = imat će slično djelovanje
0 µ
duž obiju osi. Na slici vidimo djelovanje operatora za izbor λ = 1.25 , µ = 0.8 .
1 ε
Primjer 13. Operator zakošenja. Definiran je matricom A = . Ovaj
0 1
operator preslikava jedinične vektore na način
A(i) = i, A(j) = ε i + j.
εi
j
A( j )
Sl. 2.6. Operator zakošenja. Vek-
tor j preslikava se u zakošeni
vektor. Iznos zakošenja ovisi o
parametru ε . Za pozitivne vrijed-
nosti, zakošenje će biti udesno, za i
negativne ulijevo.
Sl. 2.7. U računarskoj grafici uobičajeni su izbori parametara ε = 0.16666 kod slanted
fontova, te ε = 0.25 kod italic fontova.
α
j
A’
B’
α
i A
Sl. 2.8. Projekcija na pravac
Primjer 15. Simetrija s obzirom na pravac. Neka je p pravac koji prolazi is-
hodištem, a s realnom osi zatvara kut α . Opišimo matricu koja odgovara operatoru
simetrije s obzirom na pravac p .
Djelovanje operatora na vektorima kanonske baze glasi
A(i) = cos 2α i + sin 2α j,
A(j) = sin 2α i − cos 2α j.
Doista, kut izmedu- vektora j i pravca je π − α , pa je kut β izmedu - vektora i i A(j)
2
jednak β = 2α − π2 , vidi sliku. Znači A(j) = cos β i + sin β j = sin 2α − cos 2α .
Zato je
cos 2α sin 2α
A = A(i, j) = .
sin 2α − cos 2α
A( i )
α
α
i
Sl. 2.9. Operator simetrije s obzirom na A( j )
pravac p
∗*∗
Primijetimo da je u ovome primjeru matrica T−1 jednaka transponiranoj matrici T⊤ . Vidjet
ćemo u nastavku da to nije slučajno, već će ta jednakost vrijediti kad god su vektori nove baze okomiti
i jedinične duljine. Determinanta takve matrice jednaka je +1 ili −1 .
Nadalje, primijetimo da djelovanje operatora A u ovome primjeru možemo shvatiti kao kom-
poziciju triju preslikavanja: prvoga koji će kanonsku bazu prevesti u novu: to je rotacija za kut α ,
drugoga koji će zrcaliti s obzirom na os apscisa u novoj bazi, i trećega koji će vratiti novu bazu u
staru (rotacija za kut −α ).
Pojam i svojstva kompozicije operatora razmotrit ćemo u sljedećoj točki.
∗*∗
-
Primjer 16. Izdvojimo dva medusobno okomita jedinična vektora e i f . Operator
-
koji duž smjerova odredenih tim vektorima djeluje na način
A(e) = λ e, A(f) = µ f
bit će očito operator homotetije u naznačenim smjerovima. Njegova matrica u bazi
{e, f} glasi
′ λ 0
A = .
0 µ
- stare i nove baze, onda se matrica operatora u originalnoj
Ako je α kut rotacije izmedu
bazi dobiva formulom (8.8):
′ ⊤ cos α − sin α λ 0 cos α sin α
A = TA T = .
sin α cos α 0 µ − sin α cos α
Djelovanje operatora vidimo na slici 2.10.
Primjer 19. Eulerovi kutovi. Promotrimo bilo koja dva jednako orijentirana kar-
tezijeva sustava s zajedničkim ishodištem. Neka su to sustavi Oxyz i OXYZ . Iz
početnog sustava Oxyz možemo prijeći u novi sustav OXYZ s pomoću triju rotacija.
Opišimo ih:
1. Rotacija za kut ϕ oko osi Oz . Pri tom os Ox prelazi u os Ox1 , a os Oy u os
Oy1 . Pravac Ox1 dobiven je kao presjek ravnina Oxy i OXY (vidi sliku 2.11).
z
Y
Z
y2
ϑ
y1
O y
Sl. 2.11. Ako dva jednako orjen-
tirana kartezijeva sustava imaju ϕ
zajedničko ishodište, onda se pri- ψ
jelaz iz jednog sustava u drugi x1
može dobiti s pomoću triju rota-
cija. Pripadni kutovi nazivaju se x
Eulerovi kutovi X
2. Rotacija za kut ϑ oko osi Ox1 . Pri tom os Oy1 prelazi u Oy2 , a os Oz u
konačni položaj — os OZ .
3. Rotacija za kut ψ oko osi OZ , nakon koje os Ox1 prelazi u OX , a os Oy2 u
os OY .
Kutovi ϕ , ϑ , ψ nazivaju se Eulerovi kutovi.
Napišimo matricu ove transformacije. Neka su (x, y, z) koordinate točke M u
starom, a (X, Y, Z) koordinate te točke u novom koordinatnom sustavu. Ako sa T1 ,
T2 , T3 označimo matrice operatora rotacija opisanih u pojedinom koraku, onda vrijedi
" # " #
X x
Y = T3 T2 T1 y .
Z z
Matrica T1 odgovara operatoru rotacije oko treće osi, za kut ϕ . Po prošlom
primjeru, ona glasi " #
cos ϕ − sin ϕ 0
T1 = sin ϕ cos ϕ 0 .
0 0 1
Matrica T2 odgovara operatoru rotacije oko prve osi, za kut ϑ :
" #
1 0 0
T2 = 0 cos ϑ − sin ϑ .
0 sin ϑ cos ϑ
Matrica T3 predstavlja operator rotacije za kut ψ oko treće osi:
" #
cos ψ − sin ψ 0
T3 = sin ψ cos ψ 0 .
0 0 1
Umnožak T = T3 T2 T1 predstavlja traženu matricu transformacije početnog u
novi koordinatni sustav. Množenjem gornjih matrica dobivamo
" #
cos ϕ cos ψ − sin ϕ cos ϑ sin ψ − sin ϕ cos ψ − cos ϕ cos ϑ cos ψ sin ϑ sin ψ
T = cos ϕ sin ψ + sin ϕ cos ϑ cos ψ − sin ϕ sin ψ − cos ϕ cos ϑ cos ψ − sin ϑ cos ψ
sin ϕ sin ϑ cos ϕ sin ϑ cos ϑ
10 2. LINEARNI OPERATORI
∗*∗
Koja matrica odgovara operatoru BA ?
Neka je dim X = n , dim Y = m , dim Z = p . Označimo ovu kompoziciju s
C = BA i njegovu matricu s (cij ) . Budući da vrijedi C : X → Z , onda je pripadna
matrica tipa p × n . Neka operatoru A odgovara matrica (aij ) tipa m × n , a operatoru
B matrica (bij ) tipa p × m . Neka su e1 , e2 , . . . , en baza za X , f1 , f2 , . . . , fm baza za
Y i g1 , g2 , . . . , gp baza za Z . Da bismo odredili matricu operatora BA u paru baza
{e1 , e2 , . . . , en } , {g1 , g2 , . . . , gp } , moramo izračunati njegovo djelovanje na vektorima
prve baze i rezultat rastaviti po vektorima druge baze:
X m X m
(BA)(ek ) = B(A(ek )) = B ajk fj = ajk B(fj )
j=1 j=1
m
X X
p p X
X m
= ajk bij gi = bij ajk gi .
j=1 i=1 i=1 j=1
Pp
S druge strane je (BA)(ek ) = i=1 cik gi , pa zaključujemo da vrijedi
m
X
cik = bij ajk . (10)
j=1
Tako smo dokazali
∗*∗
Oblik rješenja linearnog sustava. Na ovome ćemo mjestu ponoviti kako se može
opisati rješenje linearnoga sustava.
Promatramo linearni sustav
Ax = b. (11)
Neka je A operator pridružen matrici A . Da bi jednadžba (11) imala rješenje,
nužno je i dovoljno da vektor b leži u slici operatora A . (Onda će postojati x ∈ X za
koga je A(x) = b .) Neka je xp partikularno rješenje jednadžbe te xh neki vektor u
jezgri. Očito je i xh + xp rješenje, jer je A(xh + xp ) = A(xh ) + A(xp ) = b . Neka je
e1 , . . . ek baza u jezgri Ker A . Opći oblik rješenja jednadžbe (11) ima oblik
x = xp + α1 e1 + . . . + αk ek .
Injektivnost i surjektivnost operatora. Da bi jednadžba Ax = b imala jednoz-
načno rješenje, nužno mora biti Ker A = {0} . Pokažimo da je to svojstvo ekvivalentno
s injektivnošću operatora A , tj. da iz Ax1 = Ax2 slijedi x1 = x2 .
Zaista, ako je jezgra trivijalna, tj. Ker A = {0} , onda iz A(x1 ) = A(x2 ) slijedi
(zbog linearnosti) A(x1 − x2 ) = 0 i zato je (zbog trivijalnosti jezgre) x1 − x2 = 0 , tj.
x1 = x2 te je A injektivan.
Obratno, ako jezgra nije trivijalna, tj. postoji x ∈ Ker A takav da je x 6= 0 , onda
se i x i 0 preslikavaju u isti vektor 0 u prostoru Y , pa A nije injektivan.
Operator A je surjektivan ako je Y = Im A . Nužan i dovoljan uvjet za to je da se
dimenzije ovih prostora podudaraju.
Inverzni operator. Linearni operator A : X → Y koji je injektivan i surjektivan
nazivamo regularnim operatorom ili izomorfizmom prostora X i Y . Da bi to bio
slučaj, mora biti dim(Ker A) = 0 i dim X = dim Y = n . Onda je A bijekcija, pa stoga
postoji njegov inverz. Označimo ga s A−1 . To je preslikavanje sa Y u X definirano
na način
y = A(x) ⇐⇒ x = A−1 y.
Tvrdimo da je i A−1 linearni operator. Zaista, ako su y1 , y2 ∈ Y , onda postoje (je-
dincati!) x1 , x2 ∈ X za koje je A(x1 ) = y1 , A(x2 ) = y2 . Sad imamo x1 = A−1 (y1 ) ,
x2 = A−1 (y2 ) . Zbog linearnosti je
A(λ1 x1 + λ2 x2 ) = λ1 A(x1 ) + λ2 A(x2 ) = λ1 y1 + λ2 y2
a odavde, djelovanjem inverznog operatora:
λ1 x1 + λ2 x2 = λ1 A−1 (y1 ) + λ2 A−1 (y2 ) = A−1 (λ1 y1 + λ2 y2 ).
Time je dokazana linearnost.
∗*∗
Pokazali smo da kompoziciji operatora odgovara umnožak matrica. Neka je Ã
matrica operatora A−1 . Budući da je kompozicija A−1 ◦A identično preslikavanje I na
prostoru X , onda mora vrijediti ÃA = I . Slično, vrijedi i AÃ = I jer je i kompozicija
A ◦ A−1 identitet (na prostoru Y ). Stoga je à upravo inverzna matrica matrice A .
Prema tome, inverznom operatoru odgovara inverzna matrica.
Dakle, linearni operator je regularan (izomorfizam) onda i samo onda ako je pri-
padna matrica regularna.
Ako izmedu - dvaju vektorskih prostora X i Y postoji izomorfizam (regularni ope-
rator) A : X → Y , onda kažemo da su prostori X i Y izomorfni. Izomorfne vektorske
prostore poistovjećujemo. Jasno je da izomorfni prostori imaju istu dimenziju.
Na pr. vektorski prostori M22 i R4 su izomorfni. Takoder - i P3 i R4 . Lako je
provjeriti da je izomorfnost vektorskih prostora relacija ekvivalencije (tj. refleksivna,
tranzitivna i simetrična relacija). Prema tome, i prostori M22 i P3 su medusobno -
izomorfni.
∗*∗
Ova relacija nije očekivana. Imajući u vidu složeni način na koji je definirano
matrično množenje, u najmanju je ruku neobično da će se medu - matričnim elementima
moći pronaći ovakva veza. Za broj k sigurni smo da vrijedi ocjena k 6 n2 . Medutim, -
pokazat ćemo da vrijedi čak k 6 n , što relaciju (12) čini još neobičnijom.
∗*∗
Teorem 7. Neka je P(λ ) bilo koji polinom koji se poništava u matrici A . Onda
je P(λ ) djeljiv s minimalnim polinomom µ (λ ) .
I A A2 ... Am ...
A11 A12 ... A1m ...
A22 ... A2m ...
...
Amm ...
Matrice u prvome redu dobivamo računanjem potencija zadane matrice A . Matrice u
drugome redu dobivamo iz prethodnoga reda, po formulama:
A11 = A − β11 I, A12 = A2 − β12 I, . . . A1m = Am − β1m I
-
Pri tom koeficijente β1j odredujemo tako da sve te matrice na istome mjestu (obično
mjestu (1,1)) imaju nul-element.
Treći red računamo formulama
A22 = A12 − β22 A11 , . . . A2m = A1m − β2m A11 .
Pri tom zahtijevamo da sve ove matrice imaju na drugom mjestu takoder - nul-element.
To je obično pozicija (1,2), no ako već od prije sve matrice na tom mjestu imaju nule,
izabrat ćemo neku drugu poziciju. Budući da je pri tom i element na mjestu (1,1)
u svim matricama trećega retka jednak nuli, nastavljanjem ovoga postupka na koncu
ćemo dobiti nul-matricu. Uvažavajući sve izračunate relacije, iz nje možemo odrediti
minimalni polinom.
Napomenimo još da u postupku računanja matrice računamo u poretku: I , A ,
A11 , A2 , A12 , A22 , A3 itd., dakle, po stupcima ove sheme, kako ne bismo nepotrebno
računali potencije matrica (recimo potenciju A3 ukoliko je ispunjeno A22 = 0 ).
2 1
Primjer 24. Odredimo minimalni polinom matrice A = .
−1 3
Napravimo gore navedenu shemu:
1 0 2 1 3 5
I= A= A2 =
0 1 −1 3 −5 8
0 1 0 5
A11 = A12 =
−1 1 −5 5
0 0
A22 =
0 0
Pri tome je
A11 = A − 2I,
A12 = A2 − 3I,
A22 = A12 − 5A11
Krenuvši od posljednje relacije, čitamo:
0 = A12 − 5A11 = (A2 − 3I) − 5(A − 2I) = A2 − 5A + 7I.
Prema tome, minimalni polinom matrice A glasi
µ (λ ) = λ 2 − 5λ + 7.
3.
Vlastiti vektori
i vlastite vrijednosti
∗*∗
Po definiciji je jasno da je i α v ( α 6= 0 ) vlastiti vektor, čim je v vlastiti vektor.
Svi ti vektori odgovaraju istoj vlastitoj vrijednosti.
Neka su x, y dva vlastita vektora (ako postoje, ali ne nužno kolinearna) koji
odgovaraju istoj vlastitoj vrijednosti λ . Onda vrijedi
A(α x + β y) = α A(x) + β A(y) = αλ x + βλ y = λ (α x + β y)
te je i α x + β y vlastiti vektor za istu vlastitu vrijednost (ukoliko je različit od 0 ).
Poopćujući ovo razmatranje, možemo za svaku vlastitu vrijednost λ promotriti
podprostor Ker(λ I − A) , tj. jezgru operatora λ I − A . Svaki vektor, različit od nule,
iz toga podprostora vlastiti je vektor operatora A . Naime, (λ I − A)(v) = 0 povla-
či A(v) = λ v . Ovaj se podprostor naziva vlastiti podprostor koji pripada vlastitoj
vrijednosti λ .
∗*∗
Birajući koju alternativu prihvatiti, nesumnjivo ćemo odabrati račun s kompleksnim
brojevima. Stoga riječ skalar u definiciji vlastitih vrijednosti i vektora s početka ovoga
poglavlja znači kompleksan broj. Dakako, realni su brojevi sadržani u kompleksnim,
potonje ćemo koristiti samo onda kada račun pokaže da su neophodni.
3. VLASTITI VEKTORI I VLASTITE VRIJEDNOSTI 13
Teorem 2. Operator se može dijagonalizirati onda i samo onda ako postoji baza
koju čine njegovi vlastiti vektori.
Zaista, ako je matrica operatora (u nekoj bazi) dijagonalna, onda su vektori te baze
vlastiti vektori, a elementi na dijagonali vlastite vrijednosti. To slijedi iz načina kako
operatoru pridružujemo matricu.
Primijetimo nadalje da pri tom nije bilo važno da su sve vlastite vrijednosti razli-
čite! Nuždan i dovoljan uvjet da bi se A dao dijagonalizirati je da posjeduje n linearno
nezavisnih vlastitih vektora. Pokazali smo da će se to sigurno dogoditi ukoliko su
vlastite vrijednosti različite, no taj uvjet nije uvijek nuždan.
∗*∗
Dosad smo pokazali (izmedu - ostaloga) sljedeća dva svojstva matrica:
• Ako su sve vlastite vrijednosti matrice A različite, onda postoji matrica T
takva da je T−1 AT dijagonalna, s vlastitim vrijednostima na dijagonali.
• U općem slučaju, postoji matrica T takva da je T−1 AT gornja trokutasta.
Pokažimo da se i sad na dijagonali bile koje gornje trokutaste matrice nalaze vlastite
vrijednosti!
U tu ćemo svrhu iskoristiti poznati rezultat: karakteristični polinom ne ovisi o
izabranoj bazi. Neka je A matrica, neka su λ1 , . . . , λn sve njezine vlastite vrijednosti
(koje mogu biti i kompleksni brojevi). Neka je T matrica takva da je B = T−1 AT
gornja trokutasta. Onda je karakteristični polinom matrice B jednak onome od matrice
-
A , pošto su te dvije matrice slične. Medutim, taj karakteristični polinom možemo
direktno izračunati. Neka B ima oblik
b
11 ∗ . . . ∗
0 b22 . . . ∗
B= ...
0 0 . . . bnn
Onda je
λ −b ∗ ... ∗
11
0 λ −b22 . . . ∗
λI − B = ...
0 0 . . . λ −bnn
i determinanta ove matrice jednaka je umnošku dijagonalnih elemenata. Dakle,
κA (λ ) = κB (λ ) = (λ − b11 )(λ − b22 ) . . . (λ − bnn ).
Nul-točke ovoga polinoma su brojevi b11 , . . . , bnn i stoga se oni podudaraju s vlastitim
vrijednostima. Dakle, nakon svodenja- na gornju trokutastu formu, na dijagonali matrice
B naći će se vlastite vrijednosti matrice A (u nekom poretku). Time je naša tvrdnja
dokazana.
∗*∗
∗*∗
Kako se koristi ovaj rezultat? Iz veze T−1 AT = D slijedi
A = TDT−1 . (6)
Zato je
A2 = (TDT−1)(TDT−1 ) = TD2 T−1 .
Ponavljajući ovaj postupak, vidimo da za svaku potenciju vrijedi
Ap = TDp T−1 .
Stoga, za polinom P(λ ) stupnja p možemo pisati
P(A) = TP(D)T−1 (7)
pri čemu P(D) računamo formulom (5).
1000
5 2
Primjer 9. Izračunajmo .
−6 −2
Rješenje ovoga problema nije jednostavno (kao ni pitanje, uostalom!). Da bismo
odredili ovu potenciju, potražit ćemo dijagonalnu matricu sličnu matrici A (ukoliko
postoji!) i primijeniti formulu (7).
Najprije moramo odrediti vlastite vrijednosti:
λ −5 −2
κ (λ ) = = λ 2 − 3λ + 2.
6 λ +2
Nul-točke karakterističnog polinoma su λ1 = 1 i λ2 = 2 . One su različite i stoga smo
sigurni da je matrica slična dijagonalnoj.
-
Sad odredujemo vlastite vektore. Onaj koji odgovara prvoj vlastitoj vrijednosti
nalazimo iz sustava (I − A)v = 0 , odnosno
−4x1 −2x2 = 0 x1 1
=⇒ =α .
6x1 +3x2 = 0 x2 −2
Drugi vlastiti vektor je rješenje jednadžbe (2I − A)v = 0 , odnosno
−3x1 −2x2 = 0 x1 2
=⇒ =α .
6x1 +4x2 = 0 x2 −3
Time dobivamo matricu T :
1 2
T= .
−2 −3
Njena inverzna matrica iznosi
−3 −2
T −1 = .
2 1
Za nju vrijedi T−1 AT = D , gdje je D dijagonalna:
−3 −2 5 2 1 2 1 0
= .
2 1 −6 −2 −2 −3 0 2
Provjeri točnost učinjenih računa direktnim množenjem!
Formula (6) sad glasi
−1 5 2 1 2 1 0 −3 −2
A = TDT ⇐⇒ = .
−6 −2 −2 −3 0 2 2 1
Potenciju A1000 računamo po formuli (7):
A1000 = TD1000T−1
1000
1 2 1 0 −3 −2
=
−2 −3 0 2 2 1
1 2 1 0 −3 −2
= .
−2 −3 0 21000 2 1
Direktnim množenjem sad dobivamo točan rezultat!
∗*∗
∗*∗
Ukoliko je matrica A slična gornjoj trokutastoj matrici B (ali ne i dijagonalnoj),
onda je samo dio gornjih formula istinit. Za gornju trokutastu matricu sve njezine
potencije su opet gornje trokutaste, a na dijagonali se nalaze potencije dijagonalnih
elemenata (o preostalim elementima ne možemo najčešće ništa kazati):
λ ∗ ... ∗ p
1 λ1 ∗ . . . ∗
0 λ2 . . . ∗ 0 λ2p . . . ∗
B= =⇒ B p
=
... ...
0 0 . . . λn p
0 0 . . . λn
Slično, ako je P(λ ) bilo koji polinom, za njega će vrijediti:
P(λ1 ) ∗ . . . ∗
0 P(λ2 ) . . . ∗
P(B) = ...
.
0 0 . . . P(λn )
O elementima označenim s ∗ ne možemo općenito ništa kazati. Zapravo, odgovor u
ovom slučaju daje Jordanova forma matrice, o kojoj će biti riječ u nastavku.
14 3. VLASTITI VEKTORI I VLASTITE VRIJEDNOSTI
= (λ − 2)(λ 2 − 4λ + 4) = (λ − 2)3
= λ 3 − 6λ 2 + 12λ − 8.
Matrica ima trostruku vlastitu vrijednost λ = 2 .
Po Hamilton-Cayleyevom teoremu je
A3 − 6A2 + 12A − 8I = 0.
Množenjem s A−1 slijedi
A2 − 6A + 12I = 8A−1 .
Odavde možemo odrediti inverz A−1 .
∗*∗
Navedimo nekoliko posljedica Hamilton-Cayleyeva teorema.
Kako matrica A poništava svoj karakteristični polinom, a minimalni je polinom
najmanjega stupnja s tim svojstvom, to je karakteristični polinom djeljiv s minimalnim.
To znači da su nul-točke minimalnoga polinoma ujedno i nul-točke karakteristič-
noga: vlastite vrijednosti su nul-točke minimalnoga polinoma.
U sljedećem teoremu ćemo prikupiti već poznate nužne i dovoljne uvjete za inver-
tibilnost kvadratnih matrica.
-
Teorem 5. Sljedeća svojstva kvadratne matrice A reda n su medusobno ekviva-
lentna:
a) A je regularna matrica ( tj. invertibilna ) ;
b) det A 6= 0 ;
c) r(A) = n ( tj. A je maksimalnog ranga ) ;
d) redci matrice A su linearno nezavisni;
e) stupci matrice A su linearno nezavisni;
f ) sve vlastite vrijednosti matrice A su različite od nula;
g) slobodni koeficijent karakterističnog polinoma κA matrice A je različit od nula.
DOKAZ. Razvijmo polinom P(x) u Taylorov red (polinom) oko λ , tj. po potencijama
od x − λ :
P′′ (λ ) P(k) (λ )
P(x) = P(λ ) + P′ (λ )(x − λ ) + (x − λ )2 + . . . + (x − λ )k .
2! k!
Onda je
P′′ (λ ) P(k) (λ )
P(J) = P(λ )I + P′ (λ )(J − λ I) + (J − λ I)2 + . . . + (J − λ I)k ,
2! k!
i tvrdnja slijedi zbog J − λ I = N .
∗*∗
Želimo li biti potpuno precizni, moramo pogledati detaljnije u strukturu pojedinog
Jordanovog bloka. Pogledat ćemo, recimo, prvi Jordanov blok i — radi jednostavnosti
zapisa — pisati ga bez indeksa. Svaki je blok i sam dijagonalna blok-matrica koja se
sastoji od elementarnih Jordanovih klijetki 1 :
J1 0 0 . . . 0
0 J2 0 . . . 0
J(λ ) = ...
.
(11)
0 0 0 ... Jm
Elementarna Jordanova klijetka je matrica oblika:
λ 1 0 0 ... 0
0 λ 1 0 ... 0
0
J1 = 0 0 λ 1 . . . . (12)
..
.
0 0 0 0 ... λ
Ona na dijagonali ima vlastitu vrijednost λ , na gornjoj sporednoj dijagonali vrijednost
1 , a svi su ostali elementi jednaki 0. Pri tom se u formuli (11) elementarne Jordanove
klijetke mogu poredati tako da redovi matrica J1 , J2 ,. . . opadaju.
Red ‘najveće’ Jordanove klijetke takoder- ima veze s kratnošću vlastite vrijednosti.
Ako je
µ (λ ) = (λ − λ1 )s1 (λ − λ2 )s2 · · · (λ − λk )sk .
minimalni polinom matrice A , onda su redovi najvećih elementarnih klijetki upravo
potencije s1 , s2 itd. Primijetimo da je s1 6 r1 , s2 6 r2 itd.
Evo nekoliko primjera Jordanovih blokova. Napisat ćemo cjelokupni blok, student
bi trebao sam prepoznati pojedine elementarne Jordanove klijetke:
2 1 0 0 0 0 3 1 0 0 0 0 −1 1 0 0 0
0 2 1 0 0 0 0 3 1 0 0 0
0 0 2 0 0 0 0 0 3 1 0 0 0 −1 0 0 0
, , 0 0 −1 0 0 .
0 0 0 2 1 0 0 0 0 3 0 0
0 0 0 −1 0
0 0 0 0 2 0 0 0 0 0 3 0
0 0 0 0 −1
0 0 0 0 0 2 0 0 0 0 0 3
(Pomoć: u prvoj su matrici dimenzije elementarnih klijetki 3-2-1, u drugoj 4-1-1, trećoj
2-1-1-1.)
Napisat ćemo i dva primjera Jordanove forme matrice. Zbog jednostavnosti (i
pomoći) izdvojit ćemo samo Jordanove blokove (ostali nenapisani elementi matrice
jednaki su nuli) Student bi trebao prepoznati pojedine elementarne Jordanove klijetke.
2 1 0 0 0 1 0
0 2 1 0 0 0 0
0 0 2 0 0 0 0
0 0 0 2 3 1
; . (13)
5 0 3
−1 1 0 −2 1 0
0 −1 0 0 −2 1
0 0 −1 0 0 −2
∗*∗
Jedan od najvažnijih rezultata linearne algebre sadržan je u sljedećem teoremu.
Navodimo ga bez dokaza, jer on nije jednostavan, pogledajte na pr. [Kurepa].
P(A) = TP(J)T−1.
Iz Teorema 4 odmah slijedi da je svaka nilpotentna matrica N slična matrici koja
ima samo nule ili jedinice na gornjoj sporednoj dijagonali, a svi ostali elementi su nula.
Iz Teorema 4 slijedi još jedan važan rezultat, tzv. teorem o preslikavanju spektra.
Zapravo, u dokazu je dovoljno rabiti samo Schurov teorem koji kaže da je svaka matrica
slična gornjoj trokutastoj.
∗*∗
- Jordanova forma matrice? Postupak je sličan dijagonalizaciji.
Kako se odreduje
Odredimo najprije vlastite vrijednosti i zatim vlastite vektore. U trenutku kad je di-
menzija podprostora manja nego kratnost vlastite vrijednosti doći ćemo u situaciju da
dobiveni vektori ne čine bazu prostora. Onda ih nadopunjujemo pridruženim vlastitim
vektorima.
Prikažimo situaciju na matrici A , čija je Jordanova forma prva matrica u (13).
Neka je v1 vlastiti vektor koji odgovara prvoj vlastitoj vrijednosti matrice, λ1 = 2 .
Vrijedi Av1 = 2v1 i na osnovu toga pišemo prvi stupac Jordanove forme. Iz drugog
stupca čitamo da za drugi vektor v2 vrijedi Av2 = v1 + 2v2 . On nije vlastiti vektor
matrice već upravo — pridruženi vlastiti vektor. Nalazimo ga dakle iz uvjeta
(λ I − A)v = −v1 ,
gdje je v1 ‘pravi’ vlastiti vektor.
- pridruženi
Iz trećeg stupca čitamo Av3 = v2 + 2v3 , što znači da je v3 takoder
vlastiti vektor. Iz četvrtog stupca čitamo Av4 = 2v4 , v4 je ponovo ‘pravi’ vlastiti
vektor.
∗*∗
-
Sad možemo napisati algoritam za odredivanje Jordanove forme matrice.
Algoritam za nalaženje Jordanove forme.
Korak 1. Odredimo karakteristični polinom matrice
κ (λ ) = (λ − λ1 )r1 (λ − λ2 )r2 · · · (λ − λk )rk .
Korak 2. Za odabranu vlastitu vrijednost λi odredujemo njezin Jordanov blok.
Rješavamo sustav
(λi I − A)v = 0.
Ako je time pronadeno - m linearno nezavisnih vlastitih vektora, onda će Jordanov
blok imati m elementarnih Jordanovih klijetki. Ako je m = ri , postupak je završen
i Jordanov blok je dijagonalan. Inače moramo odrediti ri − m pridruženih vlastitih
vektora.
Korak 3. Veličina pojedine elementarne Jordanove klijetke nije unaprijed poznata.
- ne znamo koji od vlastitih vektora će imati pridružene a koji ne. Ako je v1
Takoder
jedini vlastiti vektor, pridružene vlastite vektore tražimo iz jednadžbi
(λ I − A)v2 = −v1
(λ I − A)v3 = −v2
(λ I − A)v4 = −v3
..
.
i postupak ponavljamo onoliko dugo dok postoji rješenje.
Ako postoji nekoliko linearno nezavisnih vektora, onda je korisno umjesto v1
-
u gornjoj jednadžbi staviti njihovu linearnu kombinaciju s privremeno neodredenim
koeficijentima. Te ćemo koeficijente odrediti tako da jednadžba ima rješenje.
Pokažimo to na primjeru.
1
Marie Ennemond Camille Jordan (1838–1922), francuski matematičar.
2
Na nekoliko mjesta ovaj opis neće biti popraćen strogim dokazom, jer on prelazi okvire ovoga dodatka.
Čitatelj se upućuje na knjigu [6] gdje može pronaći sve potrebne pojedinosti.
1
U literaturi se pod pojmom elementarne Jordanove klijetke spominje i matrica sličnoga oblika koja na
dijagonali ima nule.
16 3. VLASTITI VEKTORI I VLASTITE VRIJEDNOSTI
∗*∗
∗*∗
x3
e3
e2
Sl. 4.1. Vektor ek dobivamo ta-
ko da od xk oduzmemo njegovu
projekciju na podprostor razapet s
prvih k − 1 vektora e1
∗*∗
Ovaj postupak možemo zamisliti i u ponešto izmjenjenim okolnostima. Zamisli-
mo da imamo nekoliko ortogonalnih vektora {e1 , . . . , ek } koji ne čine bazu. Lako je
zamisliti postupak koji će te vektore nadopuniti do bilo koje baze prostora: dovoljno je
dodavati jedan po jedan vektor {xk+1 , . . . , xn } koji se ne nalazi u podprostoru razape-
tom s već odabranim vektorima. Sad Gram-Schmidtovim postupkom ortogonaliziramo
zadani skup. Pri tom prvih k vektora ostaje nepromijenjeno (jer su već ortogonalni).
Istaknimo ovaj zaključak. Pri tom riječ ortogonalni možemo po potrebi zamijeniti
s ortonormirani.
∗*∗
Napomenimo da ovdje govorimo samo o realnim matricama. Simetričnost se u
slučaju kompleksnih matrica definira (i naziva!) drukčije. Ako je A matrica s komp-
leksnim koeficijentima, onda ulogu simetrične matrice preuzima hermitska matrica,
za koju vrijedi aij = aji .
Spomenimo da za opu pravokutnu matricu A s kompleksnim koeficijentima, tipa
m×n , definiramo hermitski adjungiranu matricu A∗ tipa n×m sa (A∗ )ij := (A∗ )ji ,
⊤
za sve indekse i, j , ili krae, A∗ := A .
Sav račun u nastavku bit će isključivo s realnim (a ne kompleksnim!) skalarima.
-
Medutim, da bismo pokazali da se smijemo ograničiti samo na račun s realnim
skalarima, moramo ipak pogledati kako bi se definirao skalarni umnožak nad poljem
C.
Ako dozvolimo da skalari i komponente vektora mogu biti kompleksni brojevi,
onda se mora promijeniti osnovna definicija skalarnoga umnoška u sljedeću:
(x | y) := x1 y¯1 + x2 ȳ2 + . . . + xn y¯n .
(Potez označava kompleksno konjugiranje.) Primijetimo da se u slučaju vektora s
realnim koeficijentima, ova definicija podudara s prijašnjom.
Opravdanje ove preinake možemo naći u tome što u suprotnome norma vektora ne
bi bila pozitivan (pa ni realan) broj. No, uz ovu izmjenu vrijedi
kxk2 = x1 x̄1 + . . . + xn x̄n = |x1 |2 + . . . + |xn |2 . (1)
Svojstva homogenosti i komutativnosti takoder - se mijenjaju, i glase
Primjer 4. Matrica
1 1 1 1
1 1 i −1 −i
S=
2 1 −1 1 −1
1 −i −1 i
nije hermitska:
⊤
1 1 1 1 1 1 1 1
∗ 1 1 i −1 −i 1 1 −i −1 i
S = = 1 .
2 1 −1 1 −1 2 −1 1 −1
1 −i −1 i 1 i −1 −i
Uvjerite se da je matrica S unitarna, tj. SS∗ = I .
Simetrična matrica ima realne vlastite vektore. Čim je vlastita vrijednost re-
alna, realan je i vlastiti vektor, homogeni sustav s realnom singularnom matricom
uvijek ima realno rješenje, pošto pri njegovu računanju primjenjujemo samo algebarske
operacije s realnim brojevima.
∗*∗
Pokazali smo da su vlastiti vektori koji odgovaraju različitim vlastitim vrijed-
-
nostima medusobno linearno nezavisni. Za simetrične matrice ponovo vrijedi mnogo
više:
∗*∗
Ortogonalne matrice čuvaju Euklidsku normu, tj.
kSxk = kxk.
Naime, za ortogonalnu matricu S i bilo koji vektor x vrijedi kSxk2 = (Sx | Sx) =
(x | S⊤ Sx) = (x | x) = kxk2 . Posebno, ortogonalne matrice su izometrije, tj. čuvaju
- vektorima:
udaljenost medu
kSx − Syk = kx − yk.
Doista, kSx − Syk = kS(x − y)k = kx − yk .
Dokaz. Riječ je o bazi koju čine normirani vlastiti vektori te matrice. U toj bazi
(zapravo u bilo kojoj ortonormiranoj) vektor x ima prikaz
Xn
x= (x | ei )ei
i=1
i budući da su vektori vlastiti za matricu A , onda vrijedi
Xn n
X
Ax = (x | ei )Aei = λi (x | ei )ei .
i=1 i=1
Neka je Mmn vektorski prostor svih realnih (ili kompleksnih) matrica A tipa
m × n . Gledajući matricu A kao linearni operator iz Rn u Rm ( Rn ∋ x 7→ Ax ∈ Rm ),
možemo na prirodan način definirati operatorsku normu od A , generiranu s nekom
zadanom normom na Rn i još jednom normom na Rm : kAk = supx6=0 kAxk/kxk .
S tom matričnom normom vektorski prostor Mmn postaje normirani prostor. Budu-
ći da je on konačno-dimenzionalan (dimenzije mn ) onda je to Banachov prostor, tj.
svaki Cauchyjev slijed matrica u njemu konvergira: ako za slijed matrica (Ak ) vrijedi
kAk − Al k → 0 kada k, l → ∞ , onda slijed matrica Ak konvergira k nekoj matrici A .
-
Na sličan način može se uvesti konvergencija beskonačnog reda matrica odredenog
slijedom matrica Ak istogP tipa. Najprije gledamo parcijalne sume Sk := A1 +. . . +Ak .
∞
Kažemo da red matrica k=1 Ak konvergira ako slijed parcijalnihP∞ suma Sk konver-
gira k matrici S , tj. kS − Sk k → 0 . U tom slučaju pišemo k=1 Ak = S . Red matrica
P∞ P∞ (k)
k=1 Ak konvergira onda i samo onda ako redovi brojeva k=1 aij konvergiraju k
nekom broju sij za sve i , j .
Primjer 2. Vrijedi
" 2k
#
∞
X xk x
k! (−1)k (2k)! ex cos x
k x2k+1 1
= π 2
(−1) (2k+1)! (k+1)2
sin x 6
k=0
za sve x ∈ R .
- (At)2 (At)3
i nadimo eAt = I + At + 2! + 3! + . . . , gdje je t bilo koji realni broj. Kao što
znamo, vidi Primjer 3.18,
λk k λ k −1
Ak = ,
0 λk
dakle " P #
∞ (λ t)k P∞ kλ k−1 tk
At k=0 k!
e = Pk=1
∞
k!
(λ t)k
.
0 k=0 k! ,
P∞ kλ k−1 tk
P∞ λ k−1 tk−1
P∞ (λ t)j
Zbog k=1 k! =t k=1 (k−1)! = [j := k − 1] = t j=0 j! = teλ t dobivamo
λt
e teλ t
eAt = .
0 eλ t
Primijetimo da je λ vlastita vrijednost od A , te ako je λ negativan realan broj, tj.
λ < 0 , onda vrijedi da eAt → 0 kada t → +∞ . Gornja matrica A s λ < 0 je
specijalan slučaj tzv. stabilne matrice, koje ćemo definirati malo kasnije, vidi Odjeljak
5.5. Matrica A je u ovom primjeru matrica linearnog sustava diferencijalnih jednačaba
ẋ = λ x + y, ẏ = λ y,
⊤
jer uz oznaku x = (x, y) ovaj sustav možemo kratko zapisati kao
ẋ = Ax.
Sa zadanim početnim uvjetima x(0) = x0 , y(0) = y0 dobivamo Cauchyjev problem
čije rješenje je
x(t) = eAt x0 ,
gdje je x0 = (x0 , y0 )⊤ . Matrica eAt zove se evolucijska matrica sustava. Više o njoj vidi
u Odjeljku 5.9. U ovom slučaju iz gornjeg rješenja vidimo da je x(t) = eλ t x0 + teλ t y0 ,
y(t) = eλ t y0 . Ako je λ < 0 onda x(t) → 0 kada t → +∞ , tj. trajektorija x(t) je
asimptotski stabilna (teži k nuli).
pri čemu je t bilo koji realan broj. Matrica eAt zove se evolucijska ili fundamentalna
matrica matrice A , o čemu će više riječi biti u Odjeljku 5.9. Kao što vidimo, matrica
eAt je u ovom slučaju matrica operatora rotacije ravnine za kut t oko ishodišta.
t2 tk
Pokažimo da je na mjestu (1, 1) u matrici eAt := I + At + A2 2! + . . . + Ak k! +...
2
stvarno broj cos t . Doista, budući da je A = −I (tj. A je matrična imaginar-
na jedinica), A3 = −A , A4 = I , itd., onda na mjestu (1, 1) matrice eAt imamo
t2 t4
1 − 2! + 4! + . . . , što je dobro poznati MacLaurinov razvoj funkcije cos t . Slično i za
ostala mjesta evolucijske matrice eAt .
Matrica A je u ovom primjeru matrica linearnog sustava diferencijalnih jednačaba
ẋ = −y, ẏ = x,
gdje je x = x(t) i y = y(t) , jer uz oznaku x = (x, y)⊤ ovaj sustav možemo kratko
zapisati kao
ẋ = Ax.
Sa zadanim početnim uvjetima x(0) = x0 , y(0) = y0 dobivamo Cauchyjev problem
čije rješenje je
x(t) = eAt x0 ,
pri čemu je x0 = (x0 , y0 )⊤ . Drugim riječima, vektor x(t) nastaje iz x0 rotacijom za
kut t oko ishodišta. Primijetite da je ẍ = −ẏ = −x , tj. ẍ + x = 0 , pa funkcija x = x(t)
predstavlja rješenje dobro poznate jednadžbe harmonijskog oscilatora.
22 5. MATRIČNE NORME , SPEKTAR I SPEKTRALNI RADIJUS MATRICE
Umjesto polinoma matrice P(A) moguće je definirati čak i funkciju matrice f (A) .
O tome govori sljedeći važan teorem, koji navodimo bez dokaza.
f (λ )
Ako je f (z) funkcija kao u Teoremu 1 i J Jordanova matrica sa Jordanovim
blokovima J1 (λ1 ), . . . , Jr (λr ) , tako da su svi λi u nutrini kruga Kr (z0) , onda je
f (J1(λ1 ))
f (J2 (λ2 ))
f (J) = ...
.
f (Jr (λr ))
Matrica f (J) je gornja trokutasta i na dijagonali se nalaze brojevi f (λi ) , gdje su
λi ∈ σ (J) .
Nije teško vidjeti da i u Teoremu 1 vrijedi Teorem o preslikavanju spektra kao i
za funkcije od polinoma: ako je σ (A) = {λ1 , . . . , λn } onda je
σ (f (A)) = {f (λ1 ), . . . , f (λn )},
ili kraće zapisano,
σ f (A)) = f (σ (A)).
Drugim riječima, vlastite vrijednosti matrice f (A) su kompleksni brojevi oblika f (λ ) ,
gdje je λ vlastita vrijednost od A . Dokaz je sličan kao i u slučaju polinoma. Naime,
budući da je matrica A slična gornjoj trokutastoj J , onda je f (A) slična gornjoj tro-
kutastoj matrici f (J) koja na dijagonali ima brojeve oblika f (λ ) , gdje je λ ∈ σ (A) .
To su upravo vlastite vrijednosti od f (J) , dakle i od f (A) .
Ako odgovarajući Taylorov red od f (z) konvergira za z0 = 0 (tzv. MacLaurinov
red od f (z) ) s beskonačnim radijusom konvergencije, tj.
X∞
f (z) = αk zk
k=0
konvergira na cijelom C , onda takvu funkciju kompleksne varijable zovemo cijelom
funkcijom. U tom slučaju je funkcija f (A) definirana za svaku kvadratnu matricu A :
X∞
f (A) := αk Ak .
k=0
Kao što je poznato, funkcije f (z) = ez , sin z , cos z su cijele funkcije, pa prema tome
redovi
X∞ ∞
X X∞
Ak A2k+1 A2k
eA := , sin A := (−1)k , cos A := (−1)k
k! (2k + 1)! (2k)!
k=0 k=0 k=0
konvergiraju za svaku kvadratnu matricu A s kompleksnim koeficijentima.
Primjer 5. Vrijedi:
λ 1 sin λ cos λ
sin = .
0 λ 0 sin λ
DOKAZ. Zbog r(A) < |µ | je r(A/µ ) < 1 , jer iz λ ∈ σ (A) slijedi λ /µ ∈ σ (A/µ ) ,
pa zbog |λ | < |µ | imamo |λ /µ | < 1 . Stoga je I − A/µ regularna matrica, pa
invertiranjem matrice µ I − A = µ (I − A/µ ) dobivamo
−1 ∞ k
−1 1 A 1X A
(µ I − A) = I− = .
µ µ µ µ
k=0
P k
Može se pokazati da red k=0 Aµ k divergira ako je µ unutar kruga polumjera r(A)
oko ishodišta, tj. za |µ | < r(A) .
Kao što znamo, skup svih kompleksnih brojeva µ za koje je matrica µ I − A
regularna, tj. postoji (µ I − A)−1 , zove se rezolventni skup matrice A , i ozna-
čava sa ρ(A) . Taj skup je kompleksna ravnina bez vlastitih vrijednosti od A :
ρ(A) = C \ σ (A) = C \ {λ1 , . . . , λn } . Funkcija R(·) : ρ(A) ⊂ C → Mn koja
kompleksnom broju µ pridružuje matricu R(µ ) = (µ I − A)−1 zove se rezolventa
matrica A . Ako je u nehomogenoj matričnoj jednadžbi
(µ I − A)x = h
vektor h zadan, x nepoznanica, i µ ∈ ρ(A) , onda je rješenje jednako x = R(µ )h =
(µ I − A)−1 h . U slučaju kad je µ ∈ σ (A) imamo Fredholmovu alternativu: ako je
h ⊥ N(µ I − A∗ ) onda postoji rješenje, a u suprotnom rješenja nema.
U žargonu linearne algebre se nerijetko umjesto vlastitih vrijednosti λ matrice A
govori o njenim recipročnim vrijednostima (pod uvjetom λ 6= 0 ), koje se zovu ka-
rakteristične vrijednosti matrice. Prema tome, kompleksni broj µ je karatkeristična
vrijednost od A ako postoji vektor x 6= 0 takav da je µ Ax = x .
U svjetlu Teorema 1 korisno je znati sljedeći teorem, jer on daje jednostavan
dovoljni uvjet da bi spektralni radijus bio < 1 .
24 5. MATRIČNE NORME , SPEKTAR I SPEKTRALNI RADIJUS MATRICE
Sljedeći teorem pokazuje da se spektralna norma matrice A može vrlo lako izračunati
znajući spektar kvadratne matrice A∗ A . Time je naziv spektralne norme opravdan. (U
uporabi je i oznaka kAkS = kAk2 .)
DOKAZ. (a) Prema teoremu o preslikavanju spektra je σ (A2 ) = σ (A)2 , tj. spektar
matrice A2 dobiva se kvadriranjem svih elemenata spektra matrice A . Budući da su
za hermitsku matricu vlastite vrijednosti λ realne, vrijedi λ 2 = |λ |2 . Prema tome je
r(A2 ) = max{λ 2 : λ ∈ σ (A)} = max{|λ |2 : λ ∈ σ (A)} = max{|λ | : λ ∈ σ (A)}2 =
r(A)2 . Iz prethodnog teorema je onda kAk22 = r(A∗ A) = r(A2 ) = r(A)2 , dakle
kAk2 = r(A) .
(b) Budući da je A hermitska matrica, onda je i p(A) hermitska: p(A)∗ =
[jer A ima realne koeficijente] = p(A∗ ) = p(A) . Tvrdnja slijedi iz (a).
- i 1
Primjer 8. Nadimo spektralnu normu kAk2 matrice A = . Vrijedi
0 1+i
⊤
−i 1 −i 0
A∗ = = , pa je
0 1−i 1 1−i
∗ 1 −i
A A=
i 3
2
Karakteristični polinom
∗
√ √ matrice je k(λ ) =∗ λ − 4λ√+ 2 . To znači da je
ove
σ (A A) p
= {2 − 2, 2 + 2} . Budući da je r(A A) = 2 + 2 , prema Teoremu 1 je
√
kAk2 = 2 + 2 .
5. MATRIČNE NORME , SPEKTAR I SPEKTRALNI RADIJUS MATRICE 25
Primjer 9. Matrica
a −b
A= b a
gdje su a i b bilo koja dva realna broja, je stabilna onda i samo onda ako je a < 0 .
Doista, pišući
1 0 0 −1
A=a 0 1 +b 1 0 = aI + bJ
Primijetimo da ako je matrica A dijagonalno dominantna, tj. |aii | > ri za sve i , onda
niti jedan krug Di ne sadrži z = 0 .
Drugim riječima, za svaku vlastitu vrijednost λ matrice A postoji neki Cassinijev oval
Dij u kojem je λ sadržan, tj.
|λ − aii | · |λ − ajj | 6 ri rj .
DOKAZ. Primijenit ćemo sličan postupak kao u dokazu Geršgorinova teorema, uz malu
izmjenu. Neka λ ∈ σ (A) i Ax = λ x , x 6= 0 . Možemo pretpostaviti da je kxk∞ = 1 ,
-
tj. |xj | 6 1 i postoji k takav daje xk = 1 (u suprotnom pronademo komponentu xk s
najvećom apsolutnom vrijednošću medu - komponentama od x , i zatim gledamo vlastiti
vektor x1k x umjesto x ).
Ako su svi xj = 0 za j 6= k , onda gledajući jednadžbu Ax = λ x na k -toj
komponenti dobivamo akk = λ . Prema tome je λ ∈ Dkl za bilo koji l 6= k , jer je
|λ − akk | = 0 .
Pretpostavimo da nisu svi xj = 0 za j 6= k , i neka je onda xl druga najveća
komponenta po apsolutnoj vrijednosti:
1 = xk > |xl | > 0, |xl | > |xj |,
Pn
za sve j 6= k . Gledajući k -tu koponentu u Ax = λ x dobivamo j=1 akj xj = λ xk .
Oduzimajući akk xk s lijeva i desna dobivamo
Xn
(λ − akk )xk = akj xj . (1)
j=1
j6=k
Zbog
−1 0 3/2 −1 0 3/2
T = D (L + U) = 1/4 0 , (D + L) U = 0 −3/8 ,
p p
je spektar prve matrice
p { 3/8, − 3/8} , a druge {0, −3/8} . Prema tome je
r(D−1 (L + U)) = 3/8 < 1 i r((D + L)−1 U) = 3/8 < 1 , pa Jacobijeva i Gauss-
Seidelova metoda za problem Ax = b konvergiraju za svaki b . Primijetite da je u oba
slučaja kTk∞ = 3/2 > 1 .
DOKAZ. Doista, vrijedi X(t) c = c1 u1 (t) + . . . + cn un (t) , gdje su uj (t) stupci matrice
X(t) , a cj komponente vektora c ∈ Rn .
Drugi, izravni način da se to pokaže je jednostavan račun. Za x(t) = X(t) c vrijedi
x′ (t) = X′ (t) c = A(t)X(t) c = A(t)x(t), x(0) = X(0) c = Ic = c.
Može se pokazati da su rješenja X(t) , odnosno x(t) , za odgovarajuće Cauchyjeve
probleme jedincata.
Matrica X(t) ima zbog svoje važnosti poseban naziv: zove se fundamentalna ma-
trica (ili fundamentalno rješenje) Cauchyjeva problema X′ = A(t) X(t) , X(0) = I .
U uporabi je još jedan sugestivan naziv: evolucijska matrica.
Što je zapravo matrica X(t) ? Na to pitanje možemo odgovoriti u slučaju kad je
A(t) konstantna matrična funkcija, tj. A . Najprije, u jednodimenzionalnom slučaju
kad je A = a ∈ R , rješenje problema x′ = ax , x(0) = 1 , je x(t) = eat .
DOKAZ. Može se pokazati da je matrica X(t) uvijek regularna. Uvedimo novu funkciju
z(t) sa y(t) = X(t)z(t) , tj. z(t) = X(t)−1 y(t) . Onda je
y′ = X′ z + Xz′ .
P P P
Doista, i -ta koponenta vektora y je yi = j Xij zj , dakle y′i = j Xij′ zj + j Xij z′j .
Zbog y′ = A(t)y + f(t) vrijedi X′ z + Xz′ = A(t)Xz + f , dakle R t Xz
′
= f , tj.
′ −1 −1
z = X f . Integriranjem od 0 do t dobivamo z(t) − z(0) = 0 X (s)f(s) ds .
Budući da je Ry(t) = X(t)z(t) , onda je y0 = X(0)z(0) = Iz(0) = z(0) , pa imamo
t
z(t) = y0 + 0 X−1 (s)f(s) ds . Tvrdnja slijedi množenjem ove jednakosti s X(t) s
lijeva.
-
Primjer 13. Nadimo fundamentalnu matricu X(t) matrice
−7 4
A= −8 1 .
i maksimum se dostiže točno kada je x vlastiti vektor matrice A koji pripada vlastitoj
vrijednosti λ1 .
-
(b) Takoder,
(Ax | x)
λ1 = max .
x6=0 kxk2
U primjenama (na pr. u teoriji antena) od koristi je sljedeći rezultat o tzv. gene-
raliziranim vlastitim vrijednostima λ koja rješavaju problem Ax = λ Bx , x 6= 0
(zapravo, ovdje su nepoznanice parovi λ i x 6= 0 ). On predstavlja poopćenje Teorema
1. Naime, tvrdnja se svodi na Teorem 1 ako je matrica B jedinična. U tom slučaju
se nalaženje generalizirane vlastite vrijednosti λ svodi na problem nalaženja klasične
vlastite vrijednosti matrice A : Ax = λ x , x 6= 0 .
Maksimum se dostiže za x = e1 .
SKICA DOKAZA . (a) Pokažimo da postoji regularna matrica T takva da je
T∗ AT = D := diag (λ1 , . . . , λn ), T∗ BT = I.
Doista, neka je S ortogonalna matrica koja dijagonalizira B , tj. S∗ BS = D1 :=
diag (µ1 , . . . , µn ) . Pritom A prelazi u A1 := S∗ AS . Matrica A1 je takoder - hermitska
∗ ∗ ∗ ∗ ∗∗ ∗
jer je A1 = (S AS) = S AS = S AS = A1 . √ Budući da su
√zbog pozitivne def-
nitnosti od B svi µi > 0 , matrica D2 := diag (1/ µ1 , . . . , 1/ µn ) = D2 je dobro
definirana. Ona prevodi D1 u jediničnu matricu (umnošku triju dijagonalnih matrica
odgovara umnožak dijagonalnih elemenata):
D∗2 (S∗ BS)D2 = D2 D1 D2 = I.
Matrica A1 prelazi u novu hermitsku matricu
D∗2 (S∗ AS)D2 = D∗2 A1 D2 := A2 .
Neka je S1 ortogonalna matrica koja prevodi hermitsku matricu A2 u dijagonalnu:
S∗1 (D∗2 (S∗ AS)D2 )S1 = S∗1 A2 S1 = D := diag (λ1 , . . . , λn ).
Onda za T = SD2 S1 imamo T∗ AT = D i
T∗ BT = S∗1 (D∗2 (S∗ BS)D2 )S1 = S∗1 IS1 = I.
(b) Budući da je (T∗ )−1 = BT , onda je AT = T∗ −1 D = BTD . Neka je
T = [e1 , . . . , en ] , tj. ei su stupci od T . Budući da je TD = [λ1 e1 , . . . , λn en ] (provje-
ri!), onda iz AT = [Ae1 , . . . , Aen ] i BTD = B[λ1 e1 , . . . , λn en ] = [λ1 Be1 , . . . , λn Ben ]
dobivamo Aei = λi Bei . Vektori ei su svi 6= 0 jer je T = [e1 , . . . , en ] regularna
matrica.
(c) Vrijednosti λi dobivaju se iz jednadžbe det (λ I − D) = 0 , tj. det (λ T∗ BT −
T∗ AT) = 0 , tj. det (T∗ (λ B − A)T) = 0 , tj. prema Binet-Cauchyjevu teoremu, iz
jednadžbe det (λ B − A) = 0 .
(d) Iz svojstva T∗ BT = I , rabeći definiciju množenja matrica, slijedi da na mjestu
(i, j) vrijedi jednakost e∗i Bej = δij , tj. (ei | Bej ) = δij , tj. vektori ei su ortonormirani
s obzirom na skalarni produkt (x | y)b := (x | By) = (Bx | y) . Lako se provjeri da je
to doista skalarni produkt, na pr. (x | x)b = (Bx | x) > 0 za x 6= 0 . Primijetimo da je
(Aεi | ei ) = (λi Bei | ei ) = λi . Preostali dio dokaza je sličan kao dokaz Teorema 1.
Spomenimo na kraju bez dokaza sljedeći zanimljiv teorem koji daje varijacijski
opis vlastitih vrijednosti hermitske matrice A .
Nakon što smo dobili novu funkciju F ′ : X → L(X, Y) , općenito takoder - nelinear-
nu, na analogan način možemo definirati i njenu derivaciju na X , tj. F ′′ , jer je prostor
L(X, Y) takoder - normiran s operatorskom normom. Sada će prema prethodnom biti
definiran ovakav linearni operator iz X u L(X, Y) :
F ′′ (x) ∈ L(X, L(X, Y))
Drugim riječima, u točki x ∈ X za bilo koje vektore h, k ∈ X vrijedi da je
F ′′ (x)h ∈ L(X, Y) , dakle [F ′′ (x)h]k ∈ Y . Ovaj izraz često kraće zapisujemo kao
[F ′′ (x)h]k = F ′′ (x) (h, k) = F ′′ (x) hk ∈ Y.
′′
Drugim riječima, F (x) shvaćamo kao bilinearnu funkciju dviju varijabla iz X . Bili-
nearnost znači da je funkcija h 7→ F ′′ (x) hk linearna iz X u Y za bilo koji učvršćeni k
(tj. F ′′ (x) (λ1 h1 + λ2 h2 )k = λ1 F ′′ (x) h1 k + λ2 F ′′ (x) h2 k ), a funkcija k 7→ F ′′ (x) hk je
linearna za učvršćeni h (tj. F ′′ (x) h(λ1 k1 + λ2 k2 ) = λ1 F ′′ (x) hk1 + λ2 F ′′ (x) hk2 ).
Primijetite da funkcija (h, k) 7→ [F ′′ (x)h]k općenito nije linearna iz X × X u Y .
Vektorski prostor bilinearnih operatora iz X × X u Y označavamo sa L2 (X × X, Y) ,
pa je F ′′ (x) ∈ L2 (X × X, Y) .
tzv. Jacobijeva matrica preslikavanja F (ili Jacobijan od F ) i o(h) = (o1 (h), o2 (h)) .
tj.
′′ f x′′1 x1 h1 k1 + f x′′1 x2 (h1 k2 + h2 k1 ) + f x′′2 x2 h2 k2
F (x) hk = g′′x1 x1 h1 k1 + g′′x1 x2 (h1 k2 + h2 k1 ) + g′′x2 x2 h2 k2 .
Posebno,
′′ f x′′1 x1 h21 + 2f x′′1 x2 h1 h2 + f x′′2 x2 h22
F (x) hh = ∈ R2 .
g′′x1 x1 h21 + 2g′′x1 x2 h1 h2 + g′′x2 x2 h22
Prepoznajemo da su komponente od F ′′ (x) hh upravo drugi diferencijali funkcija f i
g.
Pokazuje se da je za vektorske funkcije F : R2 → R2 , kao u ovom primjeru,
moguć prikaz u obliku Taylorova razvoja. Na pr. za funkciju F klase C1 vrijedi
F(x + h) = F(x) + F ′ (x) h + o(h),
za h → 0 . Za funkciju klase C2 vrijedi
1 ′′
F(x + h) = F(x) + F ′ (x) h + F (x) hh + o(khk2 ),
2!
o(khk2 )
gdje je o(khk2 ) vektor koji trne brže od khk2 , točnije, takav da khk2 → 0 kad
h → 0.
6.
Singularna dekompozicija matrica
= max
−1
kAyk2 = max kAyk2 = kAk2 .
kV yk2 =1 kyk2 =1
Ovdje će nam biti od koristi matrično množenje opisati na drugi način. Ako su
A i B dvije ulančane matrice tipa m × n i n × p , tako da prvu shvatimo kao redak
sastavljen od n vektora stupaca, a drugu kao stupac sastavljen od n vektora redaka, tj.
b1
A = [a1 , . . . , an ], B = ... ,
bn
onda je
AB = a1 b1 + a2 b2 + . . . + an bn . (4)
Na desnoj strani imamo zbroj od n matrica tipa m × p (svaki pribrojnik je umnožak
matrica tipa (m, 1) i (1, p) ). Da bismo dokazali ovu jednakost, primijetimo da na
mjestu (i, j) na lijevoj strani stoji zbroj ai1 b1j + ai2 b2j + . . . + ain bnj . S desne pak strane
prva matrica na mjestu (i, j) ima broj ai1 b1j , druga ai2 b2j itd., a zadnja broj ain bnj .
u⊤n
-
Ovakav rastav nije moguće dobiti za bilo koju matricu. Medutim, moguće ga je dje-
lomice generalizirati na bilo koje matrice, pa čak i pravokutne. Vidi Teorem 3 niže.
λi ui u⊤
P
Moguć je i drugi dokaz jednakosti A = i . Rabeći asocijativnost množenja matrica
imamo:
X X
Ax = λi (x | ui )ui = λi ui (ui | x)
i i
!
λi ui (u⊤ λi (ui u⊤
X X
= i x) = i ) x.
i i
P ⊤
Budući da ovo vrijedi za sve x , zaključujemo da je A = i λi (ui ui ) .
Radi se o rastavu (ili dekompoziciji) pravokutne matrice A na umnožak triju spe-
cijalnih matrica: A = UDV⊤ , gdje su U i V ortogonalne. Pri tom se rabe singularne
vrijednosti od A , koje ćemo definirati malo kasnije. Ključnu ulogu u konstrukciji ra-
stava igraju kvadratne matrice A⊤ A i AA⊤ , pa zato pogledajmo neka njihova osnovna
svojstva.
Ako je A pravokutna matrica, onda je A⊤ A ne samo simetrična matrica, ne-
go i pozitivno semidefinitna. Isto vrijedi i za matricu AA⊤ . Posebno, sve vlastite
vrijednosti od A⊤ A (ili AA⊤ ) koje su različite od nula su pozitivne (tj. > 0 ).
-
Primjer 3. Nadimo sve vlastite vrijednosti matrice A⊤ A , ako je A = [1, −2, 2] .
a b
Primjer 4. Zadana je matrica A = gdje su a i b realni brojevi,
b a
a > b > 0 . Dokažimo da su vektori v1 = (1, 1)⊤ i v2 = (1, −1)⊤ vlastiti vektori.
Doista, izravnim množenjem dobivamo Av1 = (a + b)v1 , a Av2 = (a − b)v2 . Prema
tome su vlastite vrijednosti matrice A jednake λ1 = a + b i λ2 = a − b . Primijetite da
-
su pripadajući vlastiti vektori v1 i v2 medusobno okomiti, tj. v1 · v2 = 0 , jer je matrica
A simetrična. Neka je T unitarna matrica čije vektore stupce čine ortonomirani
" vektori
#
√1 √1
v1 √1 (1, 1)⊤ √1 (1, −1)⊤ , 2 2
v̂1 = = i v̂2 = tj. T = [v̂1 , v̂2 ] = √1
.
kv1 k 2 2
2
− √12
Onda je T−1 AT = D , gdje je D = diag (a + b, a − b) . Budući da je T = T⊤ , −1
1 1 -
Primjer 5. Zadana je matrica A =
2 −2 . Nadimo njenu singularnu de-
kompoziciju A = UDV⊤ , gdje su matrice U i V ortogonalne a D dijagonalna.
Primijetimo da matrica A nije simetrična, pa se ne može dijagonalizirati
s pomoću
⊤ 5 −3
samo jedne ortogonalne matrice. Matrica A A = −3 5 je simetrična, i
A⊤ A = (UDV⊤ )⊤ UDV⊤ = VD2 V , što predstavlja dijagonalizaciju te simetrične ma-
trice. Budući da je ta matrica istog oblika kao u prethodnom zadatku, onda je prvi
(normirani) vlastiti vektor od A⊤ A jednak v1 = √12 (1, 1)⊤ s pripadajućom vlastitom
vrijednošću λ1 = 5 − 3 = 2 , a drugi v2 = √1 (1, −1)⊤ s vlastitom vrijednošću
" 2 #
√1 √1
λ2 = 5 + 3 = 8 . Vidimo da je V = [v1 , v2 ] = 2
. Singularne vrijed-2
√1 − √1
√ √ 2 √ 2
√ √
nosti matrice A jednake
σ1 =
λ1 = 2 i σ2 = λ2 = 8 = 2 2 . S druge strane,
2 0
matrica AA⊤ = 0 8 ima prikaz AA⊤ = UD2 U⊤ , iz kojega možemo naći
matricu U . Doista, matrica AA⊤ je već sama dijagonalna, pa su njeni (normirani)
vlastiti vektori jednaki vektorima kanonske baze: u1 = (1, 0)⊤ s vlastitom vrijednošću
λ1 = 2 i λ2 = 8 , tj. U = [u1 , u2 ] = I . Singularni rastav matrice A je A = UDV⊤ , tj.
√ " √1 √1
#⊤
1 1 1 0 2 0
√ 2 2
2 −2 = 0 1 · · √1 √1
.
0 2 2 2
− 2
Matrica A prebacuje ortonormiranu
√ bazu {v1 , v2 } u ortonormiranu
√ bazu {u1 , u2 } , s
faktorima pojačanja 2 i 2 2 : Av1 = 2u1 i Av2 = 2 2u2 . Vidimo da ovdje nije
ispunjen uvjet σ1 > σ2 . Da bi on bio ispunjen, treba zamijeniti uloge dviju singularnih
vrijednosti, ali onda i poredak stupaca u matricama U i V , tj. stavljamo U1 = [u2 , u1 ]
i V1 = [u2 , u1 ] , D1 = diag {σ2 , σ1 } . Dakle singularna dekompozicija A = U1 D1 V⊤ 1
izgleda ovako:
√ " √1 √1
#⊤
1 1 0 1 2 2 √ 0 2 2
= 1 0 · · .
2 −2 0 2 − √12 √1
2
Provjerite.
Primjer 6.Pogledajmo
primjer singularnedekompozicije
za matricu koja nije re-
1 1 ⊤ 5 5
gularna: A = 2 2 . Ovdje je A A = 5 5 . Nulpodprostor (jezgra) te
matrice je razapet vektorom (1, −1)⊤ (tj. pripadajuća vlastita vrijednost je λ2 = 0 ),
a drugi vlastiti podprostor je okomit na njega: (1, 1)⊤ . Normirani vlastiti vektori su
v1 = √12 (1, 1) (s vlastitom vrijednošću λ1 = 5 + 5 = 10 ) i v2 = √12 (1, −1) (s
⊤ 1 2
λ2 = 5 − 5 = 0 ). Dakle V = [v1 , v2 ] . S druge strane je AA = 2 4 . Nul-
podprostor te matrice je razapet vektorom (2, −1)⊤ (tj. vlastiti podprostor s vlastitom
vrijednošću λ2 = 0 ), a drugi vlastiti vektor je okomit na njega: (1, 2)⊤ , s pripada-
jućom vlastitom vrijednošću λ2 = 10 (provjerite). Odgovarajući normirani vlastiti
vektori su u1 = √15 (2, 1)⊤ (s vlastitom vrijednošću λ1 = 10 ) i u2 = √15 (2, −1)⊤ (s
√ √
λ2 = √0 ), pa stavljamo U = [u1 , u2 ] . Singularne vrijednosti su σ1 = λ1 = 10 i
σ2 = λ2 = 0 . Prema tome, singularni rastav A = UDV⊤ matrice A glasi
" √1 √2
# √ " √1 √1
#⊤
1 1 5 5 10 0 2 2
= √2
· · .
2 2
5
− √15 0 0 √1
2
− √12
Jedinični vektori stupci ui zovu se lijevi singularni vektori, a jedinični vektori stupci
vi su desni singularni vektori matrice A , gdje je A = UDV⊤ singularna dekompozicija
matrice A . U jednakosti Avi = σi ui koeficijent σi > 0 govori o veličini deformacije
jediničnog vektora vi nakon djelovanja matrice A . Budući da su singularne vrijednosti
poredane u padajućem slijedu, tj. σ1 > . . . > σr > 0 , jasno je da prve singularne
vrijednosti uzrokuju najveću deformaciju. Zanemarujući male singularne vrijednosti
(tj. odbacujući σk+1 , . . . , σr , pretpostavljajući da su blizu nule), dobivamo da je, vidi
(9),
A ≈ Ak = σ1 u1 v⊤ ⊤
1 + . . . + σr uk vk . (11)
Pogreška je mala:
kA − Ak kF = kσk+1 uk+1 v⊤ ⊤
k+1 + . . . + σr ur vr kF
6 σk+1 kuk+1 v⊤ ⊤
k+1 kF + . . . + σr kur vr kF
6 σk+1 + . . . + σr 6 (r − k)σk+1 .
Već za relativno male k matrica Ak u (11) postaje vrlo blizu matrice A , uz
pretpostavku da je σk+1 malen. Drugim riječima, često je i vrlo malen broj (prvih
nekoliko) singularnih vrijednosti dovoljno da se dobije zadovoljavajući rezultat.
Evo jedan zanimljiv primjer koji navodimo prema Strangu [9, str. 332]. Treba
odaslati sliku prikazanu tablicom od 1000 × 1000 kvadratića (pixels), u kojoj je svaki
od milijun kvadratića (i, j) kodiran s nekim cijelim brojem aij . Taj broj predstavlja
boju kvadratića na tom mjestu u slici. Može li se barem donekle vjerno prenijeti slika,
a da se ne prenosi svih milijun podataka (brojeva) aij ? Može, i to na način koji je
-
iznenadujuće efikasan.
Najprije sliku shvatimo kao kvadratnu matricu A reda 1000 s tim brojevima.
Obavimo skraćenu singularnu dekompoziciju kao u (9), gdje na desnoj strani imamo
r pribrojnika, u kojem r može biti jako velik, ali 6 1000 . Ako umjesto cijele sume
uzmemo samo prvih 20 pribrojnika, tj. matricu A20 , vidi (11), i pošaljemo pripadajućih
20 + 20 · 2000 podataka ( 20 za σi -ove, 20 · 1000 za u1 , . . . , u20 , i još 20 · 1000 za
v1 , . . . , v20 ), dobiva se često slika zadovoljavajućih karakteristika u detaljima. Razlog
je taj što prvih dvadeset singularnih vrijednosti dominira nad ostalima. Prenijeli smo
samo 40 020 podataka umjesto milijun, što je ogromna ušteda. Naravno, platili smo
cijenu na drugom mjestu, prilikom proračuna singularnih vrijednosti σi matrice A , te
proračuna lijevih i desnih singularnih vektora ui i vi za i = 1, . . . , r . Zato ta metoda
nije upotrebljiva za matrice pretjerano velikog reda. Od velikog je interesa znati što je
moguće efikasniju metodu za nalaženje singularne dekompozicije matrice.
Algoritmi za singularnu dekompoziciju matrice A izbjegavaju proračun matrica
A⊤ A i AA⊤ , nego rade izravno samo s matricom A .
Jedan od najboljih danas poznatih algoritama za singularni rastav matrice potječe
od dvojice hrvatskih matematičara, profesora Zlatka Drmača i Krešimira Veselića, vidi
http://web.math.hr/˜drmac/. Njegova složenost je 4 · mn2 za m 6 n , odnosno
4 · nm2 za m > n . Za svoje su objavljene radove na tu temu godine 2009. dobili
nagradu ugledne medunarodne- organizacije SIAM (Society for Industrial and Applied
Mathematics).
Primjer 14. Evo primjera singularnih rastava još nekih matrica A u obliku A =
UDV⊤ (pogledajte http://www.bluebit.gr/matrix-calculator):
1 0 0 1 3 0 0 1
= UDV⊤ =
0 3 1 0 0 1 1 0
1 2 0.585 −0.811 3.650 0 0.160 0.987
=
0 3 0.811 0.585 0 0.822 −0.987 0.160
1 0 4 −0.788 −0.615 4.821 0 0
= ×
0 3 2 −0.615 0.788 0 2.599 0
" #
−0.163 −0.383 −0.909
× −0.237 0.910 −0.341
−0.958 −0.160 0.239
6. SINGULARNA DEKOMPOZICIJA MATRICA 35