Professional Documents
Culture Documents
DIPLOMSKO DELO
Klavdija Križnik
Maribor, 2011
UNIVERZA V MARIBORU
Diplomsko delo
NENEGATIVNE MATRIKE
Mentor: Kandidatka:
Maribor, 2011
ZAHVALA
Posebna zahvala gre tudi moji družini in Boštjanu, ki so mi v vseh letih študija stali
ob strani, me vzpodbujali ter verjeli vame.
IZJAVA
Podpisana Klavdija Križnik, rojena 14. novembra 1987, študentka Fakultete za na-
ravoslovje in matematiko Univerze v Mariboru, študijskega programa matematika,
izjavljam, da je diplomsko delo z naslovom
NENEGATIVNE MATRIKE
pri mentorju doc. dr. Igorju Klepu avtorsko delo. V diplomskem delu so uporabljeni
viri in literatura korektno navedeni; teksti niso uporabljeni brez navedbe avtorjev.
Klavdija Križnik
Nenegativne matrike
program diplomskega dela
Realna matrika je nenegativna, če so vsi njeni elementi nenegativna realna števila. V
delu naj se kandidat seznani z osnovnimi lastnostmi nenegativnih matrik. Kot glavni
rezultat naj bo dokazan Perron-Frobeniusov izrek, ki govori o lastnih vrednostih in
lastnih vektorjih pozitivnih in nenegativnih matrik. Delo naj vsebuje tudi pregled
nekaterih razredov matrik, ki so sorodni nenegativnim matrikam; npr. M-matrike,
stohastične in bistohastične matrike. Delo naj vsebuje tudi kratek pregled osnovnih
pojmov o matrikah, ki so potrebni za lažje razumevanje besedila.
Osnovni viri:
IZVLEČEK
ABSTRACT
The first chapter serves as an overview of the basic phrases from the field of matrices. The
second chapter introduces nonnegative matrices with an emphasis on the Perron-Frobenius
theorem, which describes eigenvalues and eigenvectors of nonnegative square matrices. As
a special example of nonnegative matrices the thesis also describes stochastic matrices.
The last two chapters demonstrate the connection between nonnegative matrices and M-
matrices as well as generalized permutation matrices.
Uvod 1
1 Matrike 2
1.2 Determinanta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4 Diagonalizacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Nenegativne matrike 21
3 M -matrike 44
Zaključek 64
Literatura 65
ix
Uvod
V diplomskem delu bomo predstavili nenegativne matrike. Pri razvoju teorije nenegativnih
matrik sta imela pomemben vpliv matematika Oskar Perron in Ferdinand Georg Frobenius.
Njun izrek o lastnih vrednostih nenegativnih matrik bomo dokazali v drugem poglavju.
Sicer pa se Perron-Frobeniusov izrek uporablja tudi v verjetnosti, v teoriji dinamičnih pro-
cesov, na področju ekonomije in demografije, kot matematično ozadje internetnih iskalnikov
in celo pri uvrstitvi nogometnih reprezentanc. Spoznali bomo posebne nenegativne matrike,
ki jih imenujemo stohastične matrike. Te matrike so zaradi svoje oblike, vsota elementov
v vsaki vrstici stohastične matrike je enaka ena, uporabne predvsem v teoriji verjetnosti.
Med drugim predstavljajo matrike prehoda v Markovskih verigah.
1
Poglavje 1
Matrike
V prvem razdelku bomo zapisali definicijo in lastnosti matrike. Omenili bomo več vrst
matrik, jih opisali in prikazali na konkretnih primerih. Nato pa se bomo osredotočili še na
računanje z matrikami in zapisali osnovne lastnosti računskih operacij.
V drugem delu prvega poglavja bomo definirali determinanto matrike. Pogledali si bomo
kako se determinante izračunajo ter opisali njihov razvoj po vrstici in stolpcu. Nato bomo
dokazali nekaj lastnosti, ki veljajo zanje.
V naslednjem delu poglavja bomo vpeljali pojma lastne vrednosti in lastnega vektorja.
Predstavili bomo karakteristični in minimalni polinom ter pojasnili njun pomen. Omenili
in definirali bomo tudi spekter matrike.
2
1.1 Osnovno o matrikah 3
Naj bosta m in n naravni števili. Tedaj tabelo števil velikosti m × n imenujemo matrika
razsežnosti (ali reda) m × n. Označujemo jih z velikimi črkami. Matrika velikosti m × n
ima m vrstic in n stolpcev, splošno pa jo zapišemo tako:
a11 a12 ··· a1n
a21 a22 · · · a2n
A= . = [aij ]m×n .
.. .. .. ..
. . .
am1 am2 · · · amn
Matrika A je razsežnosti 3 × 4, saj ima tri vrstice in štiri stolpce. Element a23 matrike A
leži v drugi vrstici in tretjem stolpcu ter ima vrednost 4.
Matriko, ki ima enako število vrstic in stolpcev, torej matriko razsežnosti n × n imenujemo
kvadratna matrika. Kvadratna matrika, ki ima vse elemente, razen elementov aii na
diagonali, enake 0, se imenuje diagonalna matrika.
1.1 Osnovno o matrikah 4
(AT )T = A.
kjer je Auv = [aij ]ru ×nv , za u ∈ 1, 2, ..., r in v ∈ 1, 2, ..., n. Matrike A11 , A12 ,..., Arn imenu-
jemo bloki matrike A.
Računanje z matrikami
Matriki A in B sta enaki, če imata isto dimenzijo in se ujemata v vseh istoležnih ele-
mentih. Torej matriki A reda m × n in B reda p × q sta enaki natanko tedaj, kadar je
m = p, n = q in velja aij = bij za vsak i = 1, ..., m in j = 1, ..., n.
Torej matriko množimo s skalarjem α tako, da vsak element pomnožimo z α. Matriki reda
m × n pa seštejemo tako, da seštejemo vse istoležne elemente.
Naj bosta matriki A, B ∈ Mm×n (R). Potem je vsota matrik definirana s predpisom
a11 + b11 a12 + b12 ··· a1n + b1n
a21 + b21 a22 + b22 · · · a2n + b2n
A+B = .
.
.. .. .. ..
. . .
am1 + bm1 am2 + bm2 · · · amn + bmn
Te lastnosti sledijo iz podobnih lastnosti za seštevanje realnih števil, zato jih ne bomo
dokazovali. Naslednje lastnosti pa veljajo za seštevanje in množenje matrik s skalarjem in
tudi sledijo iz podobnih lastnosti za seštevanje in množenje realnih števil:
(α + β)A = αA + βA,
Iz definicije seštevanja matrik izhaja, da ima matrika −A vse elemente nasprotnega pred-
znaka kot matrika A: −A = [−aij ].
Element cij lahko opišemo na kratko kot skalarni produkt i-te vrstice matrike A in j-tega
stolpca matrike B.
Naj bodo A, B in C dane matrike. Naštejmo še nekaj lastnosti množenja matrik, če so
matrike A, B in C takih razsežnosti, da so računske operacije izvedljive:
• (AB)T = B T AT ,
Za nekatere matrike lahko definiramo matriko, ki ima analogen pomen, kot ga ima pri
realnih številih obratno število danega števila. Torej, če število a ni enako 0, lahko najdemo
tako število x, da velja ax = xa = 1. Število x imenujemo obratno število števila a in ga
označimo z a−1 . Med matrikami ima identična matrika I enako vlogo kot število 1 med
realnimi števili, saj smo ugotovili, da velja AI = IA = A.
Naj bo A kvadratna matrika in I identična matrika istega reda kot A. Če obstaja kvadratna
matrika X, ki zadošča pogojema AX = I in XA = I, jo imenujemo inverzna ali obratna
matrika matrike A. Označimo jo z A−1 . Matrika, pri kateri obstaja inverzna matrika, se
imenuje obrnljiva matrika.
• (A−1 )−1 = A,
• (AB)−1 = B −1 A−1 ,
1.2 Determinanta
V tem poglavju bomo vpeljali pojem determinante matrike, spoznali računanje z determi-
nantami in obravnavali njene lastnosti.
Determinanta je torej vsota vseh možnih produktov, kjer iz vsake vrstice in vsakega stolpca
izberemo po en element.
Razvoj determinante
det[a] = a.
Temu zapisu pravimo razvoj determinante po prvi vrstici. Determinantam, ki jih dobimo
tako, da v matriki A prečrtamo eno ali več vrstic in stolpec, pravimo poddeterminante
matrike A. V našem zapisu so torej determinante Dij poddeterminante matrike A.
je enaka
a
22 a23
a
21 a23
a
21 a22
det A = a11 − a12 + a13 .
a32 a33 a31 a33 a31 a32
3 0 1
2 5 1 5 1 2
det A = 1 2 5 = 3 − 0 + 1
4 2 −1 2 −1 4
−1 4 2
det A = a11 (a22 a33 − a23 a33 ) − a12 (a21 a33 − a23 a31 ) + a13 (a21 a32 − a22 a31 ).
S primerjavo členov lahko ugotovimo, da dobimo isti rezultat, če determinanto det A razvi-
jemo po prvem stolpcu namestu po prvi vrstici:
a
22 a23
a
12 a13
a
12 a13
det A = a11 − a21 + a31 .
a32 a33 a32 a33 a22 a23
Prav tako dobimo isti rezultat, če determinanto razvijemo po katerikoli drugi vrstici ali
stolpcu. Splošno torej velja:
n
X n
X
det A = aij (−1)i+j Dij = aij (−1)i+j Dij .
j=1 i=1
Produkt
Aij = (−1)i+j Dij
v razvoju determinante imenujemo kofaktor elementa aij v matriki A. Torej lahko razvoj
determinante po i-ti vrstici zapišemo krajše
n
X
det A = aij Aij ,
j=1
Lastnosti determinante
det A = det AT .
Izrek 1.2 Če v kvadratni matriki A zamenjamo dve vrstici, dobimo matriko A0 in velja
det A0 = − det A.
Dokaz. Naj bo A kvadratna matrika, v kateri zamenjamo dve sosednji vrstici. Naj bosta
to i-ta in (i + 1)-ta vrstica. Novo matriko označimo z A0 , njene elemente pa z a0ij . Nato
det A razvijemo po i-ti vrstici in det A0 po (i + 1)-ti vrstici. Vrstici imata iste elemente,
ustrezni kofaktorji pa se razlikujejo samo po predznaku, saj se vsota indeksov vrstice in
stolpca pri vsakem kofaktorju spremeni za 1.
n
X
det A = ak Ak
k=1
n
X n
X n
X
det A0 = a0i+1k A0i+1k = aik (−Aik ) = − aik Aik = − det A.
k=1 k=1 k=1
Če pa v matriki zamenjamo dve enaki vrstici, je dobljena matrika A0 enaka matriki A, torej
je
det A = det A0 = − det A in det A = 0.
V primeru, da ima matrika A v kakšni vrstici same ničle, je njena determinanta enaka 0.
Prav tako pa je det A = 0, če je ena vrstica v matriki A večkratnik kakšne druge vrstice.
Izrek 1.4 Če pomnožimo vse elemente kakšne vrstice ali kakšnega stolpca kvadratne ma-
trike A s skalarjem α, je determinanta nove matrike A0 enaka produktu determinante ma-
trike A in skalarja α.
Če lahko v matriki A vse elemente kakšne vrstice zapišemo kot vsoto dveh členov, potem
je njena determinanta enaka vsoti dveh determinant
a11 ··· a1n a11 · · · a1n a11 · · · a1n
.
.. .. .
. .. .
. ..
. . . . .
ai1 + bi1 · · · ain + bin = ai1 · · · ain + bi1 · · · bin .
.. .. .
.. .. .
.. ..
. . . .
an1 ··· ann an1 · · · ann an1 · · · ann
Determinanta matrike se ne spremeni, če kakšni vrstici matrike prištejemo večkratnik kakšne
druge vrstice.
det(αA) = αn det A.
Dokaz. Naj bo C = AB. Naj bodo c1 , c2 , ..., cn stolpci matrike C, a1 , a2 , ..., an stolpci
matrike A in
b11 b12 · · · b1n
b21 b22 · · · b2n
B= .
.. .. .. ..
. . . .
bn1 bn2 · · · bnn
Potem je
n
X
cj = bij j aij .
ij =1
det C = c1 c2 · · · cn
P
n Pn Pn
= b a b a · · · b a
i1 =1 i1 1 i1 i2 =1 i2 2 i2 in =1 in n i1 n
X n X n Xn
= ··· bi1 1 ai1 bi2 2 ai2 · · · bin n ain
i1 =1 i2 =1 in =1
X n X n Xn
= ··· bi1 1 bi2 2 · · · b1n n ai1 a i2 · · · ain
i1 =1 i2 =1 in =1
X
= bπ(1)1 bπ(2)2 · · · bπ(n)n aπ(1) aπ(2) · · · aπ(n)
π∈Sn
X
= s(π)bπ(1)1 bπ(2)2 · · · bπ(n)n a1 a2 · · · an
π∈Sn
V tem poglavju bomo definirali pojma lastne vrednosti in lastnega vektorja matrik. Nato
bomo predstavili karakteristični in minimalni polinom ter zapisali nekaj njunih lastnosti.
Na koncu pa bomo vpeljali še pojem spektra matrike.
Ax = λx.
Vsi standardni bazni vektorji e1 , ..., en so lastni vektorji matrike A, saj je Aei = ai ei . La-
stna vrednost, ki pripada vektorju ei , je diagonalni element ai .
Ax = λx = λIx,
Lastne vrednosti so tista števila λ, pri katerih ima ta enačba netrivialne rešitve. Lastni
vektorji so torej netrivialne rešitve homogenega sistema linearnih enačb, kjer je matrika
koeficientov enaka (A − λI). Homogen sistem pa ima netrivialne rešitve samo v primeru,
če je rang matrike koeficientov manjši od n, torej, če je
det(A − λI) = 0.
Pri tem je rang matrike A število linearno neodvisnih vrstic oziroma stolpcev matrike.
Linearna neodvisnost vrstic ali stolpcev pomeni, da se posamezne vrstice ali stolpci ne mo-
rejo izraziti z drugimi.
Izrek 1.9 Lastne vrednosti kvadratne matrike A reda n so ničle karakterističnega polinoma
matrike, torej rešitve enačbe
det(A − λI) = 0.
(A − λI)x = 0.
n − rang(A − λI).
Karakteristični polinom za A je
5−λ 4
pA (λ) = det(A − λI) = = (5 − λ)(2 − λ) − 4 = λ2 − 7λ + 6 = (λ − 6)(λ − 1).
1 2−λ
1.3 Lastne vrednosti in lastni vektorji 17
(A − 6I)x1 = 0 in (A − I)x2 = 0.
" # " #
4 −1
Za rešitvi teh dveh enačb izberemo npr. x1 = in x2 = .
1 1
Trditev 1.10 Če sta si matriki A in B podobni, potem imata enaka karakteristična poli-
noma.
Dokaz. Dve kvadratni matriki enake velikosti A in B sta podobni, če obstaja obrnljiva
matrika P , za katero velja A = P BP −1 . Potem z uporabo te definicije in lastnosti deter-
minante sledi:
Ker so lastne vrednosti ničle karakterističnega polinoma, ki je polinom stopnje n, je vsota al-
gebraičnih večkratnosti vseh lastnih vrednosti enaka n. To sledi iz osnovnega izreka algebre.
2−λ 1 0
pA (λ) = 0
1 − λ −1 = (2 − λ)((1 − λ)(4 − λ) + 2)
4−λ
0 2
= (2 − λ)(λ2 − 5λ + 6) = (2 − λ)2 (3 − λ).
Za λ1 = 2 je
0 1 0
A − 2I =
0 −1 −1 .
0 2 2
Ker sta druga in tretja vrstica v A − 2I linearno odvisni, je rang r(A − 2I) = 2. Potem je
g(2) = 3 − 2 = 1.
Za λ2 = 3 dobimo
−1 1 0
A − 3I =
0 .
−2 −1
0 2 1
Zopet sta druga in tretja vrstica v A − 3I linearno odvisni. Torej je rang r(A − 3I) = 2 in
je g(3) = 1.
1.4 Diagonalizacija
Ax = β1 u1 + · · · + βn un
in velja
α1 x1 y1 β1
. .. .. .
AP .. = A = .. .
. =P
.
αn xn yn βn
Matrika P je obrnljiva, ker ima v stolpcih linearno neodvisne vektorje u1 , ..., un , torej je
β1 α1
. .
.. = P −1 AP .. .
βn αn
1.4 Diagonalizacija 20
Prav tako pa je P −1 AP matrika, ki ima v stolpcih slike baznih vektorjev Au1 = λ1 u1 , ..., Aun =
λn un , zapisanih v bazi u1 , ..., un . Torej je
λ1 0 ··· 0
0 λ2 · · · 0
P −1 AP = D =
.. .. . . ..
. . . .
0 0 · · · λn
Izrek 1.13 Če je A ∈ Mn (R) matrika, ki ima n linearno neodvisnih lastnih vektorjev
u1 , ..., un , sestavljajo ti vektorji bazo prostora Rn . Naj bo P prehodna matrika med to bazo
in standardno bazo prostora Rn . P ima torej v stolpcih vektorje u1 , ..., un . Produkt
D = P −1 AP
Nenegativne matrike
V tem poglavju bomo naprej razložili pojem nenegativnih matrik, kasneje bomo predstavili
še njihovo uporabo. Nenegativne matrike so matrike, ki imajo za elemente nenegativna
števila. Dokazali bomo Perron-Frobeniusov izrek, ki opisuje lastnosti največjih lastnih vre-
dnosti in pripadajočih lastnih vektorjev nenegativnih kvadratnih matrik. Najprej bomo s
pomočjo Brouwerjevega izreka o negibni točki dokazali šibko obliko Perron-Frobeniusovega
izreka, ki pravi, da je pripadajoči lastni vektor največje lastne vrednosti nenegativne matrike
nenegativen. Nato bomo definirali nerazcepne matrike in zapisali nekaj trditev, ki veljajo za
nenegativne nerazcepne matrike, saj jih bomo potrebovali pri formulaciji in dokazu krepke
oblike Perron-Frobeniusovega izreka. Ta pravi, da je največja lastna vrednost nenegativne
nerazcepne matrike enostavna, njen pripadajoči lastni vektor pa je pozitiven.
V zadnjem razdelku tega poglavja bomo predstavili in zapisali še nekaj lastnosti posebnih
nenegativnih matrik, ki jim pravimo stohastične matrike. To so matrike, katerih elementi
so nenegativna števila, vsota elementov vsake vrstice pa je enaka ena. V primeru, da je tudi
vsota elementov vsakega stolpca enaka ena, pa je matrika bistohastična. Poseben primer
bistohastične matrike je permutacijska matrika. Eden pomembnejših izrekov, ki pojasnjuje
vlogo permutacijskih matrik je Birkhoffov izrek, ki pravi, da je matrika bistohastična, ko
je enaka konveksni kombinaciji permutacijskih matrik. Dokazali ga bomo s pomočjo Krein-
Milmanovega izreka o kompaktnih konveksnih množicah. Na koncu pa bomo na konkretnem
primeru ponazorili razcep bistohastične matrike na bločno strukturo, kjer bloki, dobljeni iz
enako indiksiranih particij razcepa, predstavljajo stohastične matrike. Pokazali bomo, da
lahko najdemo še boljši razcep matrike, ki ga imenujemo kanonični razcep. Ustrezni bloki
tega razcepa spadajo med bistohastične matrike.
21
2.1 Uvod v nenegativne matrike 22
Naj bo dan x ∈ Cn . Z |x| označimo nenegativen vektor, katerega koordinate so števila |xj |.
Podobno, če A ∈ Mn (C), ima matrika |A| elemente |aij |.
in zato je Ax > 0.
2.2 Perron-Frobeniusov izrek 23
V tem razdelku poglavju bomo dokazali dve obliki Perron-Frobeniusovega izreka. Prva šibka
oblika izreka velja za nenegativne matrike, medtem ko druga krepka oblika izreka velja za
nenegativne nerazcepne matrike.
Izrek 2.3 (Brouwerjev izrek) Naj bo S neprazna, zaprta, omejena in konveksna množica
v Rn in naj bo f : S → S zvezna preslikava. Potem obstaja takšen x ∈ S, da je f (x) = x.
Pri tem točko x imenujemo negibna točka preslikave f .
To je zaprta konveksna in neprazna množica, saj vsebuje vektor |v|. Prav tako je omejena,
saj za x ∈ C velja, da je 0 ≤ xj ≤ 1 za vsak j. Ločimo dva primera:
1 1
Af (x) = AAx ≥ Aρ(A)x = ρ(A)f (x).
||Ax||1 ||Ax||1
Ker je f (x) ≥ 0, ||f (x)||1 = 1 in Af (x) ≥ ρ(A)f (x) sledi, da je f (C) ⊂ C. Sedaj upo-
rabimo Brouwerjev izrek, ki trdi, da ima zvezna funkcija, ki se preslika iz kompaktne
konveksne podmnožice Rn sama vase, negibno točko.
Ay
f (y) = = y.
||Ay||1
Od tod sledi, da je
Ay = f (y)||Ay||1 = y||Ay||1 .
Naj bo r lastna vrednost, katere pripadajoči lastni vektor je y. Torej je Ay = ry. Prav
tako pa je Ay = y||Ay||1 , zato sledi, da je ry = y||Ay||1 oziroma r = ||Ay||1 . Negibna
točka y funkcije f je torej nenegativni lastni vektor za lastno vrednost r = ||Ay||1 ,
saj je y = f (y) ≥ 0.
Ta dokaz lahko uporabimo tudi v primeru, kjer imamo realno število r in neničelni vektor
y, tako da je y ≥ 0 in Ay ≥ ry. Za C pa vzamemo takšno množico vektorjev x, da je
X
xi = 1, x≥0 in Ax ≥ rx.
i
Nerazcepne matrike
Prav tako pa je matrika A reda n × n, kjer je n ≥ 2, razcepna, če za vsak element aij , kjer
i ∈ S in j ∈
/ S ter je S neprazna podmnožica množice {1, ..., n}, velja aij = 0.
Naslednja trditev nam pove, kdaj iz nenegativnih in nerazcepnih matrik dobimo pozitivno
matriko.
Trditev 2.5 Če je A ∈ Mn (R) nenegativna in nerazcepna matrika, potem je (I+A)n−1 > 0.
xm = (I + A)m x,
Privzemimo, da je kardinalnost množice Pm strogo manjša od n, kar označimo kot |Pm | < n.
Tedaj obstaja vsaj ena ničelna komponenta, indeksi le teh pa tvorijo neprazno podmnožico
I, ki je komplement množice Pm . Torej je tudi I ⊂ {1, 2, ..., n}. Ker pa je A nerazcepna
matrika, obstaja neničelni element aij , kjer i ∈ I in j ∈ Pm . Torej je
xm+1
i ≥ aij xm
j > 0,
kar pomeni, da Pm+1 ni enaka Pm in zato je |Pm+1 | > |Pm |. Z indukcijo pridemo do sklepa,
da je |Pm | ≥ min{m + 1, n}. Torej je |Pn−1 | = n. To pa pomeni, da ima vektor
xn−1 = (I + A)n−1 x
Preden dokažemo še krepko obliko Perron-Frobeniusovega izreka si zapišimo tri leme, ki
nam bodo v pomoč pri dokazu izreka.
2.2 Perron-Frobeniusov izrek 27
x ≥ 0, ||x||1 = 1, Ax ≥ rx.
Lema 2.6 Naj bo A nenegativna in nerazcepna matrika in naj bosta r ≥ 0 ter x ≥ 0 takšna,
da bo Ax ≥ rx in Ax 6= rx. Potem obstaja takšen r0 > r, da je Cr0 neprazna množica.
Dokaz. Naj bo
y = (In + A)n−1 x.
Ay
Torej je Ay − ry > 0 oziroma Ay > ry. Če to neenakost delimo z y dobimo, da je y > r.
Zato definirajmo
(Ay)j
r0 = min .
j yj
To pomeni, da je r0 strogo večji od r. Od tod pa sledi, da je Ay ≥ r0 y. Torej je množica
y
Cr0 neprazna, saj vsebuje vektor ||y||1 .
Dokaz. Naj bo x nenegativni lastni vektor in Ax = λx. To lahko zapišemo tudi kot
(I + A)x = Ix + Ax = x + λx = (I + λ)x.
1
x= (I + A)x.
(1 + λ)
Izraz na desni strani je strogo pozitiven zaradi trditve 2.5. Od tod pa sledi, da je vektor x
pozitiven.
2.2 Perron-Frobeniusov izrek 28
Lema 2.8 Naj bosta A, B ∈ Mn (C) matriki, kjer je A nerazcepna matrika in |B| ≤ A.
Potem je ρ(B) ≤ ρ(A). V primeru enakosti ρ(B) = ρ(A) pa velja naslednje:
• |B| = A;
Dokaz. Za dokaz neenakosti postopamo enako kot v prejšnji lemi. Če je λ lastna vrednost
matrike B in je |λ| = ρ(B), x pa je normiran lastni vektor, potem je
ρ(B) ≤ R = ρ(A).
Raziščimo še primer enakosti. Če je ρ(B) = ρ(A), potem |x| ∈ Cρ(A) in zato je |x| lastni
vektor. Torej velja
A|x| = ρ(A)|x| = ρ(B)|x| ≤ |B| · |x|.
Od tod sledi (A − |B|)|x| ≤ 0. Zaradi leme 2.7 je |x| > 0 in po predpostavki je A − |B| ≥ 0.
Torej velja |B| = A.
x ≥ 0, ||x||1 = 1, Ax ≥ rx.
pri tem pa je
n
X
||A||1 = max |aij |.
1≤j≤n
i=1
Definirajmo
R = sup{r|Cr 6= Ø}.
Naj bo x ∈ CR . Potem lema 2.6 pove, da je x lastni vektor matrike A z lastno vrednostjo R.
Opazimo lahko, da je ta lastna vrednost večja od ρ(A), saj pripada intervalu [ρ(A), ||A||1 ],
zato sklepamo, da je ρ(A) = R. Torej je ρ(A) lastna vrednost, katere pripadajoči lastni
vektor je x in ρ(A) > 0. Po lema 2.7 pa je x > 0.
Naj bo pA (X) karakteristični polinom matrike A, podan kot n-linearna preslikava (deter-
minante) s polinomsko vektorsko funkcijo (s stolpci matrike XIn − A):
h i
pA (X) = det(XIn − A) = det (XIn − A)(1) (XIn − A)(2) · · · (XIn − A)(n) .
Karakteristični polinom torej sestavlja n stolpcev. Pri tem pa smo z (XIn − A)(1) označili
prvi stolpec, z (XIn −A)(2) drugi stolpec,..., ter z (XIn −A)(n) n-ti stolpec matrike (XIn −A).
Sedaj izračunajmo odvod polinoma pA (X) po X-u in sicer tako, da odvajamo vsak stolpec
posebej.
2.2 Perron-Frobeniusov izrek 30
Torej je
kjer je aj j-ti stolpec matrike XIn − A in je {e1 , ..., en } kanonična baza množice Rn , saj
pri odvajanju posameznega stolpca matrike XIn − A po X-u dobimo enotske vektorje. Če
nato razširimo j-to determinanto skladno z j-tim stolpcem, dobimo
n
X
p0A (X) = pAj (X),
j=1
kjer Aj ∈ Mn−1 (R) dobimo iz matrike A tako, da izbrišemo j-ti stolpec in j-to vrstico.
ρ(Bj ) = ρ(Aj ).
in je pozitiven.
Opomba 2.10 Čeprav Perron-Frobeniusov izrek trdi, da je ρ(A) enostavna lastna vrednost,
ne pove ničesar o drugih največjih lastnih vrednostih po absolutni vrednosti. Naslednji pri-
mer nakazuje, da bi takšne lastne vrednosti lahko obstajale:
" #
0 1
.
1 0
Opomba 2.11 Še en dokaz šibke oblike Perron-Frobeniusovega izreka dobimo z uporabo
krepke oblike na izrazu A + αJ, kjer je J > 0 in α > 0, pri čemer α pošljemo proti 0.
Naj bo
A0 = A + αJ.
Ker je α > 0 in J > 0, je A0 > 0. Zato ima matrika A0 največjo lastno vrednost ρ(A0 )
takšno, da je
ρ(A0 ) ≥ |λ0i |.
A0 x0 = ρ(A0 )x0 .
2.2 Perron-Frobeniusov izrek 32
Lastne vrednosti in lastni vektorji so zvezne funkcije elementov matrike, zato gre A0 → A in
ρ(A0 ) → ρ(A), ko gre α → 0. Prav tako gredo λ0i → λi , kjer so λi lastne vrednosti matrike
A in je
ρ(A) ≥ |λi | ≥ 0.
Od tod pa sledi, da je
Ax = ρ(A)x
Opomba 2.12 Če ne privzamemo, da je matrika nerazcepna, bi ρ(A) lahko bila večkratna
lastna vrednost in nenegativni vektor ne bi nujno bil pozitiven. To velja npr. za matrike
velikosti n = 2m, ki imajo bločni zapis
" #
B 0m
A= .
Im B
Tukaj je ρ(A) = ρ(B) in vsaka lastna vrednost ima sodo algebraično večkratnost. Še več,
če je ρ(B) enostavna lastna vrednost matrike B katere pripadajoči lastni vektor je z ≥ 0,
potem jedro A − ρ(A)In napenja vektor
" #
0m
,
z
ki ni pozitiven.
2.3 Stohastične matrike 33
Nenegativna matrika A je stohastična saj je vsota elementov vsake vrstice enaka 1, prav
tako pa je bistohastična, saj je tudi vsota elementov vsakega stolpca enaka 1.
Naj bo M stohastična matrika, potem so vsi njeni elementi manjši od ena in je vsota
elementov v vsaki vrstici enaka ena. Če matriko M pomnožimo z vektorjem x ∈ Cn ,
dobimo vektor, katerega absolutna vrednost koordinat je manjša ali pa enaka absolutni
vrednosti koordinat vektorja x. Torej je ||M x||∞ ≤ ||x||∞ za vsak x ∈ Cn , pri tem je ||x||∞
supremum norma vektorja in je enaka
Naj bo x lastni vektor in λ lastna vrednost matrike M . Potem je ||M x||∞ = ||λx||∞ =
|λ| · ||x||∞ . Prav tako velja ||M x||∞ ≤ ||x||∞ in zato sledi, da je |λ| ≤ 1. Torej je ρ(M ) ≤ 1.
Ker pa je M e = e, je pravzaprav ρ(M ) = 1.
2.3 Stohastične matrike 34
Stohastične matrike imajo pomembno vlogo pri študiju markovskih verig. Poseben primer
bistohastične matrike je permutacijska matrika P (σ) (σ ∈ Sn ), katere elementi so
j
pij = δσ(i) .
Zgled 14 Naj bo !
1 2 3
σ= ∈ S3 .
3 1 2
Potem je
1
p11 = δσ(1) = δ31 = 0, 1
p21 = δσ(2) = δ11 = 1, 1
p31 = δσ(3) = δ21 = 0,
2
p12 = δσ(1) = δ32 = 0, 2
p22 = δσ(2) = δ12 = 0, 2
p32 = δσ(3) = δ22 = 1,
3
p13 = δσ(1) = δ33 = 1, 3
p23 = δσ(2) = δ13 = 0, 3
p33 = δσ(3) = δ23 = 0.
Vlogo permutacijskih matrik pojasnjuje Birkhoffov izrek. Pri dokazu Birkhoffovega izreka
si bomo pomagali s Krein-Milmanovim izrekom. Njegov dokaz pa najdemo v knjigi [8].
λx + (1 − λ)y ∈ D.
α1 v1 + α2 v2 + .. + αn vn ,
in
M = α1 P1 + · · · + αr Pr .
Ker je ∆n zaprta in omejena množica, torej kompaktna, lahko sedaj uporabimo Krein-
Milmanov izrek, ki torej pravi, da je konveksna kompaktna podmnožica množice Rn konve-
ksna ovojnica svojih ekstremnih točk, torej množica težišč njihovih ekstremov.
(j1 , i1 , j2 , i2 , ...),
da element mi` j` ∈ (0, 1) in mi`−1 j` ∈ (0, 1). Ker je množica indeksov končna, se bo torej
eden od indeksov (v vrstici ali v stolpcu) ponovil.
zgoraj opisano lastnost. Definirajmo matriko B ∈ Mn (R) tako, da je bi` j` = 1, bi` j`+1 = −1
in bij = 0 sicer. Za tako definirano matriko B velja, da je Be = 0 in eT B = 0.
2.3 Stohastične matrike 36
V primeru, da α ∈ R, potem je
(M ± αB)e = e in eT (M ± αB) = eT .
1 1
M = (M − αB) + (M + αB).
2 2
M = α1 P1 + · · · + αn Pn .
||α1 P1 + · · · + αn Pn || ≤ 1
||M ||
oziroma je ||M || ≤ 1. Še več, če je M e = e, potem iz tega sledi, da je ||M || ≥ ||e|| = 1. Od
tod pa sledi, da je ||M || = 1.
Definicija 2.17 Naj bosta a = (a1 , a2 , ..., an ) in b = (b1 , b2 , ..., bn ) vektorja z realnimi ko-
ordinatami. Potem je a ≺ b, če je sk (a) ≤ sk (b) za vsak 1 ≤ k ≤ n in sn (a) = sn (b).
2.3 Stohastične matrike 37
Potem od tod, če si izberemo t zunaj intervala, ki vsebuje točke xj in yj , sledi sn (x) = sn (y).
V primeru, da si za t izberemo eno izmed koordinat vektorja x, torej t = xk in uporabimo
zvezo sn (x) = sn (y), dobimo
n
X k
X n
X
|xj − xk | = (xk − yj ) + (yj − xk ) + 2(sk (y) − sk (x))
j=1 j=1 j=k+1
n
X
≤ |yj − xk | + 2(sk (y) − sk (x)).
j=1
zapišemo kot
n
X n
X k
X
|xj − xk | = (xj − xk ) + (xk − xj ).
j=1 j=k+1 j=1
n
X n
X k
X X
|xj − xk | ≥ (yj − xk ) + (xk − yj ) = |yj − xk |,
j=1 j=k+1 j=1 j6=k
kar pomeni, da je
n
X n
X
|xj − xk | − |yj − xk | ≥ 0
j=1 j=1
Prav tako velja Ae = e, saj je matrika A stohastična. Če to neenakost uporabimo na izrazu
x − te, dobimo
||Ax − te||1 ≤ ||x − te||1 .
Izrek 2.20 Naj bosta x, y ∈ Rn . Potem je x ≺ y natanko tedaj, ko obstaja takšna bistoha-
stična matrika A, da je y = Ax.
V dokazu tega izreka pa si bomo pomagali z naslednjo trditvijo. Njen dokaz najdemo v
knjigi [9](str. 53).
Trditev 2.21 Naj bosta a in λ takšni zaporedji n realnih števil za kateri velja a λ. Potem
obstaja realna simetrična matrika velikosti n × n z diagonalo a in spektrom λ.
Dokaz. (izreka 2.20) Zaradi izreka 2.19 je dovolj dokazati le naslednjo implikacijo. Če
je x ≺ y, potem obstaja takšna bistohastična matrika A, da velja y = Ax.
Uporabimo trditev 2.21 , ki pravi, da obstaja realna simetrična matrika H, katere diagonala
je y in spekter x. Ker je matrika H simetrična, jo lahko diagonaliziramo z ortogonalno
matriko: to pomeni, da obstaja takšna ortogonalna matrika U , da je
H = U T DU,
Potem od tod sledi, da je y = Ax. Elementi matrike A pa so oblike aij = |uij |2 . Ker je
matrika U ortogonalna, torej je U T U = I, je A bistohastična matrika.
2.3 Stohastične matrike 40
P
Če Kn vzamemo kot del afinega podprostora, podanega z enakostjo i xi = 1, potem je Kn
konveksna množica z neprazno notranjostjo. Njeno notranjost sestavljajo točke, ki ustrezajo
pogoju x > 0. Označimo z ∂Kn rob množice Kn . Če x ∈ Kn , potem definirajmo
O(x) = {i; xi = 0}
in
o(x) = |O(x)|
tako, da množica ∂Kn vsebuje natanko tiste točke, ki ustrezajo pogoju o(x) ≥ 1.
Za vsak par (i, j) ∈ O(M x) × O(x)c velja mij = 0, kjer I c označuje komplement množice I
v {1, ..., n}.
o(M x) ≤ o(x).
Še več, če je o(M x) = o(x), potem je mij = 0 za vsak (i, j) ∈ O(M x)c × O(x).
Posledica 2.23 Naj bosta I in J podmnožici množice {1, ..., n} in naj matrika M ∈ ∆n
zadošča pogoju mij = 0 za vsak (i, j) ∈ I × J c . Potem je |J| ≥ |I|. V primeru, da je
|I| = |J|, pa je mij prav tako enak 0 za vsak (i, j) ∈ I c × J.
2.3 Stohastične matrike 41
Označimo z S∆n (S kot strogo) množico bistohastičnih matrik M , za katero velja nasle-
dnja implikacija. Če je |I| = |J| in mij = 0 za vsak (i, j) ∈ I × J c , potem je I = ∅ ali
I = {1, ..., n}. Takšne so tudi matrike za katere za vsak x ∈ ∂Kn velja o(M x) < o(x). Ta
množica ne vsebuje permutacijskih matrik P , saj te zadoščajo pogoju o(P x) = o(x) za vsak
x ∈ Kn .
(i ∈ I` , j ∈ Jm , ` 6= m) =⇒ mij = 0.
Iz posledice 2.23 sledi, da je |I` | = |J` | za vsak `. Če po potrebi ne upoštevamo praznih
delov, lahko vedno predpostavimo, da nobena od množic I` in J` ni prazna. Po razcepu
matrike M dobimo bločno strukturo, kjer vsako vrstico bloka sestavlja en neničelni blok,
enako pa velja tudi za stolpce bloka. Bloki indeksov I` × J` so same stohastične matrike.
Matrika iz množice S∆n dopušča le trivialni razcep r = 1, I1 = J1 = {1, ..., n}.
Pri tem ∗ označujejo ustrezna števila. Primer matrike s takšnim razcepom je matrika
0 0.4 0.6
.
1 0 0
0 0.6 0.4
2.3 Stohastične matrike 42
Ta matrika je vsebovana v ∆n saj je dvojno stohastična. Prav tako je |I1 | = |J1 | in |I2 | =
|J2 |. Matriki " #
0.4 0.6
I1 × J1 = in I2 × J2 = [1]
0.6 0.4
pa sta stohastični matriki.
kjer je
00 0 00 0
I`m = I` ∩ Im in J`m = J` ∩ Jm .
00 in j ∈ J 00 za (`, m) 6= (p, q), potem je m = 0. Zaradi posledice 2.23, ki jo upora-
Če i ∈ I`m pq ij
00 | = |J 00 |. Če ne upoštevamo
bimo na matriki M in njeni tansponiranki, dobimo, da je |I`m `m
praznih delov, potem dobimo razcep matrike M , ki je boljši kot prva dva razcepa v smislu
vrstnega reda elementov: vsak I` (ali I`0 ) je unija nekaterih delov oblike Ip00 .
Ker je množica razcepov matrike M končna, zgornja opažanja dokazujejo, da obstaja naj-
bolši razcep. Imenujemo ga kanonični razcep matrike M . Ta je edini razcep, katerega
bloki indeksov I` × J` sami spadajo v razred S∆n .
in
0 0
I1 = {1, 3, 4, 6, 7, 9}, I2 = {2, 5, 8},
0 0
J1 = {2, 3, 5, 6, 8, 9}, J2 = {1, 4, 7}.
00 0
I11 = I1 ∩ I1 = {1, 3, 7, 9},
00 0
I12 = I1 ∩ I2 = {2, 8},
00 0
I21 = I2 ∩ I1 = {4, 6},
00 0
I22 = I2 ∩ I2 = {5}
in
00 0
J11 = J1 ∩ J1 = {5, 6, 8, 9},
00 0
J12 = J1 ∩ J2 = {4, 7},
00 0
J21 = J2 ∩ J1 = {2, 3},
00 0
J22 = J2 ∩ J2 = {1}.
00 00
Za vsak i ∈ I`m in j ∈ Jpq , kjer je (`, m) 6= (p, q), je mij = 0. Torej dobimo ničelne ravno
tiste elemente, ki so ničelni tudi pri začetnih dveh razcepih, le da se pri novem razcepu ti
ničelni elementi ne ponavljajo in zato je ta razcep boljši.
00 00 00 00 00 00 00 00
Opazimo lahko, da je |I11 | = |J11 |, |I12 | = |J12 |, |I21 | = |J21 | in |I22 | = |J22 |.
00
Vsako množico I` oziroma Jm lahko zapišemo kot unijo nekaterih delov oblike Ip oziroma
00 00 00 00 00 00 00 00 00
Jq . Torej je I1 = I11 ∪ I12 , I2 = I21 ∪ I22 , J1 = J11 ∪ J12 in J2 = J21 ∪ J22 .
" #
M M
Bloki matrik I1 × J1 = in I2 × J2 = [M ] pa predstavljajo bistohastične matrike.
M M
Poglavje 3
M -matrike
V tem poglavju bomo predstavili M -matrike. Čeprav te matrike niso nenegativne matrike,
so tesno povezane z njimi. Od vseh možnih definicij M -matrik se bomo osredotočili na tisto,
ki jih povezuje z nenegativnimi matrikami.
Dokazali bomo da imajo vse lastne vrednosti M -matrike nenegativen realni del in posledično
je tudi vsaka realna lastna vrednost M -matrike nenegativna. Nato si bomo na konkretnem
primeru pogledali glavne podmatrike M -matrike, za katere se izkaže, da so prav tako M -
matrike. Pri dokazu tega izreka bomo uporabili trditev o glavnih podmatrikah nenegativnih
matrik. Trditev pravi, da največja lastna vrednost glavne podmatrike nenegativne matrike
ne more biti večja od največje lastne vrednosti te matrike. S pomočjo izreka o glavnih
podmatrikah M -matrik bomo dokazali, da so vsi glavni minorji M -matrike nenegativni.
44
45
A = cIn − B,
kjer je c ≥ r.
Pravzaprav M -matrike spadajo med Z-matrike. Matrika A je Z-matrika, če so vsi njeni
elementi, ki ne ležijo na diagonali, negativni ali pa so enaki nič. M -matrike se razlikujejo
od Z-matrik po tem, da imajo na glavni diagonali nenegativne elemente, medtem ko so
elementi na diagonali Z-matrik poljubnega predznaka.
Trditev 3.2 Matrika A ∈ Zn je M-matrika natanko tedaj, ko imajo vse lastne vrednosti
matrike A nenegativni realni del.
amm = max(aii )
i
46
in definirajmo matriko
B = amm In − A.
Element amm je največji diagonalni element matrike A. Če identični matriki pomnoženi s
številom amm prištejemo nasprotno matriko matrike A, so vsi členi nove matrike večji ali
enaki nič in zato je matrika B nenegativna. Naj bo r največja lastna vrednost matrike B.
Torej je A = amm In − B, amm − r pa je realna lastna vrednost matrike A. Po predpostavki
sledi, da je amm − r nenegativna vrednost, torej je amm ≥ r. Od tod pa po definiciji sledi,
da je
A = amm In − B
M -matrika.
Dokažimo izrek še v drugo smer. Sedaj naj bo A = cIn − B poljubna M -matrika in naj
bo r največja lastna vrednost matrike B ter c ≥ r. Naj bo λt lastna vrednost matrike A.
Predpostavimo, da je realni del lastne vrednosti λt , Re(λt ), negativen. Potem je
Dokazali smo, da imajo vse lastne vrednosti M -matrike nenegativen realni del. Glede na
to trditev lahko sklepamo, da je vsaka realna lastna vrednost M -matrike tudi nenegativna,
saj je njen imaginarni del enak nič.
Izrek 3.4 Matrika A ∈ Zn je M-matrika natanko tedaj, ko je vsaka realna lastna vrednost
matrike A nenegativna.
Dokaz. Dokaz izreka od leve proti desni sledi neposredno iz prejšnjega izreka, zato bomo
izrek dokazali le v nasprotno smer. Predpostavimo, da so vse realne lastne vrednosti matrike
47
B = amm In − A,
kjer je
amm = max(aii ).
i
Tako definirana matrika B je nenegativna. Naj bo r njena največja lastna vrednost. Ker je
amm − r realna lastna vrednost matrike A = amm In − B, potem je po predpostavki amm − r
nenegativna oziroma amm ≥ r. Od tod pa po definiciji sledi, da je A M -matrika.
Naslednja opredelitev M -matrik vsebuje pojem glavne podmatrike. Naj bo A matrika reda
n × n. Podmatriko matrike A dobimo tako, da iz matrike A izberemo samo določene vr-
stice in stolpce. Glavna podmatrika matrike A pa je vsaka m × m matrika, ki jo dobimo
tako, da matriki A izbrišemo n − m vrstic in n − m istoležnih stolpcev. Poglejmo si glavne
podmatrike M -matrike v naslednjem primeru:
Prvo podmatriko smo dobili tako, da smo prečrtali prvo vrstico in prvi stolpec matrike A.
Pri drugi podmatriki smo prečrtali drugo vrstico in drugi stolpec ter pri tretji podmatriki
tretjo vrstico in tretji stolpec. Če v matriki izbrišemo drugo ter tretjo vrstico in stolpec
dobimo četrto podmatriko. Peto in šesto podmatriko pa dobimo tako, da izbrišemo prvo
ter tretjo vrstico in stolpec oziroma prvo ter drugo vrstico in stolpec.
Trditev 3.5 Največja lastna vrednost glavne podmatrike nenegativne matrike A ne more
biti večja od največje lastne vrednosti matrike A.
Dokaz. Naj bo B glavna podmatrika matrike A. Potem lahko matriko A zapišemo kot
" #
B C
A= .
D E
Matrika B 0 naj bo istega reda kot matrika A, kjer so podmatrike C, D in E ničelne. Torej
je |B 0 | ≤ A. Naj bo ρ(B 0 ) največja lastna vrednost matrike B 0 in x normiran lastni vektor.
Potem je
ρ(B 0 )|x| ≤ |B 0 | · |x| ≤ A|x| = ρ(A)|x|.
Največja lastna vrednost matrike B 0 pa je enaka največji lastni vrednosti njene podmatrike
B. Torej sledi
ρ(B) ≤ ρ(A).
A = cIn − B,
M -matrika.
Na podlagi zadnjega izreka lahko izpeljemo še eno lastnost, ki velja za M -matrike in se
navezuje na determinante glavnih podmatrik, ki jih imenujemo glavni minorji matrike.
49
Izrek 3.7 Matrika A ∈ Zn je M-matrika natanko tedaj, ko so vsi njeni glavni minorji
nenegativni.
Dokažimo izrek še v drugo smer. Sedaj predpostavimo, da A ∈ Zn in so vsi njeni glavni
minorji nenegativni ter dokazujemo, da je A M -matrika. Naj bo
Potem je
A = amm In − B,
Najprej naj bodo vsi glavni minorji matrike A enaki 0. Potem so vse lastne vrednosti
matrike A tudi 0 in je A = −B, saj je amm = 0. V tem primeru je torej r = 0 in zato
amm ≥ r = 0. Od tod pa sledi, da je A M -matrika.
Sedaj pa si poglejmo še primer, ko so vsi glavni minorji matrike A nenegativni in niso vsi
enaki 0. Označimo z Ei (A) i-to elementarno simetrično funkcijo lastnih vrednosti matrike
A, ki je vsota vseh glavnih minorjev matrike A reda i. Ker so vsi glavni minorji matrike A
nenegativni in niso vsi enaki 0, je Ei (A) ≥ 0 za vsak i ter je neenakost stroga za vsaj en i.
Če je p pozitivno število, potem je
n
X
det((p + amm )In − B) = det(pIn + (amm In − B)) = det(pIn + A) = pn−k En−k (A)
k=0
in je pozitivna. Zato p+amm ne more biti lastna vrednost matrike B za katerokoli pozitivno
število p. Torej je amm ≥ r in zato je
A = amm In − B
M -matrika.
50
lim (B/c)t = 0.
t→∞
Torej je
(In − B/c)(In + B/c + (B/c)2 + · · · + (B/c)p ) = In − (B/c)p+1 .
Tako je
∞
X
(In − B/c) (B/c)t = In
t=0
in zato je
∞
X
(In − B/c)−1 = (B/c)t ,
t=0
51
ki pa je nenegativna, saj je
p
X
(B/c)t
t=0
Potem je B nenegativna matrika. Naj bo r njen največji koren in naj bo x takšen nenega-
tiven lastni vektor, da je Bx = rx. Potem velja, da je
in zato je
x = (amm − r)A−1 x.
M -matrika.
(i) A je M-matrika,
A = cIn − B,
52
kjer je c ≥ r. Torej je
B = cIn − A
Ax > 0.
V tem poglavju bomo definirali posplošene permutacijske matrike in pojasnili njihovo pove-
zavo z nenegativnimi matrikami. Posplošene permutacijske matrike so kvadratne matrike,
ki imajo natanko en neničelni element v vsaki vrstici in v vsakem stolpcu. Dokazali bomo,
da je inverzna matrika nenegativne matrike nenegativna natanko tedaj, ko je ta matrika
posplošena permutacijska matrika.
Nato bomo ponovili pojem grupe, ki ga bomo potrebovali pri definicji semidirektnega pro-
dukta, saj bomo predstavili posplošene permutacijske matrike kot semidirektni produkt
diagonalnih matrik s simetrično grupo.
53
4.1 Definicija posplošene permutacijske matrike 54
Definicija 4.1 Kvadratno matriko, ki ima natanko en neničelni element v vsaki vrstici in
v vsakem stolpcu, vse ostale elemente pa ima enake nič, imenujemo posplošena permu-
tacijska matrika.
Posplošena permutacijska matrika ima torej podobno obliko kot permutacijska matrika, le
da ima za razliko od nje lahko elemente, ki niso enaki 1.
Lema 4.2 Naj bo A nenegativna matrika. Potem je njena inverzna matrika nenegativna
natanko tedaj, ko je A posplošena permutacijska matrika.
n
(
X 1; i = j
ait btj = δij =
t=1 0; i 6= j,
Pri semidirektnemu produktu iz dveh grup tvorimo novo grupo, zato je smiselno ponoviti
pojem grupe. Neprazno množico G z binarno operacijo ∗ : G × G → G, ki vsakemu
urejenemu paru (A, B) ∈ G priredi natanko en element A ∗ B ∈ G, imenujemo grupa G, če
operacija ∗ zadošča naslednji pogojem:
Podmnožico H grupe G, ki je za operacijo ∗ tudi sama grupa (veljajo vse zgoraj naštete
lastnosti) in velja A ∗ B −1 ∈ H za vse A, B ∈ H, imenujemo podgrupa grupe G. Podgrupo
K grupe G imenujemo podgrupa edinka, če velja g −1 Kg = K za vsak element g ∈ G.
(i) vsak element iz G lahko na enoličen način zapišemo kot produkt elementa iz A in
elementa iz B.
Z GLn (F) označimo splošno grupo reda n nad poljem F, ki je grupa obrnljivih matrik reda
n × n z operacijo množenja matrik. Torej je GLn (F) = {A ∈ Mn (F); det A 6= 0}. Simetrična
grupa Sn je grupa vseh permutacij dolžine n. Diagonalne matrike v množici posplošenih
permutacijskih matrik reda n × n nad poljem F tvorijo grupo diagonalnih matrik D(n, F). S
P (n, F) pa označimo grupo vseh n × n posplošenih permutacijskih matrik. Velja naslednja
trditev:
4.2 Semidirektni produkt 56
Dokaz. Najprej dokažimo, da lahko vsako posplošeno permutacijsko matriko zapišemo kot
produkt diagonalne matrike s simetrično grupo. Naj D ∈ D(n, F) in naj bo P permutacijska
matrika pripadajoča ustrezni permutaciji σ ∈ Sn . Potem je
n
X n
X
D · P = (DP )ij = dik pkj = dkj = (A)ij ,
k=1 k=1
Prav tako lahko vsako matriko A ∈ P (n, F) zapišemo kot produkt diagonalne in permutacij-
ske matrike. Torej A = DP , pri tem neničelni elementi matrike P ležijo na istih mestih kot
elementi matrike A, diagonalna matrika pa ima na diagonali ustrezno razvrščene neničelne
elemente matrike A.
Zapis vsake matrike iz P (n, F) kot produkt diagonalne matrike s simetrično grupo je enolično
določen. Naj bo A ∈ P (n, F). Potem lahko matriko A zapišemo kot
A = D1 P1 .
Recimo, da lahko matriko A zapišemo tudi kot produkt drugih dveh matrik, torej
A = D2 P2 ,
AP1−1 = D1 in AP2−1 = D2 .
V prvem delu dokaza smo ugotovili, da je matrika A enaka produktu diagonalne in per-
mutacijske matrike, pri tem pa ima permutacijska matrika svoje elemente ravno na istih
mestih kot matrika A in ker je P1 = P1−1 ter P2 = P2−1 sledi, da je P1 = P2 . Posledično je
tudi D1 = D2 , to pa je v nasprotju s predpostavko. Torej lahko vsako posplošeno permuta-
cijsko matriko na enoličen način zapišemo kot produkt diagonalne in permutacijske matrike.
4.2 Semidirektni produkt 57
Dokazati moramo še, da je D(n, F) podgrupa edinka grupe P (n, F). Grupa D(n, F) je
podgrupa edinka grupe P (n, F), če velja
za vsako matriko A ∈ P (n, F). Če enačbo iz leve strani pomnožimo z matriko A dobimo,
da je
D(n, F)A = AD(n, F).
0 0 0 1
4.3 Linearne transformacije na nenegativnih matrikah 58
V tem razdelku bomo predstavili linearne transformacije na množici matrik Mn (C), ki ohra-
njajo determinanto in sled matrike. Zanimalo pa nas bo tudi, kakšna linearna transformacija
preslika nenegativne matrike v nenegativne matrike in ohranja njihov spekter.
Najprej bomo povedali kaj sploh je linearna transformacija. Naj bosta V in V 0 vektorska
prostora nad poljem F. Potem preslikavo T : V → V 0 imenujemo linearna transformacija,
če ohranja aditivnost in množenje s skalarjem.
Izrek 4.5 Naj bo T takšna linearna transformacija na množici Mn (C), ki ohranja deter-
minanto matrike. Potem obstajata takšni matriki U in V , da je det(U V ) = 1 in je
T (A) = U AV
T (A) = U AT V
Preden formuliramo naslednji izrek, predstavimo še pojem sledi matrike. Sled kvadratne
matrike reda n × n je vsota vseh elementov na diagonali matrike in jo označimo s sled(A).
Torej je
n
X
sled(A) = aii .
i=1
• sled(AB) = sled(BA).
4.3 Linearne transformacije na nenegativnih matrikah 59
V naslednjem izreku linearna transformacija poleg determinante ohranja tudi sled matrike,
torej velja sled(T (A)) = sled(A).
Izrek 4.6 Naj bo T takšna linearna transformacija na množici Mn (C), ki ohranja deter-
minanto in sled vsake matrike A ∈ Mn (C). Potem obstaja takšna matrika V ∈ Mn (C), da
je
T (A) = V −1 AV
T (A) = V −1 AT V
Dokažimo izrek najprej za primer, ko velja T (A) = U AV za vsak A ∈ Mn (C). Naj bo Eij
matrika, pri kateri je (i, j)-ti element enak 1, vsi ostali elementi pa so enaki 0. Potem je
To pomeni, da je za tako definirano matriko Eij produkt U Eij V enak kar produktu i-tega
stolpca matrike U ter j-te vrstice matrike V . V primeru, da ima matrika Eij element, ki
je enak ena na diagonali, je sled matrike Eij enaka ena, sicer pa je enaka nič. Torej je sled
matrike Eij enaka sled(Eij ) = δij . Od tod sledi, da je
n
X
sled(T (Eij )) = sled(U Eij V ) = usi vjs = (V U )ji .
s=1
Torej je sled matrike U Eij V enaka kar (j, i)-temu elementu matrike V U . Po predpostavki
linearna transformacija ohranja sled matrike. To pomeni, da je sled(T (Eij )) = sled(Eij ) =
δij in zato je tudi (V U )ji = δij za vsak i in j. Od tod pa sledi, da je U V = In in U = V −1 .
Torej je
T (A) = V −1 AV.
4.3 Linearne transformacije na nenegativnih matrikah 60
T (A) = V −1 AT V.
V −1 AV (V −1 x) = V −1 λx = λ(V −1 x).
To pomeni, da je
V −1 AV y = λy,
T (A) = P −1 AP
T (A) = P −1 AT P
Dokaz. Ker T ohranja spekter nenegativnih matrik, po posledici 4.7 ohranja tudi njihovo
sled in determinanto. V splošnem linearna transformacija, ki ohranja sled nenegativne ma-
trike reda n × n in zlasti matrik oblike Eij , ohranja sled vseh matrik iz Mn (C). Dokazati
moramo še, da T ohranja tudi determinanto vsake kompleksne matrike.
Kar pomeni, da je
det(T (A)) = det(A)
Linearna transformacija torej ohranja sled in determinanto vsake kompleksne matrike reda
n × n. Po izreku 4.5 zato obstaja takšna matrika S, da za vsako matriko A ∈ Mn (C) velja
ena izmed enačb
T (A) = S −1 AS ali T (A) = S −1 AT S.
4.3 Linearne transformacije na nenegativnih matrikah 62
(S −1 )(i) S(j) ≥ 0
za vsak i-ti stolpec matrike S −1 in j-to vrstico matrike S. Vsi elementi matrike S −1 ne
morejo biti enaki nič. Torej obstaja takšno kompleksno število α in nenegativna matrika
P , da je
S = αP
oziroma matriko S lahko zapišemo kot produkt nenegativne matrike P s sklarjem α in zato
je
S −1 AS = P −1 AP
pri tem pa mora biti T (Eij ) nenegativna za vsak i in j. Sledi enako kot prej, da je
(P −1 )(i) P(j) ≥ 0,
za vsak i-ti stolpec matrike P −1 in j-to vrstico matrike P . Matrika P je nenegativna in ker
morajo biti nekateri njeni elementi pozitivni, morajo biti vsi elementi matrike P −1 nenega-
tivni oziroma P −1 mora biti nenegativna matrika. Po lemi 4.2 pa sledi, da je P posplošena
permutacijska matrika.
T (Eij ) = S −1 Eij
T
S = (S −1 )(j) S(i) .
(S −1 )(j) S(i) ≥ 0,
za vsak j-ti stolpec matrike S −1 in vsako i-to vrstico matrike S. Vsi elementi matrike S −1
ne morejo biti enaki nič. Torej obstaja takšno kompleksno število α in nenegativna matrika
4.3 Linearne transformacije na nenegativnih matrikah 63
P , da je
S = αP.
T (Eij ) = P −1 Eij
T
P = (P −1 )(j) P(i) .
(P −1 )(j) P(i) ≥ 0
za vsak j-ti stolpec matrike P −1 in i-to vrstico matrike P . Ker pa morajo biti nekateri
elementi matrike P pozitivni, morajo biti vsi elementi matrike P −1 nenegativni. To pomeni,
da mora biti matrika P −1 nenegativna in po lemi 3.4 sledi, da je matrika P posplošena
permutacijska matrika.
Zaključek
V prvem poglavju so predstavljeni osnovni pojmi in definicije, ki jih potrebujemo pri razu-
mevanju diplomskega dela. Kot vir so uporabljene knjige [5], [10] in [11].
Osnovni vir poglavja o nenegativnih matrikah je knjiga [9]. Definicija nenegativnih matrik
je povzeta po viru [1]. V podpoglavjih o Perron-Frobeniusovem izreku in o stohastičnih
matrikah pa je kot vir uporabljena tudi knjiga [6].
Tretje poglavje je povzeto po viru [7]. Pri dokazovanju lastnosti M-matrik pa je uporabljena
tudi knjiga [3].
Uvodno poglavje četrtega poglavja je povzeto po viru [12], medtem ko sem podpoglavje o
semidirektnemu produktu zapisala sama. Kot osnovni vir podpoglavja o linearnih transfor-
macijah na nenegativnih matrikah pa je uporabljena knjiga [7].
V knjigah [2] in [8] ter članku [4] pa najdemo dokaze izrekov, ki so brez dokazov nave-
deni v diplomskem delu.
64
Literatura
[2] M. Berger, B. Gostiaux, Differential geometry: manifold, curves and surfaces, volume
115 of Graduate test in Mathematics, Springer-Verlag, New York, 1988.
[4] G. Frobenius, Über die Darstellung der endlichen Gruppen durch lineare Substitutionen,
S.-B. K. Preuss. Akad. Wiss., Berlin, 1897, 994-1015.
[6] C. D. Meyer, Matrix Analysis and Applied Linear Algebra, University City Science
center, Philadelphia, 2000.
[8] W. Rudin, Functional analysis, McGraw-Hill Book Co. NY, second edition, 1991.
[9] D. Serre, Matrices: Theory and Applications, Springer-Verlag, New York, 2002.
[11] I. Vidav, Višja matematika I, Društvo matematikov, fizikov in astronomov SRS, Lju-
bljana, 1987.
65