You are on page 1of 24

Náhodné vektory

Přednášející:
doc. Ing. Pavel Hrabák, Ph.D.

Katedra aplikované matematiky


Fakulta informačních technologií
České vysoké učení technické v Praze
© 2011–2024 Rudolf B. Blažek, Jitka Hrabáková, Pavel Hrabák, Roman Kotecký, Petr Novák, Daniel Vašata

Vybrané statistické metody


NI-VSM, LS 2023/24, Přednáška 4

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 1 / 24
Obsah přednášek

• Opakování základních pojmů pravděpodobnosti


• Náhodné vektory a jejich sdružené charakteristiky, vícerozměrné normální rozdělení
• Entropie, využití v teorii kódování
• Opakování základních pojmů statistiky, testování hypotéz, p-hodnota, t-testy
• Testy dobré shody, testy nezávislosti, kontingenční tabulky
• Odhady rozdělení, jádrové odhady, Gaussovské směsi
• Základní pojmy teorie náhodných procesů
• Markovské řetězce s diskrétním časem, klasifikace stavů, stacionarita
• Poissonův process
• Markovské řetězce se spojitým časem, skokové intenzity, stacionarita
• Systémy hromadné obsluhy, Littleho věta, M/M/1, M/M/n, M/G/∞

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 2 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Střední hodnota náhodného vektoru


Prozatím jsme definovali střední hodnotu jedné náhodné veličiny. Pro náhodné vektory
(náhodné matice) je výhodné definovat střední hodnotu celého vektoru (matice) jejímž
výsledkem je vektor (matice).

Definice
Existují-li střední hodnoty náhodných veličin X1 , . . . , Xn , pak vektor

E X = (E X1 , . . . , E Xn )T ∈ Rn

nazýváme střední hodnotou náhodného vektoru X .

Existují-li střední hodnoty veličin Zi,j pro všechny i = 1, . . . , m a j = 1, . . . , n, pak matici

E Z = (E Zi,j ) ∈ Rm,n

nazýváme střední hodnotou náhodné matice Z.

Střední hodnotu náhodného vektoru i náhodné matice tedy definujeme po složkách.


Linearita střední hodnoty tak implikuje E(X + Y ) = E X + E Y pro náhodné vektory
(matice) X, Y na stejném pravděpodobnostním prostoru.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 3 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Linearita střední hodnoty


Věta
Necht’ Z je náhodná matice rozměru m × n a A ∈ Rp,q , B ∈ Rp,m , C ∈ Rn,q jsou
matice. Potom
E(A + BZC) = A + B(E Z)C.
Důkaz
m X
X n
Při označení W = A + BZC platí Wi,j = Ai,j + Bi,k Zk,ℓ Cℓ,j pro každé i = 1, . . . , p a
k=1 ℓ=1
j = 1, . . . , q . Z linearity střední hodnoty plyne
Xm X n m X
X n
E Wi,j = E Ai,j + E Bi,k Zk,ℓ Cℓ,j = Ai,j + Bi,k (E Zk,ℓ )Cℓ,j .
k=1 ℓ=1 k=1 ℓ=1
m X
n
!
X
Celkem tedy E W = (E Wi,j ) = (Ai,j ) + Bi,k (E Zk,ℓ )Cℓ,j = A + B(E Z)C.
k=1 ℓ=1

Důsledek
Necht’ X je náhodný vektor, a ∈ Rp je vektor a B ∈ Rp,n je matice. Potom
E(a + BX) = a + B E X.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 4 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Varianční matice náhodného vektoru


Nyní se zabývejme charakteristikami druhého řádu.

Definice
Je-li E Xi2 < ∞ pro každé i = 1, . . . , n, říkáme, že X má konečné druhé momenty a
definujeme varianční matici vektoru X jako

var X = cov(Xi , Xj ) .

Poznámky:
• Složky varianční matice jsou tedy kovariance jednotlivých složek X .
• Pro i = j dostáváme cov(Xi , Xi ) = var Xi a tudíž se na diagonále varianční
matice var X nacházejí rozptyly veličin Xi .
• Platí tedy
cov(X1 , X2 ) · · · cov(X1 , Xn )
 
var X1
 cov(X2 , X1 ) var X2 · · · cov(X2 , Xn )
var X =  .
 
.. .. .. ..
 . . . . 
cov(Xn , X1 ) cov(Xn , X2 ) · · · var Xn

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 5 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Vektorové vyjádření varianční matice


Protože
cov(Xi , Xj ) = E(Xi − E Xi )(Xj − E Xj ),
je zřejmé, že varianční matici můžeme vektorově zapsat jako

var X = E(X − E X)(X − E X)T .

Použijeme-li nyní vlastnosti střední hodnoty, dostaneme

E(X − E X)(X − E X)T = E XX T − (E X)X T − X E X T + E X E X T




= E XX T − E X E X T − E X E X T + E X E X T
= E XX T − E X E X T .

Celkově jsme tedy dokázali následující tvrzení.

Věta
Varianční matice náhodného vektoru X splňuje
var X = E(X − E X)(X − E X)T = E XX T − E X E X T .

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 6 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Vlastnosti varianční matice


Prozkoumejme vztah varianční matice k lineárním transformacím. Výsledek je obdobný
vztahu pro rozptyl lineární kombinace jednorozměrné náhodné veličiny X , kde platí
var(a + bX) = b2 var X .
Věta
Bud’ X náhodný vektor, a ∈ Rp vektor a B ∈ Rp,n matice. Potom
var(a + BX) = B(var X)BT .

Důkaz
Postupným užitím předchozích vět dostaneme:
 T
var(a + BX) = E a + BX − E(a + BX) a + BX − E(a + BX)
 T
= E a + BX − a − E BX a + BX − a − E BX
= E(BX − E BX)(BX − E BX)T = var(BX)
= E BX(BX)T − E(BX) E(BX)T
= E BXX T BT − B E X E X T BT = B(E XX T )BT − B E X E X T BT
=B(E XX T − E X E X T )BT = B(var X)BT .

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 7 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Pozitivní semidefinitnost varianční matice


Velmi důležitou vlastností varianční matice je její pozitivní semidefinitnost.

Věta
Varianční matice var X náhodného vektoru X je symetrická a pozitivně semidefinitní.
Pokud navíc žádná složka X není lineární kombinací ostatních složek a konstanty, je
var X pozitivně definitní.

• Varianční matice je symetrická, právě když var X = (var X)T .


• Pozitivní semidefinitnost znamená (∀c ∈ Rn )(cT (var X)c ≥ 0).
• Pozitivní definitnost znamená (∀c ∈ Rn , c ̸= 0)(cT (var X)c > 0).
• Náhodná veličina Y je lineární kombinací náhodných veličin Y1 , . . . , Yk a
konstanty, právě když existují čísla c, c1 , . . . , ck ∈ R tak, že

P(Y = c1 Y1 +· · · + ck Yk + c) = 1.

• Některá ze složek náhodného vektoru X je lineární kombinací ostatních a konstanty,


právě když existuje a ∈ Rn , a ̸= 0 tak, že aT X = c pro nějaké c ∈ R s
pravděpodobností 1.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 8 / 24
Náhodné vektory Charakteristiky náhodných vektorů

Pozitivní semidefinitnost varianční matice


Věta
Varianční matice var X náhodného vektoru X je symetrická a pozitivně semidefinitní.
Pokud navíc žádná složka X není lineární kombinací ostatních složek a konstanty, je
var X pozitivně definitní.
Důkaz
Symetrie je zjevná z definice. Pro všechna i, j ∈ 1, . . . , n totiž platí

(var X)i,j = cov(Xi , Xj ) = cov(Xj , Xi ) = (var X)j,i .


n
Bud’ a ∈ R . Potom

aT (var X)a = aT E(X − E X)(X − E X)T a = E aT (X − E X)(X − E X)T a .




Označíme-li Y = aT (X − E X) jakožto novou náhodnou veličinu vzniklou lineární kombinací složek X a


E X , dostaneme T T 2
a (var X)a = E Y Y = EY ≥ 0.
Navíc je zřejmé, že nulovost tohoto výrazu je ekvivalentní nulovosti veličiny Y s pravděpodobností 1, protože
E Y 2 = 0 je ekvivalentní P(Y = 0) = 1.
To je ale možné pouze tehdy, pokud P aT (X − E X) = 0 = 1, což znamená aT X = aT E X = c


s pravděpodobností 1. Pokud var X není pozitivně definitní, existují a ̸= 0 a c ∈ R tak, že aT X = c.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 9 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vícerozměrné normální rozdělení


Jako velmi důležitý příklad sdruženého spojitého rozdělení uvedeme zobecnění normálního
rozdělení do více dimenzí.

K tomu si nejprve rozšiřme definici N(µ, σ 2 ) na případ σ = 0.

Definice
Bud’ µ ∈ R. Náhodná veličina X má (singulární) normální rozdělení s parametry µ a 0,
X ∼ N(µ, 0), jestliže P(X = µ) = 1.

• X ∼ N(µ, 0) tedy označuje diskrétní náhodnou veličinu X rovnou µ s


pravděpodobností 1.
• Připomeňme, že X ∼ N(µ, σ 2 ) pro σ > 0 označuje spojitou náhodnou veličinu s
hustotou
1 (x−µ)2
fX (x) = √ e− 2σ2 ,
σ 2π
pro všechna x ∈ R.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 10 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vícerozměrné normální rozdělení


Dále odvod’me vliv lineárních transformací na normální rozdělení.

Věta
Bud’ X ∈ N(µ, σ 2 ) pro µ ∈ R, σ ≥ 0 a a, b ∈ R. Pak a + bX ∼ N(a + bµ, b2 σ 2 ).

Důkaz
Pro σ = 0 nebo b = 0 je tvrzení triviální. V ostatních případech určíme distribuční funkci náhodné veličiny
Y = a + bX . Uvažujme b > 0.
 y − a y − a
FY (y) = P(Y ≤ y) = P(a + bX ≤ y) = P X ≤ = FX .
b b
Platí tedy
Z y−a 2
b 1 (x−µ)

FY (y) = √ e 2σ 2 dx.
−∞ σ 2π
Po substituci a + bx = u dostáváme
u−a −µ 2

Z y Z y (u−(a+bµ))2
1 − b 1 −
2(bσ)2
FY (y) = √ e 2σ 2 du = √ e du.
−∞ bσ 2π −∞ bσ 2π
Y je tedy spojitá náhodná veličina. Z jednoznačnosti hustoty pak plyne, že Y ∼ N(a + bµ, b2 σ 2 ).

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 11 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vícerozměrné normální rozdělení


Nyní si zaved’me rozšíření normálního rozdělení na náhodné vektory.

Definice
Bud’ µ ∈ Rn vektor a Σ ∈ Rn,n symetrická a pozitivně semidefinitní matice. Náhodný
vektor X = (X1 , . . . , Xn )T má n-rozměrné normální rozdělení s parametry µ a Σ,
píšeme X ∼ N(µ, Σ), jestliže pro každé c ∈ Rn platí cT X ∼ N(cT µ, cT Σc).

Věta
Bud’ µ ∈ Rn vektor a Σ ∈ Rn,n symetrická a pozitivně definitní matice. Potom
X ∼ N(µ, Σ) právě tehdy, když X má spojité sdružené rozdělení s hustotou
1 1 T
Σ−1 (x−µ)
fX (x) = 1/2
e− 2 (x−µ)
(2π)n/2 |Σ|

Důkaz viz. např. Věta 4.10 v J. Anděl: Základy matematické statistiky.


Komentář:
• Pozitivně definitní matice je regulární a její determinant je kladné číslo.
• 1-rozměrné normální rozdělení je normální rozdělení s µ = (µ) a Σ = (σ 2 ).
• Xi ∼ N(µi , Σi,i ) (plyne z důkazu následující věty).
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 12 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vizualizace vícerozměrného normální rozdělení


       
2 3 2 2 3 −1
µ= , Σ= µ= , Σ=
0 2 2 0 −1 2
   
−1 1 −1 −1 2/5 1/5
Σ = Σ =
−1 3/2 1/5 3/5
 
1
(x−2)2 −2(x−2)y+ 23 y 2 1 2 2 2 3 2
e− 2 e− 2 5 (x−2) + 5 (x−2)y+ 5 y
fX (x, y) = √ , fX (x, y) = √ ,
2π 2 2π 2

0.1 0.1

fX,Y fX,Y

0.05 0.05

0 0
4 4
2 2
0 6 0 6
y 4 y 4
−2 2 −2 2
0 x 0 x
−4−2 −4−2

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 13 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vizualizace vícerozměrného normální rozdělení

0.1 0.1

fX,Y fX,Y

0.05 0.05

0 0
4 4
2 2
0 6 0 6
y 4 y 4
−2 2 −2 2
0 x 0 x
−4−2 −4−2
0.1
2 2 0.06
0.08

y0 0.06 y0 0.04

0.04
−2 −2 0.02
0.02
−2 0 2 4 6 −2 0 2 4 6
x x

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 14 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Parametry vícerozměrného normálního rozdělení


Věta
Bud’ X ∼ N(µ, Σ). Potom E X = µ a var X = Σ.

Důkaz
Pro 1 ≤ i ≤ n uvažujme vektor ci takový, že jeho i-tá složka je 1 a ostatní 0. Zřejmě platí

cT T
i µ = µi a ci Σci = Σi,i .

Z definice n-rozměrného normálního rozdělení plyne, že cT T


i X ∼ N(µi , Σi,i ). Protože ci X = Xi ,
dostáváme E Xi = µi a var Xi = Σi,i . Jelikož bylo i libovolné, máme E X = µ.
Pro 1 ≤ i, j ≤ n, i ̸= j položme ci,j = ci + cj . Snadno ověříme, že

cT T
i,j µ = µi + µj a ci,j Σci,j = Σi,i + Σi,j + Σj,i + Σj,j .

Z definice n-rozměrného normálního rozdělení plyne, že cT


i,j X ∼ N(µi + µj , Σi,i + Σi,j + Σj,i + Σj,j ).
S využitím symetrie matice Σ, faktu, že cT
i,j X = Xi + Xj , a předchozího získáme

var(Xi + Xj ) = Σi,i + Σi,j + Σj,i + Σj,j = var Xi + 2Σi,j + var Xj .


Protože zároveň var(Xi + Xj ) = var Xi + 2 cov(Xi , Xj ) + var Xj , dostáváme Σi,j = cov(Xi , Xj ).
Spolu se vztahem pro Σi,i tak finálně platí var X = Σ.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 15 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Lineární transformace

Vícerozměrné normální rozdělení je invariantní vůči lineárním transformacím.

Věta
Bud’ X ∼ N(µ, Σ) a a ∈ Rm , B ∈ Rm,n . Potom
Y = a + BX ∼ N a + Bµ, BΣBT .


Důkaz

Bud’ c ∈ Rm vektor a prozkoumejme náhodnou veličinu cT Y = cT a + cT BX . Položíme-li


u = BT c ∈ Rn , platí z definice normálního rozdělení
cT BX = uT X ∼ N(uT µ, uT Σu) = N(cT Bµ, cT BΣBT c).
cT BX je tedy náhodná veličina s normálním rozdělením, která, když ji posuneme o konstantu cT a, bude mít
stále normální rozdělení:
 
cT Y = cT a + cT BX ∼ N(cT a + cT Bµ, cT BΣBT c) = N cT (a + Bµ), cT (BΣBT )c .

Protože c bylo libovolné, dostáváme tvrzení věty.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 16 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Marginální rozdělení
Z předchozích úvah víme, že každá složka náhodného vektoru s n-rozměrným normálním
rozdělením má také normální rozdělení. To platí pro obecné marginální rozdělení.

Věta
Bud’ X ∼ N(µ, Σ). Dále bud’ k < n přirozené a 1 ≤ i1 < . . . < ik ≤ n uspořádaná
k -tice přirozených čísel. Pro marginální rozdělení náhodného vektoru
X ′ = (Xi1 , . . . , Xik )T platí
X ′ ∼ N(µ′ , Σ′ ),
kde µ′ = (µi1 , . . . , µik )T a Σ′ = (Σ′j,ℓ ) ∈ Rk,k pro Σ′j,ℓ = Σij ,iℓ .

Důkaz

Použijeme předchozí větu pro a = 0 ∈ Rk a B = (Bj,ℓ ) ∈ Rk,n , j = 1, . . . , k , ℓ = 1, . . . , n, kde


(
1 když ℓ = ij ,
Bj,ℓ =
0 v ostatních případech.

V j -tém řádku má tedy matice B pouze jednu jedničku na pozici ij .


Z konstrukce a a B plyne
a + BX = X ′ , a + Bµ = µ′ , BΣBT = Σ′ .
Předchozí věta tak implikuje požadované tvrzení.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 17 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vztah nezávislosti a nekorelovanosti


Věta
Bud’ X = (X1 , . . . , Xn )T náhodný vektor. Potom jsou veličiny X1 , . . . , Xn nezávislé a
X1 ∼ N µ1 , σ12 , . . . , Xn ∼ N µn , σn2 právě tehdy, když X ∼ N(µ, Σ), kde
 

µ = (µ1 , . . . , µn )T a Σ je diagonální s Σi,i = σi2 .

Důkaz

Nejprve uvažujme situaci σi2 > 0 pro všechna i = 1, . . . , n. Matice Σ je pak regulární. Inverzní matice Σ−1 je
zřejmě také diagonální a platí (Σ−1 )i,i = 1/σi2 .
Jsou-li veličiny X1 , . . . , Xn nezávislé se spojitým rozdělením, mají sdružené spojité rozdělení se sdruženou
hustotou rovnou součinu hustot jednotlivých veličin.
Pro sdruženou hustotu tedy platí ekvivalence odpovídající tvrzení věty:
2
1 − 12 (x1 −µ1 ) 1 − 12 (xn −µn )2
fX (x) = q e 2σ1 ... p e 2σn
2πσn2
2πσ12
1 1 T −1
⇐⇒ fX (x) = e− 2 (x−µ) Σ (x−µ) .
(2π)n/2 |Σ|1/2
V případě, kdy má část veličin nulové rozptyly (jsou konstantní), se využije faktu, že konstantní veličina je vždy
nezávislá na ostatních. Předchozí postup se tak aplikuje pouze na marginální rozdělení nekonstantních složek X
a konstantní veličiny se na obě strany ekvivalence přidají zvlášt’.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 18 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vztah nezávislosti a nekorelovanosti

Důsledek
Bud’ X = (X1 , . . . , Xn )T ∼ N(µ, Σ). Pak pro i ̸= j platí, že Xi , Xj jsou nezávislé
právě tehdy, když jsou nekorelované.

• Nezávislost implikuje nekorelovanost vždy.

• Obrátit implikaci nám dovolí předpoklad, že náhodné veličiny jsou marginálami


vícerozměrného normálního rozdělení.

• Pouhá informace, že obě náhodné veličiny mají normální rozdělení nestačí, vizte
jednoduchý protipříklad na wikipedia.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 19 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Součty normálních rozdělení


V důsledku předchozí věty platí, že součet nezávislých normálních rozdělení má opět
normální rozdělení.

Důsledek
Bud’ X1 ∼ N µ1 , σ12 , . . . , Xn ∼ N µn , σn
2
 
nezávislé náhodné veličiny.
Potom X1 + . . . + Xn ∼ N µ1 + . . . + µn , σ12 + . . . + σn
2

.

Důkaz

Z předchozí věty máme, že X = (X1 , . . . , Xn )T ∼ N(µ, Σ), kde µ = (µ1 , . . . , µn )T a Σ je diagonální s


Σi,i = σi2 .
Uvažujme vektor c = (1, . . . , 1)T . Z definice n-rozměrného normálního rozdělení plyne

cT X = X1 + . . . + Xn ∼ N(cT µ, cT Σc).
Protože cT µ = µ1 + . . . + µn a díky diagonálnosti Σ dále cT Σc = σ12 + . . . + σn
2
, dostáváme tvrzení
věty.

Toto tvrzení je možné pomocí konvoluce dokázat také napřímo bez využití předchozí věty.

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 20 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Analýza hlavních komponent


Věta
Bud’ X ∼ N(µ, Σ) a {v 1 , . . . , v n } ortonormální báze tvořená vlastními vektory matice
Σ příslušejícími k vlastním číslům λ1 ≥ λ2 ≥ . . . , ≥ λn matice Σ.
Potom platí, že Yi = v T T
i X jsou nezávislé náhodné veličiny a Yi ∼ N(v i µ, λi ).

Důkaz
Sestrojme matici B tak, že má v řádcích napsané vektory v 1 , . . . , v n , resp. jejich transpozice. Protože
Σv i = λi v i , dostáváme ΣBT = BT Λ, kde Λ je diagonální matice s vlastními čísly na diagonále, tj.
Λi,i = λi pro každé i. Jelikož vektory v i tvoří ortonormální bázi, platí BBT = I. Tudíž
BΣBT = BBT Λ = Λ.
Protože Y = 0 + BX , platí Y ∼ N(Bµ, Λ). Nezávislost plyne z toho, že je Λ diagonální.

• Vektory v i ortonormální báze definují směry, které nazýváme hlavní směry.


• Průměty X do těchto směrů (tj. složky Y ) nazýváme hlavní komponenty.
• Jsou to nezávislé náhodné veličiny s rozptyly určenými vlastními čísly Σ
uspořádanými podle velikosti.
• Obdobné úvahy jsou základem analýzy hlavních komponent, která je velmi užitečná
v mnoha aplikacích.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 21 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vizualizace hlavních komponent –příklad


  
T 2 3 2
Uvažujme X = (X1 , X2 ) ∼ N(µ, Σ), kde µ = aΣ= .
0 2 2
Vlastní čísla a příslušné vlastní vektory jsou
. . . .
λ1 = 4.56, λ2 = 0.44, v 1 = (0.79, 0.62)T , v 2 = (−0.62, 0.79)T .

Položme
 T    
v1 . 0.79 0.62 . 0.79X1 + 0.62X2
B= T = a Y = BX = .
v2 −0.62 0.79 −0.62X1 + 0.79X2

Platí tedy Y ∼ N(µ′ , Λ), kde x2


2
   
. 1.58 λ1 0
µ′ = Bµ = ,Λ = . 1 ṽ 1
−1.24 0 λ2 ṽ 2

Navíc platí, že vektory −1 1 2 3 4 5


p p x1
−1
v˜1 = λ1 v 1 a v˜2 = λ2 v 2
mají velikosti rovné směrodatným odchylkám −2

hlavních komponent Yi .
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 22 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vizualizace hlavních komponent – příklad


3
x2 v1

v2
1

−1 1 2 3 4 5
x1

−1

−2

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 23 / 24
Náhodné vektory Vícerozměrné normální rozdělení

Vizualizace hlavních komponent – příklad


2 x2

v2

−2 −1 1 2 3 4 5 6
v1

−1

−2

x1

Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 24 / 24

You might also like