Professional Documents
Culture Documents
NI VSM Lec 04 Slides
NI VSM Lec 04 Slides
Přednášející:
doc. Ing. Pavel Hrabák, Ph.D.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 1 / 24
Obsah přednášek
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 2 / 24
Náhodné vektory Charakteristiky náhodných vektorů
Definice
Existují-li střední hodnoty náhodných veličin X1 , . . . , Xn , pak vektor
E X = (E X1 , . . . , E Xn )T ∈ Rn
E Z = (E Zi,j ) ∈ Rm,n
Důsledek
Necht’ X je náhodný vektor, a ∈ Rp je vektor a B ∈ Rp,n je matice. Potom
E(a + BX) = a + B E X.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 4 / 24
Náhodné vektory Charakteristiky náhodných vektorů
Definice
Je-li E Xi2 < ∞ pro každé i = 1, . . . , n, říkáme, že X má konečné druhé momenty a
definujeme varianční matici vektoru X jako
var X = cov(Xi , Xj ) .
Poznámky:
• Složky varianční matice jsou tedy kovariance jednotlivých složek X .
• Pro i = j dostáváme cov(Xi , Xi ) = var Xi a tudíž se na diagonále varianční
matice var X nacházejí rozptyly veličin Xi .
• Platí tedy
cov(X1 , X2 ) · · · cov(X1 , Xn )
var X1
cov(X2 , X1 ) var X2 · · · cov(X2 , Xn )
var X = .
.. .. .. ..
. . . .
cov(Xn , X1 ) cov(Xn , X2 ) · · · var Xn
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 5 / 24
Náhodné vektory Charakteristiky náhodných vektorů
= E XX T − E X E X T − E X E X T + E X E X T
= E XX T − E X E X T .
Věta
Varianční matice náhodného vektoru X splňuje
var X = E(X − E X)(X − E X)T = E XX T − E X E X T .
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 6 / 24
Náhodné vektory Charakteristiky náhodných vektorů
Důkaz
Postupným užitím předchozích vět dostaneme:
T
var(a + BX) = E a + BX − E(a + BX) a + BX − E(a + BX)
T
= E a + BX − a − E BX a + BX − a − E BX
= E(BX − E BX)(BX − E BX)T = var(BX)
= E BX(BX)T − E(BX) E(BX)T
= E BXX T BT − B E X E X T BT = B(E XX T )BT − B E X E X T BT
=B(E XX T − E X E X T )BT = B(var X)BT .
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 7 / 24
Náhodné vektory Charakteristiky náhodných vektorů
Věta
Varianční matice var X náhodného vektoru X je symetrická a pozitivně semidefinitní.
Pokud navíc žádná složka X není lineární kombinací ostatních složek a konstanty, je
var X pozitivně definitní.
P(Y = c1 Y1 +· · · + ck Yk + c) = 1.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 9 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Definice
Bud’ µ ∈ R. Náhodná veličina X má (singulární) normální rozdělení s parametry µ a 0,
X ∼ N(µ, 0), jestliže P(X = µ) = 1.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 10 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Věta
Bud’ X ∈ N(µ, σ 2 ) pro µ ∈ R, σ ≥ 0 a a, b ∈ R. Pak a + bX ∼ N(a + bµ, b2 σ 2 ).
Důkaz
Pro σ = 0 nebo b = 0 je tvrzení triviální. V ostatních případech určíme distribuční funkci náhodné veličiny
Y = a + bX . Uvažujme b > 0.
y − a y − a
FY (y) = P(Y ≤ y) = P(a + bX ≤ y) = P X ≤ = FX .
b b
Platí tedy
Z y−a 2
b 1 (x−µ)
−
FY (y) = √ e 2σ 2 dx.
−∞ σ 2π
Po substituci a + bx = u dostáváme
u−a −µ 2
Z y Z y (u−(a+bµ))2
1 − b 1 −
2(bσ)2
FY (y) = √ e 2σ 2 du = √ e du.
−∞ bσ 2π −∞ bσ 2π
Y je tedy spojitá náhodná veličina. Z jednoznačnosti hustoty pak plyne, že Y ∼ N(a + bµ, b2 σ 2 ).
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 11 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Definice
Bud’ µ ∈ Rn vektor a Σ ∈ Rn,n symetrická a pozitivně semidefinitní matice. Náhodný
vektor X = (X1 , . . . , Xn )T má n-rozměrné normální rozdělení s parametry µ a Σ,
píšeme X ∼ N(µ, Σ), jestliže pro každé c ∈ Rn platí cT X ∼ N(cT µ, cT Σc).
Věta
Bud’ µ ∈ Rn vektor a Σ ∈ Rn,n symetrická a pozitivně definitní matice. Potom
X ∼ N(µ, Σ) právě tehdy, když X má spojité sdružené rozdělení s hustotou
1 1 T
Σ−1 (x−µ)
fX (x) = 1/2
e− 2 (x−µ)
(2π)n/2 |Σ|
0.1 0.1
fX,Y fX,Y
0.05 0.05
0 0
4 4
2 2
0 6 0 6
y 4 y 4
−2 2 −2 2
0 x 0 x
−4−2 −4−2
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 13 / 24
Náhodné vektory Vícerozměrné normální rozdělení
0.1 0.1
fX,Y fX,Y
0.05 0.05
0 0
4 4
2 2
0 6 0 6
y 4 y 4
−2 2 −2 2
0 x 0 x
−4−2 −4−2
0.1
2 2 0.06
0.08
y0 0.06 y0 0.04
0.04
−2 −2 0.02
0.02
−2 0 2 4 6 −2 0 2 4 6
x x
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 14 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Důkaz
Pro 1 ≤ i ≤ n uvažujme vektor ci takový, že jeho i-tá složka je 1 a ostatní 0. Zřejmě platí
cT T
i µ = µi a ci Σci = Σi,i .
cT T
i,j µ = µi + µj a ci,j Σci,j = Σi,i + Σi,j + Σj,i + Σj,j .
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 15 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Lineární transformace
Věta
Bud’ X ∼ N(µ, Σ) a a ∈ Rm , B ∈ Rm,n . Potom
Y = a + BX ∼ N a + Bµ, BΣBT .
Důkaz
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 16 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Marginální rozdělení
Z předchozích úvah víme, že každá složka náhodného vektoru s n-rozměrným normálním
rozdělením má také normální rozdělení. To platí pro obecné marginální rozdělení.
Věta
Bud’ X ∼ N(µ, Σ). Dále bud’ k < n přirozené a 1 ≤ i1 < . . . < ik ≤ n uspořádaná
k -tice přirozených čísel. Pro marginální rozdělení náhodného vektoru
X ′ = (Xi1 , . . . , Xik )T platí
X ′ ∼ N(µ′ , Σ′ ),
kde µ′ = (µi1 , . . . , µik )T a Σ′ = (Σ′j,ℓ ) ∈ Rk,k pro Σ′j,ℓ = Σij ,iℓ .
Důkaz
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 17 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Důkaz
Nejprve uvažujme situaci σi2 > 0 pro všechna i = 1, . . . , n. Matice Σ je pak regulární. Inverzní matice Σ−1 je
zřejmě také diagonální a platí (Σ−1 )i,i = 1/σi2 .
Jsou-li veličiny X1 , . . . , Xn nezávislé se spojitým rozdělením, mají sdružené spojité rozdělení se sdruženou
hustotou rovnou součinu hustot jednotlivých veličin.
Pro sdruženou hustotu tedy platí ekvivalence odpovídající tvrzení věty:
2
1 − 12 (x1 −µ1 ) 1 − 12 (xn −µn )2
fX (x) = q e 2σ1 ... p e 2σn
2πσn2
2πσ12
1 1 T −1
⇐⇒ fX (x) = e− 2 (x−µ) Σ (x−µ) .
(2π)n/2 |Σ|1/2
V případě, kdy má část veličin nulové rozptyly (jsou konstantní), se využije faktu, že konstantní veličina je vždy
nezávislá na ostatních. Předchozí postup se tak aplikuje pouze na marginální rozdělení nekonstantních složek X
a konstantní veličiny se na obě strany ekvivalence přidají zvlášt’.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 18 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Důsledek
Bud’ X = (X1 , . . . , Xn )T ∼ N(µ, Σ). Pak pro i ̸= j platí, že Xi , Xj jsou nezávislé
právě tehdy, když jsou nekorelované.
• Pouhá informace, že obě náhodné veličiny mají normální rozdělení nestačí, vizte
jednoduchý protipříklad na wikipedia.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 19 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Důsledek
Bud’ X1 ∼ N µ1 , σ12 , . . . , Xn ∼ N µn , σn
2
nezávislé náhodné veličiny.
Potom X1 + . . . + Xn ∼ N µ1 + . . . + µn , σ12 + . . . + σn
2
.
Důkaz
cT X = X1 + . . . + Xn ∼ N(cT µ, cT Σc).
Protože cT µ = µ1 + . . . + µn a díky diagonálnosti Σ dále cT Σc = σ12 + . . . + σn
2
, dostáváme tvrzení
věty.
Toto tvrzení je možné pomocí konvoluce dokázat také napřímo bez využití předchozí věty.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 20 / 24
Náhodné vektory Vícerozměrné normální rozdělení
Důkaz
Sestrojme matici B tak, že má v řádcích napsané vektory v 1 , . . . , v n , resp. jejich transpozice. Protože
Σv i = λi v i , dostáváme ΣBT = BT Λ, kde Λ je diagonální matice s vlastními čísly na diagonále, tj.
Λi,i = λi pro každé i. Jelikož vektory v i tvoří ortonormální bázi, platí BBT = I. Tudíž
BΣBT = BBT Λ = Λ.
Protože Y = 0 + BX , platí Y ∼ N(Bµ, Λ). Nezávislost plyne z toho, že je Λ diagonální.
Položme
T
v1 . 0.79 0.62 . 0.79X1 + 0.62X2
B= T = a Y = BX = .
v2 −0.62 0.79 −0.62X1 + 0.79X2
hlavních komponent Yi .
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 22 / 24
Náhodné vektory Vícerozměrné normální rozdělení
v2
1
−1 1 2 3 4 5
x1
−1
−2
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 23 / 24
Náhodné vektory Vícerozměrné normální rozdělení
v2
−2 −1 1 2 3 4 5 6
v1
−1
−2
x1
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 4 24 / 24