Professional Documents
Culture Documents
NI VSM Lec 02 Slides
NI VSM Lec 02 Slides
Přednášející:
doc. Ing. Pavel Hrabák, Ph.D.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 1 / 28
Obsah přednášek
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 2 / 28
Náhodné veličiny Definice náhodné veličiny, distribuční funkce
Náhodná veličina
Takové přiřazení lze provést mnoha způsoby. Budeme jej nazývat náhodnou veličinou
a značit X , Y apod.
Ω
ω1 X
ω2
ω4
ω3 R
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 3 / 28
Náhodné veličiny Definice náhodné veličiny, distribuční funkce
Poznámky:
• {X ≤ x} ≡ {X ∈ (−∞, x]} ≡ X −1 ((−∞, x]) = {ω ∈ Ω | X(ω) ∈ (−∞, x]}
• Podmínka měřitelnosti říká, že {X ≤ x} je náhodný jev, a proto jsme schopni počítat
pravděpodobnost P(X ≤ x) ≡ P({X ≤ x}).
• Bez této podmínky se neobejdeme, avšak v praxi ji obvykle nepotřebujeme ověřovat.
Definice
Distribuční funkce náhodné veličiny X je funkce F : R → [0, 1] definovaná vztahem
FX (x) = P(X ≤ x), ∀x ∈ R.
Distribučnı́ funkce
1
FX (x)
0
x
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 5 / 28
Náhodné veličiny Definice náhodné veličiny, distribuční funkce
Funkce, která každému x ∈ R přiřadí P(X > x), se nazývá funkce přežití náhodné
veličiny X .
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 6 / 28
Náhodné veličiny Typy náhodných veličin
• Některé mohou nabývat jen izolovaných hodnot (např. 0 nebo 1 pro hlavu a orla při
hodu mincí, hodnoty 1,...,6 při hodu kostkou).
• Některé mohou nabývat hodnot na spojité škále (např. váha novorozence, doba
čekání na autobus,...).
Nehledě na typ, distribuční funkce nám dá úplný popis chování náhodné veličiny.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 7 / 28
Náhodné veličiny Typy náhodných veličin
FX (x) FX (x)
0 0
x x
FX (x)
0
x
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 8 / 28
Náhodné veličiny Diskrétní náhodné veličiny
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 10 / 28
Náhodné veličiny Spojité náhodné veličiny, hustota
FX (x) = P(X ≤ x)
fX
Důsledky:
• P(X ≤ x) = P(X < x) - z ii)
• fX (x) dx ≈ P(x ≤ X < x + dx) pro dx ≪ 1 - z iv)
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 12 / 28
Náhodné veličiny Spojité náhodné veličiny, hustota
P(a < X ≤ b)
fX
a b
Z b h ib
P(a < X ≤ b) = fX (u) du = FX (x) = FX (b) − FX (a).
a a
Všimněte si, že u spojitých náhodných veličin nezáleží, jestli jsou nerovnosti ostré nebo
neostré:
P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b).
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 13 / 28
Náhodné veličiny Transformace náhodných veličin
Poznámky:
• Pokud je X diskrétní, pak Y = g(X) je také diskrétní náhodná veličina a
X
P(Y = y) = P(g(X) = y) = P(X = x).
{x∈X : g(x)=y}
Střední hodnota
U náhodné veličiny nás zajímají střed, šířka a další podobné charakteristiky jejího
rozdělení. Jednou ze základních charakteristik náhodné veličiny je její střední hodnota.
Definice
Střední hodnota (expectation) diskrétní náhodné veličiny X , nabývající hodnot z množiny
X = {x1 , x2 , . . . }, je definována vztahem
X
EX = x P(X = x).
x∈X
Střední hodnota spojité náhodné veličiny X s hustotou fX je určena vztahem
Z ∞
EX = xfX (x) dx.
−∞
Nutnou podmínkou je, že uvedená suma resp. integrál absolutně konverguje. Jinak říkáme,
že střední hodnota náhodné veličiny X neexistuje (nebo je ±∞).
Věta
Předpokládejme, že g je měřitelná funkce a že X a Y = g(X) jsou náhodné veličiny.
i) Má-li X diskrétní rozdělení, pak
X
E Y = E g(X) ≡ g(x) P(X = x).
x∈X
Z ∞
ii) Má-li X spojité rozdělení, pak E Y = E g(X) ≡ g(x)fX (x) dx.
−∞
Suma resp. integrál musí absolutně konvergovat, jinak E Y neexistuje (nebo je ±∞).
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 16 / 28
Náhodné veličiny Charakteristiky náhodných veličin
Věta
Střední hodnota náhodné veličiny X splňuje následující vlastnosti:
i) Je-li X ≥ 0, pak E(X) ≥ 0.
ii) Je-li a, b ∈ R, pak E(aX + b) = a E(X) + b (pokud X má konečnou E X ).
iii) Konstantní náhodná veličina X = c ∈ R má E(X) = c.
Poznámky:
• Tato věta platí nejen pro diskrétní a spojité, ale i pro smíšené náhodné veličiny.
• Až se budeme zabývat sdruženým rozdělením náhodných proměnných, uvidíme, že
pro dvojici náhodných veličin X a Y s konečnými středními hodnotami navíc platí
E(aX + bY ) = a E X + b E Y, ∀a, b ∈ R.
• Předchozí vlastnost se nazývá linearita střední hodnoty.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 17 / 28
Náhodné veličiny Charakteristiky náhodných veličin
Rozptyl
Definice
Rozptyl (variance) náhodné veličiny X je definován vztahem
var X = E(X − E X)2 .
Směrodatná odchylka náhodné veličiny X je definována jako
√
sd X = var X.
Rozptyl se také značí σ 2 a představuje míru „odchylování“ od střední hodnoty. Směrodatná
odchylka, též označovaná jako σ , má stejné jednotky jako X .
Věta
Rozptyl splňuje následující vlastnosti:
i) Pro všechna a, b ∈ R a náhodnou veličinu X platí
var(aX + b) = a2 var X.
ii) Náhodná veličina konstantně rovná c ∈ R má rozptyl var c = 0.
Další charakteristiky
• k -tý moment
µk = E X k
• k -tý centrovaný moment
σk = E(X − E X)k
• Koeficient šikmosti (míra asymetrie)
σ3 E(X − E X)3
γ1 = =
σ3 (var X)3/2
• Koeficient špičatosti (porovnání s normálním rozdělením)
σ4 E(X − E X)4
γ2 = − 3 = −3
σ4 (var X)2
• α-kvantil
qα = inf x ∈ R | FX (x) ≥ α
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 19 / 28
Náhodné veličiny Příklady rozdělení
1
pro x ∈ [a, b] a+b (b − a)2
fX (x) = b − a , EX = , var X = .
0 jinde
2 12
1 (x−µ)2
fX (x) = √ e− 2σ2 , E X = µ, var X = σ 2 .
σ 2π
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 21 / 28
Náhodné veličiny Příklady rozdělení
Gamma funkce
Abychom mohli elegantně definovat další spojitá rozdělení, zaved’me si speciální funkci.
Definice
Gamma funkce Γ je pro každé p > 0 definována vztahem
Z +∞
Γ(p) = xp−1 e−x dx.
0
10
Γ(x)
8
6
4
2
0
0 1 2 3 4 x
Mezi její základní vlastnosti patří pro každé p > 0 a n ∈ N:
√
Γ(p + 1) = pΓ(p), Γ(1) = 1, Γ(1/2) = π a Γ(n) = (n − 1)!
Gamma funkce tedy představuje interpolaci faktoriálu pro neceločíselné hodnoty parametru.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 22 / 28
Náhodné veličiny Příklady rozdělení
Gamma rozdělení
Definice
Nezáporná náhodná veličina X má gamma rozdělení s parametry a > 0, p > 0, píšeme
X ∼ Ga(a, p), jestliže má spojité rozdělení s hustotou
ap −ax p−1
fX (x) = e x
Γ(p)
pro x > 0 a fX (x) = 0 pro x ≤ 0.
Vlastnosti:
• Střední hodnota p
EX = .
a
• Rozptyl p
var X = 2 .
a
• Pro a = λ a p = 1 dostáváme exponenciální rozdělení.
• Pro a = λ a p = n dostáváme součet n nezávislých exponenciálních rozdělení
nazývaný Erlangovo rozdělení.
• Pro a = 1/2 a p = n/2 dostáváme χ2 rozdělení s n stupni volnosti.
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 23 / 28
Náhodné veličiny Příklady rozdělení
0.3
0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 x
χ2 rozdělení
Definice
Nezáporná náhodná veličina X má rozdělení χ2 nebo chí kvadrát s n ∈ N stupni volnosti,
píšeme X ∼ χ2n , jestliže má spojité rozdělení s hustotou
1 n x
fX (x) = n n
x 2 −1 e− 2
2 Γ2
2
Vlastnosti:
• Střední hodnota
E X = n.
• Rozptyl
var X = 2n.
χ2 rozdělení - vizualizace
n=1
0.5
n=2
fX (x) n=3
0.4 n=4
n=6
0.3
0.2
0.1
0
0 1 2 3 4 5 6 7 8 9 10 11 x
Hrabák, Novák, Vašata (FIT ČVUT) Vybrané statistické metody NI-VSM, LS 2023/24, Přednáška 2 26 / 28
Náhodné veličiny Příklady rozdělení
Studentovo rozdělení
Definice
Bud’ n ∈ N. Náhodná veličina X má Studentovo rozdělení nebo t rozdělení o n stupních
volnosti, píšeme X ∼ tn , jestliže má spojité rozdělení s hustotou
− n+1
Γ n+1
2 x2 2
fX (x) = n
√ 1 + pro každé x ∈ R.
Γ 2 πn n
Vlastnosti:
• Střední hodnota je definována pro n > 1 a platí
E X = 0.
• Rozptyl je definován a konečný pro n > 2, přičemž
0.2
−3 −2 −1 0 1 2 3 x
Poznámky:
• Pro n → +∞ konverguje studentovo rozdělení ke standardnímu normálnímu
rozdělení (ve slabém smyslu nebo také v distribuci).
• To znamená, že pro každé x ∈ R platí
lim Fn (x) = Φ(x),
n→+∞