Professional Documents
Culture Documents
BI PST Lec02 Slides
BI PST Lec02 Slides
Přednášející:
Mgr. Petr Novák, Ph.D.
Pravděpodobnost a statistika
BI-PST, ZS 2022/23, Přednáška 2
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 1 / 29
Organizace předmětu Obsah přednášek
Obsah přednášek
• Teorie pravděpodobnosti:
I Náhodné jevy, pravděpodobnostní míra, podmíněná pravděpodobnost, Bayesova věta,
nezávislost jevů.
I Náhodné veličiny, distribuční funkce, střední hodnota a rozptyl, soubory náhodných
veličin, sdružené a marginální rozdělení, nezávislost náhodných veličin, podmíněné
rozdělení, podmíněná střední hodnota.
I Vybraná diskrétní a spojitá rozdělení náhodných veličin, funkce náhodných veličin.
I Momenty, kvantily, kovariance a korelace, Markovova a Čebyševova nerovnost, zákony
velkých čísel, centrální limitní věta.
• Matematická statistika:
I Bodové odhady, výběrový průměr, výběrový rozptyl, intervalové odhady, testování
hypotéz, jednostranné a oboustranné alternativy.
I Vlastnosti bodových odhadů, metoda maximální věrohodnosti, lineární regrese, odhady
parametrů regresního modelu, testování významnosti modelu.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 2 / 29
Organizace předmětu Obsah přednášek
Rekapitulace
Pokud je možných výsledků pokusu jen konečně mnoho a jsou všechny stejně
pravděpodobné, lze počítat
|A|
P(A) = .
|Ω|
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 3 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Podmíněná pravděpodobnost
Jak se změní pravděpodobnost ve chvíli, kdy máme částečnou informaci o výsledku
experimentu?
Příklad
Když hodíme vyváženou kostkou, bez další informace víme, že P(6) = 1/6.
Pokud navíc víme, že padlo sudé číslo, je jasné, že P(6|sudé) = 1/3.
Definice
Bud’te A a B náhodné jevy, kde P(B) > 0. Podmíněnou pravděpodobnost jevu A za
podmínky, že nastal jev B , definujeme jako
P(A ∩ B)
P(A|B) = .
P(B)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 4 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Příklad:
Uvažujme rovnoměrné rozdělení na množině Ω s konečnou velikostí. Velikostí zde myslíme
např. počet prvků, délku, plochu, objem, dobu trvání, atp. Pravděpodobnost jevu A je pak
definována relativní velikostí vzhledem k velikosti Ω, tedy poměrem
P(A) = velikost(A)/velikost(Ω).
Pokud víme, že určitě nastal jev B , zajímáme se pouze o výsledky, které patří do B .
U jevu A proto nyní také uvažujeme pouze výsledky v B , takže se jedná o A ∩ B .
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 5 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
⌦ plocha(část A uvnitř B)
A B P(A dáno B) =
plocha(B)
plocha(A ∩ B) / plocha(Ω)
P(A|B) =
plocha(B) / plocha(Ω)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 6 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Odpověd’ je jistě 1/2: hodnota při druhém hodu musí být 4, 5 nebo 6.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 7 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Častý omyl:
P(HH ∩ (HH ∪ HD)) 1
P(HH|starší je hoch) = P(HH|HH ∪ HD) = = .
P(HH ∪ HD) 2
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 8 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Důkaz
Máme dokázat následující:
i) P(·|B) : F → R,
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 9 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
P(A ∩ B ∩ B) P(A ∩ B)
• P(A ∩ B|B) = = = P(A|B).
P(B) P(B)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 10 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Ω = B1 ∪ B2 ∪ B3 (disjunktní rozklad)
B1 B2 B3
Připomenutí:
A
P(A ∩ Bi )
A ∩ B2 P(A|Bi ) =
A ∩ B1 A ∩ B3 P(Bi )
A = A ∩ Ω = A ∩ (B1 ∪ B2 ∪ B3 )
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 )
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 11 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
B1 B2 B3
A Připomenutí:
A ∩ B2 P(A ∩ Bj ) = P(A|Bj ) P(Bj )
A ∩ B1 A ∩ B3
P(A|Bj ) P(Bj )
P(Bj |A) =
P(A|B1 ) P(B1 ) + P(A|B2 ) P(B2 ) + P(A|B3 ) P(B3 )
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 13 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
P(vadná|dovoz) P(dovoz)
P(dovoz|vadná) =
P(vadná|cz) P(cz) + P(vadná|dovoz) P(dovoz)
0.2 · 0.6 0.12 12
= = = = 75%.
0.1 · 0.4 + 0.2 · 0.6 0.16 16
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 14 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Věta Bayesova
Necht’ B1 , B2 , . . . , Bn je rozklad Ω takový, že ∀i : P(Bi ) > 0 a necht’ A je náhodný jev
kde P(A) > 0. Potom platí
P(A|Bj ) P(Bj )
P(Bj |A) = Pn .
i=1 P(A|Bi ) P(Bi )
P(K|S) P(S)
P(S|K) = =
P(K|S) P(S) + P(K|S c ) P(S c )
0.7 · 0.3 21
= = = 0.75.
0.7 · 0.3 + 0.1 · 0.7 28
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 16 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Pravděpodobnostní stromy
slouží k vizualizaci podmíněné pravděpodobnosti.
Nejprve si odvodíme užitečný vztah – rozšíření vzorce pro průnik dvou jevů, který jsme již
odvodili z definice podmíněné pravděpodobnosti:
Důkaz – stačí přímo dosadit dle definice podmíněné pravděpodobnosti do pravé strany:
P(B ∩ A) P(C ∩ A ∩ B)
P(A) P(B|A) P(C|A ∩ B) = P(A)
P(A) P(A ∩ B)
= P(A ∩ B ∩ C).
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 17 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Pravděpodobnostní stromy
slouží k vizualizaci podmíněné pravděpodobnosti.
P(A1 ∩ · · · ∩ An ) =
P(A1 ) P(A2 |A1 ) P(A3 |A1 ∩ A2 ) . . . P(An |A1 ∩ · · · ∩ An−1 ).
Důkaz
Postupně aplikujeme vztah P(A ∩ B) = P(A) P(B|A) plynoucí z definice podmíněné pravděpodobnosti.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 18 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
P(S ∩ K) 0.21
P(S|K) = = = 0.75.
P(K) 0.21 + 0.07
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 19 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
P (A3 |A1 ∩ A2 )
37/50
A3
• •
• • P (A1 ∩ A2 ∩ Ac3 ) 39 38 13
• • 52 · 51 · 50
• • • •
P (Ac1 ) 13/52
• •
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 20 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 21 / 29
Podmíněná pravděpodobnost a nezávislost Podmíněná pravděpodobnost
Definice
Náhodné jevy A a B se nazývají nezávislé, pokud
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 23 / 29
Podmíněná pravděpodobnost a nezávislost Nezávislost náhodných jevů
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 24 / 29
Podmíněná pravděpodobnost a nezávislost Nezávislost náhodných jevů
Věta
Jsou-li jevy A a B nezávislé, pak i A a B c (Ac a B ; Ac a B c ) jsou nezávislé.
Věta
Je-li (Ai )i∈I soubor nezávislých jevů, pak pro libovolnou konečnou podmnožinu
∅=6 J ⊂ I , je
P(∩i∈J Ai | ∩i∈I\J Ai ) = P(∩i∈J Ai ).
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 25 / 29
Podmíněná pravděpodobnost a nezávislost Nezávislost náhodných jevů
Ve skutečnosti ale neslučitelné jevy A a B mohou být nezávislé, jen pokud P(A) = 0
nebo P(B) = 0.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 26 / 29
Podmíněná pravděpodobnost a nezávislost Nezávislost náhodných jevů
Podmíněná nezávislost
Definice
Necht’ (Ω, F, P) je pravděpodobnostní prostor a C je náhodný jev s P(C) > 0. Náhodné
jevy A a B se nazývají podmíněně nezávislé za podmínky C , pokud
Připomenutí:
• Q(A) = P(A|C) je pravděpodobnostní míra.
• Podmíněná nezávislost je tedy nezávislost vzhledem k pravděpodobnostní míře Q.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 2 27 / 29
Podmíněná pravděpodobnost a nezávislost Nezávislost náhodných jevů
Podmíněná nezávislost
Příklad – hod sedmistěnnou kostkou
Hodíme sedmistěnnou kostkou, kde jsou všechny strany stejně pravděpodobné. Uvažujme:
Jev A: padne sudé číslo. Jev B : padne číslo menší něž 3. Jsou jevy A a B nezávislé?
A = {2, 4, 6}, B = {1, 2}, A ∩ B = {2}
1 3 2 6
P(A ∩ B) = a P(A) · P(B) = · = .
7 7 7 49
Tudíž jevy A a B nejsou nezávislé.
Rekapitulace
• Podmíněná pravděpodobnost, že nastane jev A, pokud víme, že nastal jev B , kde
P(B) > 0, je definována jako
P(A ∩ B)
P(A|B) = .
P(B)
• Věta o úplné pravděpodobnosti: Pro A a B , kde P(B) > 0 a P(B c ) > 0:
P(A) = P(A|B) P(B) + P(A|B c ) P(B c ).
• Bayesova věta: Pro A a B , kde P(A) > 0, P(B) > 0 a P(B c ) > 0:
P(A|B) P(B)
P(B|A) = .
P(A|B) P(B) + P(A|B c ) P(B c )