Professional Documents
Culture Documents
BI PST Lec01 Slides
BI PST Lec01 Slides
Přednášející:
Mgr. Petr Novák, Ph.D.
Pravděpodobnost a statistika
BI-PST, ZS 2022/23, Přednáška 1
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 1 / 37
Organizace předmětu Obsah přednášek
Obsah přednášek
• Teorie pravděpodobnosti:
I Náhodné jevy, pravděpodobnostní míra, podmíněná pravděpodobnost, Bayesova věta,
nezávislost jevů.
I Náhodné veličiny, distribuční funkce, střední hodnota a rozptyl, soubory náhodných
veličin, sdružené a marginální rozdělení, nezávislost náhodných veličin, podmíněné
rozdělení, podmíněná střední hodnota.
I Vybraná diskrétní a spojitá rozdělení náhodných veličin, funkce náhodných veličin.
I Momenty, kvantily, kovariance a korelace, Markovova a Čebyševova nerovnost, zákony
velkých čísel, centrální limitní věta.
• Matematická statistika:
I Bodové odhady, výběrový průměr, výběrový rozptyl, intervalové odhady, testování
hypotéz, jednostranné a oboustranné alternativy.
I Vlastnosti bodových odhadů, metoda maximální věrohodnosti, lineární regrese, odhady
parametrů regresního modelu, testování významnosti modelu.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 2 / 37
Organizace předmětu Podmínky absolvování
• Cvičení:
I bude se psát 6 testů po 6 bodech, započte se 5 nejlepších – až 30b
I bude zadána domácí úloha – až 10b
I k zápočtu je nutno získat alespoň 20b (z možných 40b).
• Zkouška:
I písemná zkouška, maximálně 60b
I minimum nutné ke složení písemné zkoušky je 30b
I body ze zkoušky a z cvičení se sčítají
I možnost přilepšit si u dobrovolné zkoušky z teorie až o 5b
I ke zkoušce z teorie mohou jen ti, kdo úspěšně složili písemnou část
I právo veta: zásadní neznalost u zkoušky z teorie může vést ke ztrátě zkouškového
termínu a povinnosti složit písemnou zkoušku znovu.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 3 / 37
Organizace předmětu Doporučená literatura
Doporučená literatura
České tituly:
• Tomáš Hobza: Matematická statistika, FJFI (online)
• Jiří Pavlík: Aplikovaná statistika, skripta VŠCHT (online)
• Jiří Anděl: Základy matematické statistiky, matfyzpress (2007) (pokročilé)
Anglické tituly:
• D. P. Bertsekas & J. N. Tsitsiklis: Introduction to Probability, Athena Scientific MIT
(2008)
• G. R. Grimmett & D. R. Stirzaker: Probability and Random Processes, Oxford
University Press (2001)
• Ch. M. Grinstead & J. L. Snell: Introduction to Probability, AMS (1997) – (online)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 4 / 37
Základní pojmy pravděpodobnosti Motivace
Pravděpodobnost a statistika
Přesná predikce není často možná, protože je studovaný jev bud’to příliš kom-
plexní, nebo nemáme k dispozici všechny potřebné informace.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 5 / 37
Základní pojmy pravděpodobnosti Motivace
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 6 / 37
Základní pojmy pravděpodobnosti Motivace
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 7 / 37
Základní pojmy pravděpodobnosti Motivace
3 1
P(sudé) = = .
6 2
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 8 / 37
Základní pojmy pravděpodobnosti Motivace
Romeo B
1/4
0 1/4 Julie 1
1 − (3/4) · (3/4) 7
P(B) = = .
1 16
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 10 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Definice
Množinu všech možných výsledků daného experimentu značíme Ω a nazýváme ji prostor
elementárních jevů nebo také výběrový prostor (sample space).
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 11 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 12 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Příklady
• Hod mincí: Ω = {H, O}
• Hod kostkou: Ω = {1, 2, 3, 4, 5, 6}
• Hod dvěma mincemi: Ω = {H, O} × {H, O} ≡ {(H, H), (H, O), (O, H), (O, O)}
• Výška rakety nad povrchem země: Ω = [0, ∞)
• Náhodný text emailu v kódování UTF-32 (constant length) o maximální velikosti 1MB.
Maximální počet znaků ve zprávě je
1 MB 220 bytes
= = 218 = 262144.
32 bits 4 bytes
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 13 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Příklady
• Série n hodů kostkou: Ω = {1, 2, 3, 4, 5, 6}n
• Série (
n hodů kostkou, při které nás zajímá jen to kolikrát
) padne která strana:
6
X
Ω = (k1 , k2 , k3 , k4 , k5 , k6 ) ∈ Z6+ : ki = n
i=1
• Hod šipkou do terče T ⊂ R2 : Ω = T ∪ {∗}, kde {∗} je jednobodová množina
reprezentující výsledek „ šipka netrefila terč “
Pokud je terč rozdělen na 5 pásem a jde nám jen o to do kterého pásma se šipka
zabodla, je Ω = {1, 2, 3, 4, 5, ∗}
• Házení mincí dokud nepadne první orel: spočetný prostor Ω = {ω1 , ω2 , ω3 , . . . },
ωi : výsledek kdy prvních i − 1 hodů padla hlava a i-tý hod je orel
• Házení mincí nekonečně mnohokrát: nekonečný prostor Ω = {H, O}N
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 14 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
6 1
1,5
5 2
druhý hod
4 3
4
3
2 5 5,4
1 6
1 2 3 4 5 6 6,6
první hod
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 15 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Náhodné jevy
Náhodným jevem A budeme rozumět množinu elementárních jevů – tj. podmnožinu
A ⊂ Ω, které potřebujeme přiřadit pravděpodobnost.
A = {2, 4, 6} ⊂ Ω.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 16 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 17 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Ukazuje se, že stačí uvažovat náhodné jevy jako prvky nějaké σ -algebry F :
Definice
Systém F podmnožin prostoru Ω nazýváme σ -algebrou (angl. též σ -field) jestliže jsou
splněny následující podmínky:
i) ∅ ∈ F – obsahuje nemožný jev
ii) když A ∈ F , tak Ac ∈ F – obsahuje opačný jev
S∞
iii) když A1 , A2 , . . . ∈ F , tak i=1 Ai ∈ F – obsahuje spočetné sjednocení.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 18 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Při specifikaci pravděpodobnostního modelu tedy vždy uvažujeme dvojici (Ω, F), kterou
nazýváme měřitelný prostor.
Zadání F nám říká, jaké jevy můžeme „ pozorovat “ a také měřit jejich pravděpodobnost.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 19 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Pravděpodobnostní míra
Definice
Pravděpodobnostní míra na (Ω, F) je funkce P : F → R splňující:
i) nezápornost: pro každé A ∈ F platí P(A) ≥ 0
ii) normalizace: P(Ω) = 1,
iii) σ−aditivita: když jsou A1 , A2 , . . . ∈ F vzájemně disjunktní jevy
(Ai ∩ Aj = ∅ pro ∀i, j : i 6= j ), tak
∞ ∞
!
[ X
P Ai = P(Ai ).
i=1 i=1
Bertrandův paradox
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 21 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Bertrandův paradox
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 22 / 37
Základní pojmy pravděpodobnosti Experiment, pravděpodobnostní prostor
Bud’ Ω libovolný prostor s konečnou mírou µ, tj. umíme měřit velikosti (délku, plochu,
objem, hmotnost, čas, apod.). Pro náhodný jev A ⊂ Ω definujeme:
µ(A) velikost A
P(A) = = .
µ(Ω) velikost Ω
Snadno ověříme, že vyhovují definici pravděpodobnostní míry.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 23 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Vlastnosti pravděpodobnosti
Věta
Necht’ A a B jsou náhodné jevy na pravděpodobnostním prostoru s mírou P. Potom platí:
i) P(∅) = 0
ii) jestliže A a B jsou vzájemně disjunktní, pak P(A ∪ B) = P(A) + P(B)
iii) P(Ac ) = 1 − P(A)
iv) P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
v) pokud A ⊂ B , tak P(A) ≤ P(B) - monotonie
Důsledky:
• P(A) ≤ 1 – z v)
• P(A ∪ B) ≤ P(A) + P(B) – z iv)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 24 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
⌦
A
plocha(A)
P(A) =
plocha(Ω)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 25 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Heuristika:
plocha(Ac ) = plocha(Ω) − plocha(A)
P(Ac ) = 1 − P(A)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 26 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
⌦
A B
P(A∪B) = P(A)+P(B)−P(A∩B)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 27 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
⌦
A B
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
⌦
A B
Průnik jsme přičetli dvakrát. Musíme jej tedy odečíst.
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 28 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Důkaz
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 29 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Důkaz
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 30 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Vlastnosti pravděpodobnosti
Věta
Necht’ A1 , A2 , . . . jsou náhodné jevy na pravděpodobnostním prostoru s mírou P. Potom
platí:
∞ ∞
!
[ X
i) σ−subaditivita: P Ai ≤ P(Ai )
i=1 i=1
n
! !
[ X \
|J|−1
ii) princip inkluze-exkluze: P Ai = (−1) P Ai
i=1 J⊂{1,2,...,n} i∈J
J6=∅
Pro 3 jevy: P(A ∪ B ∪ C) =
P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 31 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
∞ ∞ i−1
!
[ [ [
i) Množinu Ai můžeme zapsat jako disjunktní sjednocení Ai \ Ak Z iii) vlastnosti definice
i=1 i=1 k=1
pravděpodobnosti dostáváme
∞ ∞ i−1 ∞ i−1 ∞
! !! !
[ [ [ X [ X
P Ai =P Ai \ Ak = P Ai \ Ak ≤ P(Ai ).
i=1 i=1 k=1 i=1 k=1 i=1
ii) Dokážeme tvrzení pro tři jevy A, B , C : Množinu A ∪ B ∪ C můžeme napsat jako disjunktní sjednocení
A ∪ ((B ∪ C) \ A).
Z bodu ii) předchozí věty plyne P(A ∪ B ∪ C) = P(A) + P((B ∪ C) \ A).
Protože P(B ∪ C) = P((B ∪ C) \ A) + P(A ∩ (B ∪ C)), dostáváme:
P(A ∪ B ∪ C) = P(A) + P(B ∪ C) − P((A ∩ B) ∪ (A ∩ C)).
a znovu aplikujeme bod ii) předchozí věty na:
P(B ∪ C) a P((A ∩ B) ∪ (A ∩ C)) C
B
A
finálně dostáváme:
P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 32 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Spojitost pravděpodobnosti
Věta
Necht’ A1 , A2 , . . . je posloupnost náhodných jevů rostoucí ve smyslu inkluze, tj.
A1 ⊂ A2 ⊂ A3 ⊂ . . . . Označme
∞
[
A= Ai .
i=1
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 33 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
∞ ∞ N
!
[ X X
P(A) = P (An \ An−1 ) = P(An \ An−1 ) = lim P(An \ An−1 )
N →∞
n=1 n=1 n=1
= lim P(AN )
N →∞
C
Množiny Bn splňují předpoklady z první části a tedy:
C C
P(B) = 1 − lim P(BN ) = lim 1 − P(BN ) = lim P(BN )
N →∞ N →∞ N →∞
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 34 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
• Dva hráči, A a B, hrají opakovaně spravedlivou hru (kde oba mají stejnou šanci na
výhru), dokud jeden hráč nedosáhne 6 vítězství.
• Oba hráči vsadili stejnou částku, vítěz bere vše.
• Série her je předčasně přerušena, přičemž zatím:
I A vyhrál 5x,
I B vyhrál 3x.
• Jak by si měli rozdělit vloženou sázku?
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 35 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 36 / 37
Základní pojmy pravděpodobnosti Vlastnosti pravděpodobnosti
Rekapitulace
Pokud je možných výsledků pokusu jen konečně mnoho a jsou všechny stejně
pravděpodobné, lze počítat
|A|
P(A) = .
|Ω|
Blažek, Kotecký, Vašata, Hrabáková, Novák (FIT ČVUT) Pravděpodobnost a statistika BI-PST, ZS 2022/23, Přednáška 1 37 / 37