You are on page 1of 33

SMĚRODATNÁ (STANDARDNÍ)

CHYBA PRŮMĚRU, Statistika pro psychology I


Z-TEST,
INTERVALY SPOLEHLIVOSTI
Image source: FRuDIxAFLG - Own work. CC BY-SA 4.0. https://commons.wikimedia.org/w/index.php?curid=114452600
Slidy označené
hvězdičkou jsou klíčové.
Obsahují nejpodstatnější
OSNOVA PŘEDNÁŠKY informace, které by měl
absolvent předmětu znát.
 Sampling
 Co je to sampling? Jak s ním souvisí populační a výběrové parametry?

 Směrodatná (standardní) chyba průměru


 Výběrové rozložení a odchylka průměrů vzorků

 Jednovýběrový z-test
 Jak odhadnout pravděpodobnost získání vzorku o určitém průměru?

 Intervaly spolehlivosti, inference Jak usuzovat z průměru vzorku


na průměr populace?
Image by Dan Kernler - Own work, CC BY-SA
4.0, https://commons.wikimedia.org/w/index.php?
curid=36506020

SAMPLING
CO JE TO SAMPLING?
 v reálu nikdy nemáme k dispozici celou populaci
(pokud tedy není extrémně úzce vymezená)

 v našich silách je shromáždit a změřit pouze určitý výsek populace,


tomuto výseku říkáme vzorek
 připomeňte si, co víte o způsobech výběru vzorku z metodologie

 podle výsledků získaných na vzorku můžeme odvozovat (inferovat)


na to, jak zřejmě vypadají charakteristiky populace
 protože charakteristiky populace obvykle neznáme, to jen v příkladech ze statistiky ano 
 můžeme i odhadovat, zda vzorek pochází z dané populace, nebo ne; příp. zda dva či více
vzorků pochází ze stejné populace (ale to až v dalších přednáškách)
SAMPLING
SAMPLING A POPULAČNÍ VERSUS VÝBĚROVÉ
PARAMETRY
 při náhodném výběru platí, že čím větší vzorek, tím lépe by měl
vystihovat svými charakteristikami charakteristiky populace, protože ji
vzorek lépe pokrývá
 to ale samozřejmě neplatí vždy – 10hlavý vzorek může shodou náhod
vystihovat populaci lépe než vzorek 1000hlavý
 nicméně odchylka (chyba) parametru vzorku od parametru populace má obecnou
tendenci se snižovat tím víc, čím je vzorek početnější
 zde platí pravidlo centrálního limitního teorému:
„Výběrové rozložení parametru proměnné se s rostoucí velikostí vzorku
blíží normálnímu rozložení.“ (Pozor nejde o rozložení samotné proměnné!
To může být klidně zešikmené či uniformní a ničemu to nevadí.)
SAMPLING
SAMPLING A POPULAČNÍ VERSUS VÝBĚROVÉ
PARAMETRY
 co je to výběrové rozložení (průměru)?
 je to rozložení hodnot průměrů naměřených v jednotlivých vzorcích
 jinými slovy, vybereme z populace vzorek n = 10, změříme např. výšku každého z těch
10 lidí a vypočteme průměr vzorku, poté postup opakujeme 1000x, nasbíráme 1000
vzorků, každý se svou vlastní průměrnou hodnotou výšky a nakonec tyto průměry
promítneme do grafu (ideálně histogramu), čímž vznikne výběrové rozložení průměru
 důležité je si uvědomit, že nyní už neuvažujeme o rozložení
samotných hodnot, ale o rozložení parametrů, tj. hodnot vzniklých
na základě hrubých skórů
 lze si to představit, jako že nyní se již nezabýváme hodnotami, které
charakterizují jednotlivé lidi, nýbrž hodnotami, které charakterizují skupinu
lidí (např. hodnota průměru vzorku)
SMĚRODATNÁ (STANDARDNÍ)
CHYBA PRŮMĚRU

Hesterberg, T. (2014). What Teachers Should Know About the Bootstrap: Resampling in the Undergraduate
Statistics Curriculum. Figure 4. The American Statistician, 69. 10.1080/00031305.2015.1089789.
VÝBĚROVÉ ROZLOŽENÍ
PRŮMĚRU
INTERAKTIVNÍ SIMULACE
https://www.zoology.ubc.ca/~whitlock/Kingfisher/S
amplingNormal.htm

 simulátor výběrového rozložení průměrné délky ryb


0.9

Výběrové skupina
(pravděpodobnostní)

density
0.6 N=5
rozložení průměrů N=10
při různých N=30

velikostech vzorku,
0.3
při a

0.0

5.0 7.5 10.0 12.5


y
SMĚRODATNÁ (STANDARDNÍ)
CHYBA PRŮMĚRU
 angl. Standard error (of the mean); SE
 jako skóry jednotlivých lidí mají odchylku od průměru
populace/vzorku, tak i průměry vzorků mají odchylku od průměru
populace, příp. průměru výběrového rozložení
 je to tedy v podstatě směrodatná odchylka rozložení, pokud
bychom místo hodnoty jednoho člověka (skór) měli hodnotu
jednoho vzorku (průměr) -> výběrové rozložení
SMĚRODATNÁ (STANDARDNÍ)
CHYBA PRŮMĚRU
 směrodatná chyba rozložení průměrů má s velikostí vzorku
kromě tendence se svým rozložením blížit normálnímu rozložení
navíc i tendenci se zmenšovat (zpřesňuje se odhad )
 protože když budeme mít ve vzorku více lidí, bude mít průměr vzorku tendenci blížit
skutečnému průměru populace a bude odolnější (robustnější) vůči extrémním
případům
 výběrové rozložení průměru tak bude s větším počtem lidí ve vzorku užší, špičatější
n = 10 n = 50 n = 500
SMĚRODATNÁ (STANDARDNÍ)
CHYBA PRŮMĚRU
 protože se SE s rostoucím n obvykle výrazně zmenšuje, musíme
při jejím odhadu zohlednit i n, ale jinak vychází ze (nebo z SD,
pokud neznáme )

 jelikož už víme, že SE je pro výběrové rozložení M více vzorků


skoro tímtéž, čím je pro rozložení skórů populace, nebo čím je SD
pro rozložení skórů jednoho vzorku, můžeme aplikovat totožnou
logiku jako při výpočtu pravděpodobnosti získání určitého skóru
 -> můžeme odhadovat pravděpodobnost získání určitého průměrného
skóru v našem vzorku, pokud známe , a n
Z-TEST

Image source: https://mindthegraph.com/blog/cs/hypothesis-testing/


JEDNOVÝBĚROVÝ Z-TEST
 jednovýběrový z-test používá z-skór průměru vzorku podobně
jako jsme používali transformaci hrubých skórů na z-skóry
Pro x jednotlivce: pro M skupiny:

 díky standardizaci nyní můžeme


určit pravděpodobnost získání
určitého průměru úplně stejně,
jako jsme to udělali u hrubých
skórů
 z je v tomto případě vzdálenost od
vyjádřená v počtu
𝑀 −𝜇 𝑀 −𝜇
JEDNOVÝBĚROVÝ Z-TEST - 𝑧=
𝑆𝐸
=
𝜎
PŘÍKLAD
 kolega-experimentátor si objednal 9 laboratorních myší, každá dorazila
√𝑛

ve vlastní neprůhledné přepravce; kolega si ale nyní jistý, zda skutečně


objednal myši, a bojí se přepravky otevřít, tak nás požádal o pomoc
 zkusili jste proto všech 9 přepravek zvážit (váhu přepravky jste odečetli)

a zjistili jste, že průměrná váha zvířete v přepravce je
víte, že populace laboratorních myší má váhu v kg s a při
zhruba normálním rozložení
 jak pravděpodobné je, že náhodným výběrem z myší
populace získáme vzorek (n = 9) s alespoň takovou
průměrnou váhou, jako jsme získali, nebo i vyšší?
(alternativně: náš vzorek je těžší než kolik % myších vzorků
ve výběrovém rozložení?)
 (po vypočtení: a co, kdybychom neměli 9 přepravek, ale
36?)
Velikost rozdílů
ZOPAKOVÁNÍ PRINCIPU pozorovaného od
očekávaného
Jednotka vzdálenosti, ve které
Standardizovaná velikost
rozdílů v jednotkách SE pro 𝑀 −𝜇 by se mělo nacházet cca 68%
snazší vyhodnocení umístění 𝑧 = rozdílů, pokud H0 platí; SE je
𝑆𝐸
rozdílů v očekávané distribuci SD výběrového rozložení M
 základní princip testování je stále stejný:
1. určíme, jak by měla data vypadat (tím definujeme )
2. provedeme měření (zjistíme )
3. vyjádříme rozdíly pozorovaného od očekávaného ()
4. zhodnotíme, zda jsou rozdíly podstatné, či ne
 v tom nám pomůže standardizace: vyčíslíme rozdíl v jednotkách SD
očekávaného rozložení
INTERVALY SPOLEHLIVOSTI

Image Source: https://datatab.net/tutorial/confidence-interval


INTERVALY SPOLEHLIVOSTI
 ve statistice téměř nikdy neznáme skutečné hodnoty populačních
parametrů (ty obvykle definujeme skrze hypotézy), ale chceme na
ně usuzovat na základě parametrů vzorku
 tzn. chtěli bychom nějak vyčíslit, jaká je hodnota parametru v
populaci; např. jaké je na základě pozorovaného
 k tomu můžeme využít znalosti vlastností normálního rozložení,
jenom otočíme logiku inference
INTERVALY SPOLEHLIVOSTI
 v případě průměru: už víme, že
při náhodném výběru se 68%
hodnot bude nacházet v rozpětí
od
 můžeme si tedy odvodit, že při
náhodném výběru se bude u
68% zjištěných skutečné
nacházet ve vzdálenosti
INTERVALY SPOLEHLIVOSTI
Rozmezí kolem
bodů je nakresleno
do vzdálenosti
𝑧=0 ,5
𝑧=− 0 , 99
U zelených bodů
rozmezí zahrnuje , u
červených bodů ne 𝑧 =2
𝑧=−1 , 2
INTERVALY SPOLEHLIVOSTI
 víme, že když vybereme
vzorek náhodně, máme 68%
pravděpodobnost získat takový
vzorek, jehož je v rozmezí od
 tudíž máme na náhodně
vybraném vzorku, kolem jehož
sestrojíme rozmezí ,
pravděpodobnost 68% do
tohoto rozmezí zahrnout i
INTERVALY SPOLEHLIVOSTI
 matematicky spočítáme jako:
 spodní limit
 horní limit
 právě jsme spočítali 68%
interval spolehlivosti (angl.
confidence interval) průměru!
Reportujeme v textu jako:
68% CI [spodní limit; horní
limit]
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)
 samozřejmě platí, že si můžeme délku intervalu uzpůsobit záměru
 v psychologii se většinou používají 95% nebo 90% intervaly spolehlivosti,
protože chceme mít vysokou pravděpodobnost, že interval zahrnuje
skutečný populační parametr
 jak rozpětí intervalu uzpůsobit? zvýšíme/snížíme počet SE ve vzorečku
podle toho, jak velkou jistotu chceme mít, že zahrneme
 např. už víme, že zhruba 95% hodnot se nachází ve vzdálenosti
od
 tudíž cca 95% interval spolehlivosti určíme jako
 klíčem je znát distribuci norm. rozložení a odpovídající hodnoty
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)

 bodovým odhadem je parametr, který nás zajímá, často průměr


nebo velikost nějakého efektu
 je krajní hodnota konců distribuce, v podstatě z-skóry kolem
středu rozložení, které symetricky vymezují námi určené
procento distribuce kolem středu… toto procento je pak právě
tím X% čímž interval pojmenováváme
 pro 90% CI ; pro 95% CI ; pro 99% CI
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)

Image source: Confidence Interval for a Population mean, with a known Population Variance. Finance Train
[Website]. https://financetrain.com/confidence-interval-population-mean-known-population-variance
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)

 příklad: odhadněte 95% CI pro


 zápis výsledku: M = 3.0, 95% CI [4.0; 5.0]

 jak poznáme, že náš interval skutečně zahrnuje ?... To


nezjistíme, to je statistika, nic není 100%  (ledaže byste určili
100% CI [])
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)
Co ovlivňuje délku intervalů spolehlivosti?
 předně jejich hladina spolehlivosti, určená námi – 50% CI bude
relativně úzký/přesný, ale za cenu toho, že budeme mít jen 50%
pravděpodobnost, že zahrnuje skutečný parametr; naproti tomu
99% CI bude široký/nepřesný, ale zase máme velkou jistotu, že se
parametr v daném intervalu skutečně nachází
 velikost vzorku – větší vzorky umožňují přesnější odhad, CI
bude užší/přesnější
 – pokud jsou hodnoty kolem průměru rozptýlené více, pak je i
odhad , potažmo , méně přesný a CI budou širší
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)

Image source: Nicholas School of Environment, ENV710 Statistics Review Website. https://sites.nicholas.duke.edu/statsreview/ci/
Bell Curve: 68-95-99 Rule. http://www.mathguide.com/lessons3/BC.html
INTERVALY SPOLEHLIVOSTI
(CONFIDENCE INTERVALS)
 Interaktivní simulace náhodného výběru průměrů a
jejich intervalů spolehlivosti:
https://logarithmic.net/2017/dance/

 Anebo interaktivní Excel ke stažení z:


https://thenewstatistics.com/itns/esci/
PROPOJENÍ CI A Z-TESTU
 Intervaly spolehlivosti jsou užitečné nejen při optickém
hodnocení v grafech
 pokud CI nezahrnuje očekávané , pak víme, že naměřené je
od ve větší vzdálenosti než právě takové procento
očekávaných pozorování, kolikaprocentní CI je
 např. pokud a , pak víme, že se nachází mezi 5%
nejvzdálenějších očekávaných pozorování
 tudíž je málo pravděpodobné takový výsledek náhodným výběrem
získat, pokud , ergo pravděpodobně
V grafu vidíme průměry tří
group ctrl trt1 trt2
skupin s 95% CIs.
Hypotetizované . Budeme
předpokládat, že skupiny,
jejichž průměr se nachází v 6.0
rozmezí 95% očekávaných
pozorování nejblíže pochází 5.5
skutečně z rozložení s

Weight
5.0
průměrem . Skupiny, jejichž
průměr je dále, resp. mezi
4.5
5% očekávaných
pozorování nejdále od , 4.0
budeme považovat za
pocházející z populace, pro 3.5
kterou . Pro které skupiny ctrl trt1 trt2
budeme předpokládat ? Treatment
CO SI Z PŘEDNÁŠKY ODNÉST
 S rostoucí velikostí vzorku se zmenšuje pravděpodobnost
odchylky parametrů vzorku od parametrů populace, naše
odhady populačních parametrů jsou přesnější, snižuje se chyba
 SE je SD výběrového rozložení nějakého parametru, často
průměru, s rostoucím vzorkem typicky klesá
 Pro zhodnocení odchylky průměru vzorku od očekávaného
používáme jednovýběrový z-test
 Chceme-li odhadnout přibližnou hodnotu skutečného ,
sestrojíme kolem intervaly spolehlivosti
Začátečník Pokročilý
Expert
KE STUDIU
Povinná literatura
 Field, kap. 8, s. 257-296.

 Doporučená literatura
 Howell, kap. 7, s. 179-185.

 Doplňující materiály
 SE vs SD:
https://www.youtube.com/watch?v=A82brFpdr9g&ab_channel=StatQuestwithJoshS
tarmer
 CIs (až na nesprávnou interpretaci výsledku jde o přehledné video):
https://www.youtube.com/watch?v=ENnlSlvQHO0&ab_channel=DATAtab
 Hoekstra, R., Morey, R. D., Rouder, J. N., & Wagenmakers, E. J. (2014). Robust
misinterpretation of confidence intervals. Psychonomic bulletin & review, 21(5),
1157-1164. https://doi.org/10.3758/s13423-013-0572-3
CO NÁS ČEKÁ PŘÍŠTĚ?

You might also like