You are on page 1of 31

Usporedba dviju

aritmetičkih sredina: t-
test (nastavak)
Uvod u deskriptivnu i inferencijalnu statistiku
04.01.2021.
Izv. prof. dr. sc. Irena Burić
Ponavljanje

• t–odnos se općenito odnosi na razlomak kod kojeg se u


brojniku nalazi neka vrijednost, a u nazivniku pogreška te
vrijednosti
• t–odnos je najpoznatiji kod testiranja značajnosti razlika između
dvije aritmetičke sredine i u tom slučaju on pokazuje koliko je
puta neka razlika veća od svoje pogreške

 Δ - razlika između M-ova 2 uzorka


t
 σΔ- standardna pogreška razlike
Ponavljanje
• što znače sljedeći izrazi?

a. t=1.2, df=112, p>0.05

b. t=5.25, df=400, p<0.01

c. t=2.22, df=1000, p<0.05, p>0.01


Formule za računanje t-testa
• t-test na jednom uzroku
• t-test za velike nezavisne uzorke
• t-test za male nezavisne uzorke
• t-test za velike zavisne uzorke
• t-test za male zavisne uzorke
t-test: mali nezavisni
uzorci
2 nezavisne skupine ispitanika
N<30 (?)
t–test: mali nezavisni uzorci
• t-test pokazuje koliko je puta neka razlika između dvije
aritmetičke sredine veća od svoje pogreške tj. standardne
pogreške razlike
• kod VELIKIH UZORAKA t vrijednost mora biti veća od 1.96 da
bi neku razliku proglasili statistički značajnom (p<.05)
• no, kada imamo male uzorke, situacija je drugačija
t-test: mali nezavisni uzorci
• kod MALIH UZORAKA, normalna raspodjela više ne pokazuje
točno vjerojatnost odstupanja neke izračunate vrijednosti od
prave vrijednosti u populaciji zbog čega je granične t-
vrijednosti potrebno očitati u t-tablici
• za male uzorke, formirani su posebni postupci kojima se
provjerava statistička značajnost razlike – ti postupci mogu se
primijeniti i na velike uzorke, ali postupci za velike uzorke ne
smiju se upotrijebiti na malim uzorcima!
t-test: mali nezavisni uzorci
• pod pretpostavkom da oba uzorka potječu iz iste populacije
(nul–hipoteza), određuje se zajednička standardna devijacija
za oba uzorka
• pretpostavlja se da se na taj način može dobiti točnija procjena
standardne devijacije populacije
• no, zajedničku standardnu devijaciju opravdano je računati
samo ako se varijance dvaju uzoraka međusobno ne razlikuju
statistički značajno – drugim riječima, mora biti zadovoljen uvjet
HOMOGENOSTI VARIJANCI
t-test: mali nezavisni uzorci
• značajnost razlike između dvije varijance određuje se pomoću
F-testa:
𝑣𝑒ć𝑎 𝜎 2
𝐹=
𝑚𝑎𝑛𝑗𝑎 𝜎 2

• u tablici F-vrijednosti nalaze se granične vrijednosti F za


pojedine stupnjeve slobode veće i manje varijance, pomoću
kojih se određuje statistička značajnost razlike u varijancama
dvaju uzoraka
t-test: mali nezavisni uzorci
• ako se varijance međusobno statistički značajno razlikuju,
možemo:
• upotrijebiti aproksimativnu metodu Cochrana i Cox-ove (1950; Petz,
1997)
• upotrijebiti neparametrijski test (npr. test sume rangova)
t-test: mali nezavisni uzorci
• ipak, neka istraživanja pokazuju da će t-test dati relativno točne
rezultate unatoč tome što varijance nisu homogene, ako su oba
uzorka jednako velika – u tom će slučaju, čak i ako se varijance
razlikuju statistički značajno, pogreška u računu biti neznatna
• no, ako N nije podjednak u oba uzorka, potrebno je testirati
homogenost varijanci, odnosno koristiti alternativni postupak
t-test: mali nezavisni uzorci

M1  M 2 M1  M 2
t  df=(N1-1)+(N2-1)
 M M 1 1
1 2
 
N1 N 2

 1 ( N 1  1)   2 ( N 2  1)
2 2


𝜎ത - zajednička
standardna devijacija
( N 1  1)  ( N 2  1)
Vježba 1
• U istraživanju djelotvornosti novog anksiolitika, sudjelovalo je 30
osoba kojima su dijagnosticirani simptomi anksioznosti. 15 osoba je
kroz period od 6 tjedana uzimalo novi lijek (eksperimentalna
skupina), a 15 osoba je primalo placebo (kontrolna skupina). Nakon
terapije svi ispitanici su ispunili upitnik anksioznosti i pritom postigli
sljedeće rezultate (veći rezultat ukazuje na veću anksioznost).
• E skupina: M=14, SD=3.2
• K skupina: M=16, SD=4.4
• postoji li razlika u intenzitetu simptoma anksioznosti između te dvije
skupine?
• nul hipoteza: ne postoji razlika u intenzitetu simptoma anksioznosti
između dvije skupine
Vježba 1
• izračunati zajedničku standardnu devijaciju:
𝜎12 𝑁1 − 1 + 𝜎22 (𝑁2 − 1) 3.22 15 − 1 + 4.42 (15 − 1)
𝜎ത = = = 3.85
𝑁1 − 1 + (𝑁2 − 1) 15 − 1 + (15 − 1)

• izračunati t-vrijednost:
𝑀1 − 𝑀2 14 − 16
𝑡= = = −1.42
1 1 1 1
𝜎ത + 3.85 +
𝑁1 𝑁2 15 15

• t=-1.42, df=28, p>0.05; Prihvaćamo H0: ne postoji statistički značajna


razlika u intenzitetu simptomima anksioznosti između osoba koje su
uzimale novi lijek i onih koje nisu (p>0.05)
Ponovimo
• što zapravo znači p>0.05?
• da smo odbacili nul-hipotezu, vjerojatnost da smo pogriješili bila bi
veća od 5%!
• tako velika razlika može se pojaviti u više od 5 od 100 slučajnih razlika
t-test: veliki zavisni uzorci
1 skupina ispitanika u dvije situacije mjerenja
N>30 (?)
t-test: veliki zavisni uzorci
• situacija u kojoj imamo dva mjerenja na istim ispitanicima (npr.
mjerimo VR skupini od 100 ispitanika u 2 navrata: 1. mjerenje –
bez utjecaja alkohola; 2. mjerenje – pod utjecajem alkohola)
• s obzirom da u oba mjerenja sudjeluju isti ispitanici, za očekivati
je da će izmjerene vrijednosti iz 1. i 2. mjerenja biti u korelaciji
tj. da će biti povezane – ispitanici koji brzo reagiraju na podražaj
vjerojatno će imati kraće vrijeme reakcije u obe situacije
mjerenja
t-test: veliki zavisni uzorci
• rezultati su u korelaciji kad:
• isti ispitanici sudjeluju u eksperimentalnoj i kontrolnoj situaciji (2
situacije mjerenja)
• kad su upotrijebljeni ekvivalentni parovi
t-test: veliki zavisni uzorci

M1  M 2 M1  M 2
t 
 M M
1 2  M 1   M 2  2r M 1 M 2
2 2

df=N-1
Stupnjevi slobode
• df=N-1
• N je jednak broju razlika, tj. broju parova rezultata
• no, s obzirom da standardnu pogrešku razlike računamo na
temelju procijenjene vrijednosti standardne devijacije populacije
(zapravo, koristimo SD uzorka koju računamo pomoću M
uzorka), gubimo jedan stupanj slobode
Vježba 2
• Skupina od 60 plivača u dva navrata je preplivala dužinu od 300
metara. Izračunati su sljedeći deskriptivni parametri:
• M1=270, SD1=25.7
• M2=284 , SD2=35.6
• r=0.74
• postoji li razlika u vremenu u kojem su plivači preplivali bazen u
prvom i drugom pokušaju?
• nul-hipoteza: nema razlike u vremenu u kojem su plivači
preplivali bazen u prvom i drugom pokušaju
Vježba 2
• izračunati standardne pogreške aritmetičkih sredina za prvo i drugo
mjerenje: σM1=3.32 i σM2=4.6
• izračunati t-vrijednost
𝑀1 − 𝑀2 270 − 284
𝑡= = = −4.53
2
𝜎𝑀 + 𝜎 2
− 2𝑟𝜎𝑀1 𝜎𝑀2 3.322 + 4.62 − 2 ∙ 0.74 ∙ 3.32 ∙ 4.6
1 𝑀 2

• t=-4.53, df=59, p<.01; Odbacujemo H0: utvrđena je statistički


značajna razlika u prosječnom vremenu u kojem su plivači preplivali
bazen u dva pokušaja uz rizik pogrešnog zaključka manji od 1% - u
prvom pokušaju plivači su bazen preplivali brže u odnosu na drugi
pokušaj
t-test: mali zavisni uzorci
1 skupina ispitanika u dvije situacije mjerenja
N<30 (?)
t-test: mali zavisni uzorci
• METODA DIFERENCIJE
• jednostavna i praktična jer je u rezultat koji dobivamo samim
postupkom uračunata korelacija
• sastoji se u tome da se individualne razlike parova rezultata uzmu kao
uzorak te se određuju aritmetička sredina, standardna devijacija i
standardna pogreška
t-test: mali zavisni uzorci
• koraci u provedbi metode diferencije:
1. odrediti razlike D među rezultatima istog ispitanika u dvije
situacije mjerenja tj. odrediti razlike individualnih parova
rezultata: D=Xi1-Xi2
2. zbrojiti sve individualne razlike, uzimajući u obzir i predznak,
te podijeliti taj zbroj brojem ispitanika tj. parova što će nam
dati prosječnu razliku tj. diferenciju između aritmetičkih
σ𝐷
sredina u dvije situacije mjerenja: 𝑀𝐷 = = 𝑀1 − 𝑀2
𝑁
t-test: mali zavisni uzorci
• koraci u provedbi metode diferencije:
3. izračunati standardnu devijaciju razlika σD
4. izračunati standardnu pogreške aritmetičke sredine odnosno
standardnu pogrešku razlike:
• s obzirom da je MD zapravo prava razlika, standardna pogreška
aritmetičke sredine zapravo postaje standardna pogreška razlike:

 MD 
 D

N
t-test: mali zavisni uzorci
• koraci u provedbi metode diferencije:
5. izračunati t – vrijednost:

MD
t= df=N-1
σMD
Vježba 3
• Na jednom natjecanju • Tablica 1. Dužine skokova (N=9)
zabilježene su dužine prvog i skakač 1. skok 2. skok
drugog skoka na skijaškoj
1.
skakaonici devetorice 98 101
skakača. Postoji li statistički 2. 104 103
značajna razlika u prosječnoj 3. 101 100
dužini skoka prve i druge 4.
serije za ovih 9 skakača? 94 98
5. 106 98
• nul hipoteza: nema razlike u
prosječnoj dužini skoka prve i 6. 111 108
druge serije 7. 99 103
8 108 105
9. 110 107
Vježba 3
skakač 1. skok 2. skok D
Izračunati: 1. 98 101
• razlike između dužine 1. i 2. 2. 104 103
skokova (D) 3. 101 100

• aritmetičku sredinu razlika (𝑀𝐷 ) 4. 94 98


5. 106 98
• standardnu devijaciju razlika (σD) 6. 111 108
7. 99 103
8 108 105
9. 110 107
MD=?
σD=?
Vježba 3
skakač 1. skok 2. skok D
1. 98 101 -3
2. 104 103 +1
3. 101 100 +1
4. 94 98 -4
5. 106 98 +8
6. 111 108 +3
7. 99 103 -4
8 108 105 +3
9. 110 107 +3
MD=0.89

σD=3.98
Vježba 3
• Izračunati standardnu pogrešku razlike 𝜎𝑀𝐷 :

𝜎𝐷 3.98
𝜎𝑀𝐷 = = = 1.33
𝑁 9
• izračunati t-vrijednost:
𝑀𝐷 0.89
𝑡= = = 0.67
𝜎𝑀𝐷 1.33

• t=0.67, df=8, p>.05; Prihvaćamo H0: razlika u prosječnoj dužini skoka


u prvom i drugom skakanju nije statistički značajna (p>0.05)

You might also like