Professional Documents
Culture Documents
T-TEST
T-test spada u inferencijalnu statistiku. Sve što smo do sada radili, spada u deskriptivnu
statistiku, čiji je zadatak da opiše neki skup brojeva. Tu spadaju i grafički prikazi, i mjere centralne
tendencije i mjere varijabiliteta, kao i određivanje položaja pojedinog rezultata u grupi.
Inferencijalna statistika vodi računa o tome da podaci koje dobivamo su redovito podaci na
uzorcima, a ne na populaciji.
Vrste t-testa
1
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
Postoji i t-test za proporcije, te t-test gdje se uspoređuje naš uzorak s nekom unaprijed zadanom
vrijednošću (normom), ali mi se ovdje nećemo time baviti jer se oni vrlo rijetko koriste.
Uzorci se razlikuju po veličini: do 30 se smatraju mali, a iznad toga su veliki, no, neki autori
smatraju da do 50 podataka (ispitanika, mjerenja) predstavlja mali uzorak.
Zavisni uzorci su uobičajeni primjer mjerenja prije – poslije kod provjeravanja djelovanja neke
terapije ili postupka, obrazovnog, odgojnog, medicinskog, terapeutskog, tehničkog itd.
Pojam "statistički značajne razlike" koji se pri tom upotrebljava ne znači nužno brojčano
veliku razliku, nego taj pojam u statistici ima točno određeno značenje:
Ako kažemo da je neka razlika statistički značajna, onda smo zapravo ustvrdili da razlika,
koja je nađena, bez obzira na veličinu razlike, nije slučajna, već da razlika vrlo vjerojatno
postoji i među populacijama. Naprotiv, ako tvrdimo da neka razlika nije statistički značajna, to
znači da razlika koju smo prilikom našeg mjerenja dobili, može biti i slučajna posljedica variranja
uzoraka, a da među populacijama, kojima ti uzorci pripadaju, možda i nema nikakve razlike.
2
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
Gleda se odnos razlike između dviju aritmetičkih sredina, i pogreške (ili standardne pogreške) te
razlike. Što je razlika više puta veća od svoje pogreške to joj „više vjerujemo“.
Opća formula za t-test glasi:
razlika
t
s tan dardna pogreška razlike
ZADACI
1) Zanima nas postoji li razlika u razvijenosti rječnika dječaka i djevojčica u nižim razredima
osnovne škole. Testom rječnika podvrgli smo 692 dječaka i dobili sljedeće rezultate:
Rezultati su sljedeći:
M = 80 bodova
SD = 10 bodova
M1 - M 2 80 - 83
t 5,45
SM1-M2 0.55
df (stupnjevi slobode) = (N1-1) + (N2 -1) = (692 -1) + (753 -1) = 1443
3
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
Kada smo odredili t i stupnjeve slobode, onda u tablici za t-test očitavamo granične
vrijednosti t. U krajnjem lijevom stupcu nalaze se stupnjevi slobode. Pronađemo stupnjeve slobode
koje smo dobili u zadatku, te u tom retku očitamo granične vrijednosti t uz P=0,05 i 0,01. U našem
slučaju promatramo redak na dnu tablice jer imamo izuzetno velike stupnjeve slobode. Granične
vrijednosti prepišemo uz dobiveni t kako bi lakše odredili značajnost.
Razlika između dviju aritmetičkih sredina mora određeni broj puta biti veća od svoje vlastite
pogreške da bi ju proglasili statistički značajnom. To ne znači nužno da je ta razlika numerički
velika, nego da je malo vjerojatno da smo takvu razliku dobili slučajno, te vjerujemo (uz određeni
rizik) da ona kao takva postoji i među populacijama.
Razina značajnosti od 5% znači zapravo šansu od 5% da smo pogriješili. Razina značajnosti
je u stvari nivo rizika. Ako ustanovimo da je neka razlika statistički značajna na nivou od 5% ili
manjem (dakle, ako je u našem slučaju t=1,96 ili više), napisat ćemo na kraju računa visinu
dobivenog izraza t, i iza toga izraz P<0,05 što prevedeno znači da je vjerojatnost da smo pogriješili
(P) manja od 5%.
Najvažnije je odrediti je li razlika statistički značajna ili nije, a drugi korak je određivanje razine
rizika. Kao što vidimo, samo kada je naš dobiveni t manji od oba granična, razlika NIJE statistički
značajna, a u svim drugim slučajevima jest značajna.
4
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
M1 - M 2 80 - 83
t 0.6369
SM1-M2 4.71
Dobiveni t = 0.64
df = 70 Ostajemo pri nul-hipotezi. Razlika između ovih dviju skupina
Granični t (5%) = 2.00
Granični t (1%) = 2.65 pacijenata u doživljaju boli nije statistički značajna.
P > 0.05
5
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
EKSPERIMENTALNA KONTROLNA
M1 = 6,3 dana M2 = 13,8
SD1 = 3,5 SD2 = 6,0
df=17+15=32
Dobiveni t = 4.558
df = 32 Razlika je statistički značajna uz rizik manji od 1%: pacijentima
Granični t (5%) = 2.04
Granični t (1%) = 2.75 koji su koristili novi lijek značajno brže su zacijelile ozljede.
P < 0.01
6
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
2) Skupina od 40 necijepljenih bolesnika imala je prosjek trajanja bolovanja od gripe 12,5 dana (SD
= 2), a 35 drugih bolesnika koji su bili cijepljeni, bolovali su u prosjeku 11,5 dana (SD = 1,5).
Provjerite je li razlika u trajanju oboljenja između skupine koja je cijepljena (eksperimentalna
skupina) i skupine koja nije cijepljena (kontrolna) statistički značajna?
Preporučujem da prije računanja ispišete dobivene vrijednosti ispod teksta kako bi ih lakše
uvrstili u formulu. U prethodnim zadacima vam je to uglavnom bilo priređeno, a u ovom zadatku bi
to izgledalo ovako:
N1= 40 N2 = 35
M1 = 12.5 M2 = 11,5
SD1 = 2 SD2 = 1,5
Na taj način smanjujete vjerojatnost pogreške da krivo uvrstite neku vrijednost u formulu.
12.5 11,5 1 1 1
t 2,42
1 1 1,784 0.025 0,0286 1,784 0,2315 0,413
SD
40 35
Dobiveni t = 2,42 Razlika je statistički značajna uz rizik manji od 5%: bolesnici koji
df = 73 su se cijepili, statistički značajno su kraće bili na bolovanju.
Granični t (5%) = 2.00
Granični t (1%) = 2.65
P < 0.05
Veliki zavisni uzorci su jedna skupina ljudi veća od 30 na kojoj je dva puta mjerena ista
pojava, najčešće iz razloga provjere efikasnosti nekog tretmana kojem su ispitanici bili podvrgnuti.
Formula za ovu vrstu t-testa glasi:
M1 - M 2
t SM1 - M 2 S2M1 S2M 2 - 2r1, 2SM1 SM 2
S M1 - M 2
df ili n’ = N-1
7
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
1) Skupina od 82 pretile osobe podvrgnuta je dijetnom tretmanu u trajanju od tri mjeseca. Njihova
prosječna težina prije dijete iznosila M = 108 kg, uz SD = 7,2 kg, a nakon dijete, aritmetička sredina
bila je M = 99,5 uz SD = 7,8 kg. Korelacija između prvog i drugog mjerenja iznosi r = 0.60.
Je li ova razlika statistički značajna, tj. je li dijeta pridonijela značajnom gubitku tjelesne težine
ispitivanih osoba?
SM1 - M 2 S2M1 S2M 2 - 2r1, 2SM1 SM 2 0.82 0.862 - 2 0,60 0,8 0,86
1,38 - 0,8256 0.74.
8.5
t= = 11.49
0.74
2) Izmjerena je jačina patelarnog refleksa kod 152 muškarca u uvjetima opuštenosti i napetosti.
Rezultati su izraženi u stupnjevima. U stanju napetosti, aritmetička sredina iznosi 25.12 uz SD 7.17;
a u stanju opuštenosti prosječni rezultat iznosi 21.73 uz SD 9.45. Povezanost između ta dva
mjerenja iznosi 0.72. Izračunajte postoji li statistički značajna razlika između ova dva mjerenja.
N = 152 r = 0.72
M1 = 25.12 M2 = 21.73
SD1 = 7.17 SD2 = 9.45
SD 7,17 SD 9,45
SM1 0.58 SM 2 0.77
N 12,33 N 12,33
8
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
SM1 - M 2 S2M1 S2M 2 - 2r1, 2SM1 SM 2 0.582 0.772 - 2 0.72 0.58 0.77
0.3364 0.5929 - 0.6431 0.2862 0.53
3.39
t= = 6.396
0.53
Dobiveni t = 6.4
df = N-1 = 151 Razlika je statistički značajna uz rizik manji od 1%. U stanju
Granični t (5%) = 1.98 napetosti patelarni refleks je statistički značajno jači nego u
Granični t (1%) = 2.61
P 0.01 stanju opuštenosti.
Iako postupak t-testa za male zavisne uzorke naoko izgleda sasvim drukčije od dosadašnjih
vrsta t-testova koje smo spominjali, ustvari se i ovdje radi tome da uspoređujemo razliku između
dviju aritmetičkih sredina s pogreškom te razlike. Idemo vidjeti na jednom primjeru kako izgleda taj
postupak, tzv. metoda diferencije.
1) Za 18 studenata imamo podatke o bodovima koje su postigli na testu znanja iz zdravstvene njege
onkoloških bolesnika na dva ispitna roka. Rezultati su sljedeći:
9
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
Stupac Diferencija dobili smo tako da smo od rezultata u drugom mjerenju oduzeli prvo
mjerenje. Svakako treba voditi računa o negativnom predznaku, te ga naznačiti svugdje gdje se
pojavio. Postupak se mogao provesti i suprotno, tako da smo od prvog stupca oduzeli drugi,
konačan rezultat bio bi isti, ali bi nam diferencije bile suprotnog predznaka. Potom sve vrijednosti u
stupcu Diferencija zbrojimo uvažavajući negativne predznake.
Suma diferencija je 36. Prosječna razlika ili diferencija je:
dif 36
M dif 2 d = Diferencija - X dif
N 18
Stupac d dobili smo tako što smo od svake pojedinačne diferencije oduzeli prosječnu diferenciju.
M dif 2 2
t 0,97
d 2
1308 2,07
NN 1 306
10
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
Dobiveni t = 0.97
df = N-1 = 17 Razlika nije statistički značajna. Studenti se značajno ne razlikuju
Granični t (5%) = 2.11
Granični t (1%) = 2.90 po bodovima ostvarenima na dva ispitna roka. Prihvaćamo nul-
P > 0.05 hipotezu.
Postoji još načina za izračun metoda diferencije, a o njima možete više saznati u literaturi navedenoj
na kraju teksta.
Ispitanici I II Diferencija d d2
mjerenje mjerenje I - II
1 18 5 13 4 16
2 20 13 7 -2 4
3 21 8 13 4 16
4 25 10 15 6 36
5 16 6 10 1 1
6 18 12 6 -3 9
7 14 6 8 -1 1
8 11 8 3 -6 36
9 15 7 8 -1 1
10 15 8 7 -2 4
= 90 d2=124
Prosječna razlika = 90/10 = 9
M dif 9 9 9
t 7.67
d 2
124 1.378 1.173
dif 90
M dif 9 NN - 1 90
N 10
Dobiveni t = 7.67
df = N-1 = 9 Razlika je statistički značajna uz rizik manji od 1%: sedimentacija
Granični t (5%) = 2.26
Granični t (1%) = 3.25 krvi značajno je manja nakon primjene antibiotika.
P < 0.01
11
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
Dobiveni t = 2.93 Razlika je statistički značajna uz rizik manji od 5%: nakon terapije
df = N-1 = 14 količina željeza u krvi značajno je veća nego prije terapije.
Granični t (5%) = 2.14
Granični t (1%) = 2.98
P < 0.05
12
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
dif 28 M dif 2 2 2 2
M dif 2 t 2.2497
N 14 d 2
144 144 0.7912 0.889
NN 1 14 13 182
Dobiveni t = 2.25 Razlika je statistički značajna uz rizik manji od 5%: trening "fizičko
df = N-1 = 13 vođenje" značajno više osamostaljuje korisnike, nego trening
Granični t (5%) = 2.16
Granični t (1%) = 3.01 imitacijom.
P < 0.05
13
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
PONOVIMO:
T-test služi za određivanje statističke značajnosti razlike između dvije aritmetičke sredine.
Osim vrijednosti aritmetičkih sredina, pri procjeni značajnosti važni su nam i varijabiliteti u
uzorcima, te veličine uzoraka.
Ako je razlika statistički značajna, onda tvrdimo da ona kao takva postoji i među
populacijama, tj. da tu razliku nismo dobili slučajno.
LITERATURA:
2. Howell, D.C. (1989) Fundamental Statistics for the Behavioral Sciences. Boston: PWS – Kent
Publishing Company.
NAPOMENE:
Svi podaci u ovim zadacima izmišljeni su za potrebe vježbi studenata i ne predstavljaju stvarno stanje u navedenim
populacijama.
U zadacima točni rezultati mogu biti i oni koji donekle odstupaju od navedenih rezultata, uslijed rada s drukčijim
brojem decimalnih vrijednosti.
14