You are on page 1of 14

Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

T-TEST

T-test je statistički postupak za testiranje značajnosti razlike između dva uzorka.


Uspoređujemo njihove aritmetičke sredine.
T-test nam u stvari služi za provjeru nul-hipoteze koju postavljamo prilikom formiranja
nacrta istraživanja. Ispitujemo da li postoji statistički značajna razlika između npr. muškaraca i žena
u preferenciji pojedine vrste fizikalne terapije, postoji li razlika u zadovoljstvu poslom ovisno o
tome radi li medicinska sestra na psihijatrijskom ili pedijatrijskom odjelu, postoji li značajan
napredak u motorici Parkinsonovih bolesnika nakon svakodnevne radne terapije, itd. Ako nam t-test
pokaže da razlika među aritmetičkim sredinama nije statistički značajna, onda smo potvrdili nul-
hipotezu, a ako je razlika statistički značajna, oborili smo nul-hipotezu.

T-test spada u inferencijalnu statistiku. Sve što smo do sada radili, spada u deskriptivnu
statistiku, čiji je zadatak da opiše neki skup brojeva. Tu spadaju i grafički prikazi, i mjere centralne
tendencije i mjere varijabiliteta, kao i određivanje položaja pojedinog rezultata u grupi.
Inferencijalna statistika vodi računa o tome da podaci koje dobivamo su redovito podaci na
uzorcima, a ne na populaciji.

Vrste t-testa

Jedan od najčešćih slučajeva pri eksperimentiranju i obradi podataka je uspoređivanje dviju


skupina ispitanika (za koje imamo aritmetičke sredine) i testiranje razlike među njima. Skupine koje
se uspoređuju razlikuju se po dva obilježja:
- veličina
- nezavisni odnosno zavisni uzorci

Tako razlikujemo sljedeće vrste t-testa:

t-test za velike nezavisne uzorke


t-test za male nezavisne uzorke
t-test za velike zavisne uzorke
t-test za male zavisne uzorke

1
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

Postoji i t-test za proporcije, te t-test gdje se uspoređuje naš uzorak s nekom unaprijed zadanom
vrijednošću (normom), ali mi se ovdje nećemo time baviti jer se oni vrlo rijetko koriste.

Uzorci se razlikuju po veličini: do 30 se smatraju mali, a iznad toga su veliki, no, neki autori
smatraju da do 50 podataka (ispitanika, mjerenja) predstavlja mali uzorak.

nezavisni uzorci  dvije različite skupine ljudi


zavisni uzorci  jedna skupina na kojoj je dva puta mjerena ista pojava

Tipični primjeri dvaju nezavisnih uzoraka su:


- dvije srednje škole (npr. medicinska i tehnička)
- mlađi i stariji ispitanici
- predškolska / školska djeca
- skupine s dvije različite vrste terapije
- vježbaju / ne vježbaju
- muškarci / žene
- SSS / VSS
- selo / grad
- za / protiv
- bolesni / zdravi
- pušači / nepušači…

Zavisni uzorci su uobičajeni primjer mjerenja prije – poslije kod provjeravanja djelovanja neke
terapije ili postupka, obrazovnog, odgojnog, medicinskog, terapeutskog, tehničkog itd.

Pojam "statistički značajne razlike" koji se pri tom upotrebljava ne znači nužno brojčano
veliku razliku, nego taj pojam u statistici ima točno određeno značenje:
Ako kažemo da je neka razlika statistički značajna, onda smo zapravo ustvrdili da razlika,
koja je nađena, bez obzira na veličinu razlike, nije slučajna, već da razlika vrlo vjerojatno
postoji i među populacijama. Naprotiv, ako tvrdimo da neka razlika nije statistički značajna, to
znači da razlika koju smo prilikom našeg mjerenja dobili, može biti i slučajna posljedica variranja
uzoraka, a da među populacijama, kojima ti uzorci pripadaju, možda i nema nikakve razlike.

2
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

Gleda se odnos razlike između dviju aritmetičkih sredina, i pogreške (ili standardne pogreške) te
razlike. Što je razlika više puta veća od svoje pogreške to joj „više vjerujemo“.
Opća formula za t-test glasi:
razlika
t
s tan dardna  pogreška  razlike

ZADACI

RAZLIKA IZMEĐU ARITMETIČKIH SREDINA


VELIKIH NEZAVISNIH UZORAKA

1) Zanima nas postoji li razlika u razvijenosti rječnika dječaka i djevojčica u nižim razredima
osnovne škole. Testom rječnika podvrgli smo 692 dječaka i dobili sljedeće rezultate:
Rezultati su sljedeći:
M = 80 bodova
SD = 10 bodova

Za 753 ispitane djevojčice rezultati su:


M = 83 boda
SD = 11 bodova.

Je li razlika između ovih dviju skupina statistički značajna?


 Formuliraj nul-hipotezu (Ho).
 Provjeri treba li Ho zadržati ili odbaciti tj. da li postoji statistički značajna razlika između ovih
dviju skupina studenata u uspjehu na testu znanja iz fizike.

Nul-hipoteza: dječaci i djevojčice ne razlikuju se značajno u razvijenosti rječnika.

SD12 SD 22 102 112


SM1-M 2  S2M1  S2M 2      0.1445  0.1607  0.55
N1 N2 692 753

M1 - M 2 80 - 83
t   5,45
SM1-M2 0.55

df (stupnjevi slobode) = (N1-1) + (N2 -1) = (692 -1) + (753 -1) = 1443

3
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

Kada smo odredili t i stupnjeve slobode, onda u tablici za t-test očitavamo granične
vrijednosti t. U krajnjem lijevom stupcu nalaze se stupnjevi slobode. Pronađemo stupnjeve slobode
koje smo dobili u zadatku, te u tom retku očitamo granične vrijednosti t uz P=0,05 i 0,01. U našem
slučaju promatramo redak na dnu tablice jer imamo izuzetno velike stupnjeve slobode. Granične
vrijednosti prepišemo uz dobiveni t kako bi lakše odredili značajnost.
Razlika između dviju aritmetičkih sredina mora određeni broj puta biti veća od svoje vlastite
pogreške da bi ju proglasili statistički značajnom. To ne znači nužno da je ta razlika numerički
velika, nego da je malo vjerojatno da smo takvu razliku dobili slučajno, te vjerujemo (uz određeni
rizik) da ona kao takva postoji i među populacijama.
Razina značajnosti od 5% znači zapravo šansu od 5% da smo pogriješili. Razina značajnosti
je u stvari nivo rizika. Ako ustanovimo da je neka razlika statistički značajna na nivou od 5% ili
manjem (dakle, ako je u našem slučaju t=1,96 ili više), napisat ćemo na kraju računa visinu
dobivenog izraza t, i iza toga izraz P<0,05 što prevedeno znači da je vjerojatnost da smo pogriješili
(P) manja od 5%.

Razina značajnosti od 5% samo je najčešća razina, koja se u većini slučajeva upotrebljava, a


uobičajeno je promatrati i stroži kriterij od 1%. S obzirom da studenti u početku ponekad imaju
poteškoća oko određivanja značajnosti, evo pravila koja će vam pomoći u tome:

dobiveni t < granični t (5%) < granični t (1%)


P>0.05 Razlika nije statistički značajna.
dobiveni t = granični t (5%)
P=0.05 Razlika je statistički značajna.
granični t (5%) < dobiveni t < granični t (1%)
P <0.05 Razlika je statistički značajna.
dobiveni t = granični t (1%)
P=0.01 Razlika je statistički značajna.
granični t (5%) < granični t (1%) < dobiveni t
P <0.01 Razlika je statistički značajna.

Najvažnije je odrediti je li razlika statistički značajna ili nije, a drugi korak je određivanje razine
rizika. Kao što vidimo, samo kada je naš dobiveni t manji od oba granična, razlika NIJE statistički
značajna, a u svim drugim slučajevima jest značajna.

4
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

Dobiveni t = - 5,45 Odbacujemo Ho! Postoji značajna razlika: djevojčice u nižim


df = 1443 razredima osnovne škole imaju statistički značajno razvijeniji
Granični t (5%) = 1.96
Granični t (1%) = 2.58 rječnik nego dječaci.
P  0.01

2) Mjerenje upitnikom boli 36 pacijenata s neurološkog odjela i 36 pacijenata s kirurškog odjela


dalo je ove rezultate: kod neuroloških M1 = 80, a SD 20, a kod kirurških pacijenata M2 = 83, a SD
20. Je li razlika u uspjehu između te dvije skupine statistički značajna?

 Formuliraj nul-hipotezu (Ho).


 Provjeri treba li Ho zadržati ili odbaciti tj. da li postoji statistički značajna razlika između ovih
dviju skupina pacijenata u stupnju doživljaja boli?

Nul-hipoteza: pacijenti na neurološkom odjelu i na kirurgiji ne razlikuju se značajno u doživljaju


boli.

SD12 SD 22 400 400


SM1 M2      22.22  4.71
N1 N2 36 36

M1 - M 2 80 - 83
t   0.6369
SM1-M2 4.71

df = (N1-1) + (N2 -1) = 35+35=70.

Dobiveni t = 0.64
df = 70 Ostajemo pri nul-hipotezi. Razlika između ovih dviju skupina
Granični t (5%) = 2.00
Granični t (1%) = 2.65 pacijenata u doživljaju boli nije statistički značajna.
P > 0.05

U zadatku 1 i 2 jednaka je razlika između aritmetičkih sredina (3 boda), no u prvom slučaju, ta


razlika je statistički značajna, a u drugom nije, jer je standardna pogreška razlike između dviju
aritmetičkih sredina puno veća u drugom slučaju (manji uzorci i veći varijabiliteti) nego u prvom.

5
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

RAZLIKA IZMEĐU ARITMETIČKIH SREDINA


MALIH NEZAVISNIH UZORAKA

1) Na skupinu od 18 bolesnika primijenjena je nova antibiotska krema kod infekcije ozljede.


Kod druge skupine od 16 bolesnika nije primijenjen novi lijek nego neko drugo klasično sredstvo.
Dobiveni su sljedeći rezultati o prosječnom trajanju zacjeljivanja rane:

EKSPERIMENTALNA KONTROLNA
M1 = 6,3 dana M2 = 13,8
SD1 = 3,5 SD2 = 6,0

Da se podsjetimo, eksperimentalna skupina je ona na kojoj primjenjujemo neki novi tretman, a


kontrolna skupina ima dosadašnji uobičajeni tretman. U najstrožem smislu, kontrolna skupina je
skupina bez tretmana, ali kako nije etički ostaviti pacijente bez ikakvog liječenja, uspoređujemo
dosadašnji lijek s novim da vidimo razlikuju li se značajno u djelotvornosti.
Je li razlika između ovih dviju skupina statistički značajna?

SD - zajednička standardna devijacija

SD 12 N 1  1  SD 22 N 2  1 3.5 2 17  6 2 15 208.25  540


SD     23.39  4.84
N 1  1  N 2  1 17  15 32

M1  M 2 6.3  13.8  7.5


t    4.558
1 1 1 1 4.84  0.34
SD  4.84 
N1 N 2 18 16

df=17+15=32

Dobiveni t = 4.558
df = 32 Razlika je statistički značajna uz rizik manji od 1%: pacijentima
Granični t (5%) = 2.04
Granični t (1%) = 2.75 koji su koristili novi lijek značajno brže su zacijelile ozljede.
P < 0.01

6
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

2) Skupina od 40 necijepljenih bolesnika imala je prosjek trajanja bolovanja od gripe 12,5 dana (SD
= 2), a 35 drugih bolesnika koji su bili cijepljeni, bolovali su u prosjeku 11,5 dana (SD = 1,5).
Provjerite je li razlika u trajanju oboljenja između skupine koja je cijepljena (eksperimentalna
skupina) i skupine koja nije cijepljena (kontrolna) statistički značajna?

Preporučujem da prije računanja ispišete dobivene vrijednosti ispod teksta kako bi ih lakše
uvrstili u formulu. U prethodnim zadacima vam je to uglavnom bilo priređeno, a u ovom zadatku bi
to izgledalo ovako:

N1= 40 N2 = 35
M1 = 12.5 M2 = 11,5
SD1 = 2 SD2 = 1,5

Na taj način smanjujete vjerojatnost pogreške da krivo uvrstite neku vrijednost u formulu.

2 2  39  1,5 2  34 156  76,5


SD    3,185  1,784
39  34 73

12.5  11,5 1 1 1
t     2,42
1 1 1,784 0.025  0,0286 1,784  0,2315 0,413
SD 
40 35

Dobiveni t = 2,42 Razlika je statistički značajna uz rizik manji od 5%: bolesnici koji
df = 73 su se cijepili, statistički značajno su kraće bili na bolovanju.
Granični t (5%) = 2.00
Granični t (1%) = 2.65
P < 0.05

RAZLIKA IZMEĐU ARITMETIČKIH SREDINA


VELIKIH ZAVISNIH UZORAKA

Veliki zavisni uzorci su jedna skupina ljudi veća od 30 na kojoj je dva puta mjerena ista
pojava, najčešće iz razloga provjere efikasnosti nekog tretmana kojem su ispitanici bili podvrgnuti.
Formula za ovu vrstu t-testa glasi:

M1 - M 2
t SM1 - M 2  S2M1  S2M 2 - 2r1, 2SM1 SM 2
S M1 - M 2

df ili n’ = N-1
7
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

1) Skupina od 82 pretile osobe podvrgnuta je dijetnom tretmanu u trajanju od tri mjeseca. Njihova
prosječna težina prije dijete iznosila M = 108 kg, uz SD = 7,2 kg, a nakon dijete, aritmetička sredina
bila je M = 99,5 uz SD = 7,8 kg. Korelacija između prvog i drugog mjerenja iznosi r = 0.60.
Je li ova razlika statistički značajna, tj. je li dijeta pridonijela značajnom gubitku tjelesne težine
ispitivanih osoba?

SD 7,2 7,2 7,8 7,8


SM1     0.795 ≈ 0,8 SM 2    0.86
N 82 9,055 82 9,055

SM1 - M 2  S2M1  S2M 2 - 2r1, 2SM1 SM 2  0.82  0.862 - 2  0,60  0,8  0,86 
 1,38 - 0,8256  0.74.
8.5
t= = 11.49
0.74

Dobiveni t = 11,49 Razlika je statistički značajna uz rizik manji od 1%. To znači da je


df = N-1 = 81 ova skupina ispitanika ima značajno manju kilažu nakon dijete,
Granični t (5%) = 1,99
Granični t (1%) = 2,64 nego prije dijete.
P  0.01

2) Izmjerena je jačina patelarnog refleksa kod 152 muškarca u uvjetima opuštenosti i napetosti.
Rezultati su izraženi u stupnjevima. U stanju napetosti, aritmetička sredina iznosi 25.12 uz SD 7.17;
a u stanju opuštenosti prosječni rezultat iznosi 21.73 uz SD 9.45. Povezanost između ta dva
mjerenja iznosi 0.72. Izračunajte postoji li statistički značajna razlika između ova dva mjerenja.

N = 152 r = 0.72
M1 = 25.12 M2 = 21.73
SD1 = 7.17 SD2 = 9.45

SD 7,17 SD 9,45
SM1    0.58 SM 2    0.77
N 12,33 N 12,33

8
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

SM1 - M 2  S2M1  S2M 2 - 2r1, 2SM1 SM 2  0.582  0.772 - 2  0.72  0.58  0.77 
 0.3364  0.5929 - 0.6431  0.2862  0.53

3.39
t= = 6.396
0.53

Dobiveni t = 6.4
df = N-1 = 151 Razlika je statistički značajna uz rizik manji od 1%. U stanju
Granični t (5%) = 1.98 napetosti patelarni refleks je statistički značajno jači nego u
Granični t (1%) = 2.61
P  0.01 stanju opuštenosti.

RAZLIKA IZMEĐU ARITMETIČKIH SREDINA


MALIH ZAVISNIH UZORAKA
"METODA DIFERENCIJE"

Iako postupak t-testa za male zavisne uzorke naoko izgleda sasvim drukčije od dosadašnjih
vrsta t-testova koje smo spominjali, ustvari se i ovdje radi tome da uspoređujemo razliku između
dviju aritmetičkih sredina s pogreškom te razlike. Idemo vidjeti na jednom primjeru kako izgleda taj
postupak, tzv. metoda diferencije.

1) Za 18 studenata imamo podatke o bodovima koje su postigli na testu znanja iz zdravstvene njege
onkoloških bolesnika na dva ispitna roka. Rezultati su sljedeći:

9
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

Studenti I rok II rok Diferencija d d2


II-I
1 99 80 - 19 - 21 441
2 82 78 - 4 - 6 36
3 71 74 + 3 + 1 1
4 88 89 + 1 - 1 1
5 60 61 + 1 - 1 1
6 82 98 +16 +14 196
7 78 82 + 4 + 2 4
8 63 68 + 5 + 3 9
9 66 68 + 2 0 0
10 82 86 + 4 + 2 4
11 81 98 +17 +15 225
12 108 102 - 6 - 8 64
13 80 86 + 6 + 4 16
14 86 99 +13 +11 121
15 74 72 - 2 - 4 16
16 88 77 - 11 - 13 169
17 76 80 +4 +2 4
18 70 72 +2 0 0
 = 36 d =1308
2

Stupac Diferencija dobili smo tako da smo od rezultata u drugom mjerenju oduzeli prvo
mjerenje. Svakako treba voditi računa o negativnom predznaku, te ga naznačiti svugdje gdje se
pojavio. Postupak se mogao provesti i suprotno, tako da smo od prvog stupca oduzeli drugi,
konačan rezultat bio bi isti, ali bi nam diferencije bile suprotnog predznaka. Potom sve vrijednosti u
stupcu Diferencija zbrojimo uvažavajući negativne predznake.
Suma diferencija je 36. Prosječna razlika ili diferencija je:

dif 36
M dif   2 d = Diferencija - X dif
N 18

Stupac d dobili smo tako što smo od svake pojedinačne diferencije oduzeli prosječnu diferenciju.

M dif 2 2
t    0,97
d 2
1308 2,07
NN 1 306

t = razlika / standardna pogreška te razlike = 2,0 /2,07 = 0,97.

10
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

Dobiveni t = 0.97
df = N-1 = 17 Razlika nije statistički značajna. Studenti se značajno ne razlikuju
Granični t (5%) = 2.11
Granični t (1%) = 2.90 po bodovima ostvarenima na dva ispitna roka. Prihvaćamo nul-
P > 0.05 hipotezu.

Postoji još načina za izračun metoda diferencije, a o njima možete više saznati u literaturi navedenoj
na kraju teksta.

2) Na 10 ispitanika izvršeno je mjerenje sedimentacije krvi prije i poslije primjene antibiotika.


Rezultati su sljedeći:

Ispitanici I II Diferencija d d2
mjerenje mjerenje I - II
1 18 5 13 4 16
2 20 13 7 -2 4
3 21 8 13 4 16
4 25 10 15 6 36
5 16 6 10 1 1
6 18 12 6 -3 9
7 14 6 8 -1 1
8 11 8 3 -6 36
9 15 7 8 -1 1
10 15 8 7 -2 4
 = 90 d2=124
Prosječna razlika = 90/10 = 9
M dif 9 9 9
t     7.67
d 2
124 1.378 1.173
dif 90
M dif   9 NN - 1 90
N 10

Dobiveni t = 7.67
df = N-1 = 9 Razlika je statistički značajna uz rizik manji od 1%: sedimentacija
Granični t (5%) = 2.26
Granični t (1%) = 3.25 krvi značajno je manja nakon primjene antibiotika.
P < 0.01

11
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

3) Na 15 ispitanika izvršeno je mjerenje željeza u krvi prije i poslije terapije:

Ispitanici Prije Poslije Diferencija d d2


terapije terapije
1 7 13 6 3,8 14,44
2 4 5 1 -1,2 1,44
3 9 11 2 -0,2 0,04
4 11 13 2 -0,2 0,04
5 8 12 4 1,8 3,24
6 12 17 5 2,8 7,84
7 27 26 -1 -3,2 10,24
8 3 3 0 -2,2 4,84
9 3 1 -2 -4,2 17,64
10 4 10 6 3,8 14,44
11 8 11 3 0,8 0,64
12 6 10 4 1,8 3,24
13 11 10 -1 -3,2 10,24
14 10 8 -2 -4,2 17,64
15 9 15 6 3,8 14,44
 = 33 d2= 120,4

M dif 2 .2 2 .2 2.2 2.2


dif 33 t      2.93
M dif    2.2 d 2
120.4 120.4 0.57 0.75
N 15
NN - 1 15 - 14 210

Dobiveni t = 2.93 Razlika je statistički značajna uz rizik manji od 5%: nakon terapije
df = N-1 = 14 količina željeza u krvi značajno je veća nego prije terapije.
Granični t (5%) = 2.14
Granični t (1%) = 2.98
P < 0.05

12
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

4) Kod 14 subjekata s poteškoćama u razvoju provodila su se 2 treninga, svaki u trajanju od 6


mjeseci i nakon svakog treninga procjenjivala se njihova samostalnost, pri čemu veći rezultat
ukazuje na slabiji učinak. Provjerite postoji li statistički značajna razlika u učinku ova dva treninga.

Ispitanici Imitacija Fizičko Diferencija d d2


vođenje
1 14 10 4 2 4
2 11 13 -2 -4 16
3 19 15 4 2 4
4 8 5 3 1 1
5 4 3 1 -1 1
6 9 6 3 1 1
7 12 7 5 3 9
8 5 9 -4 -6 36
9 14 16 -2 -4 16
10 17 10 7 5 25
11 18 13 5 3 9
12 0 1 -1 -3 9
13 2 2 0 -2 4
14 8 3 5 3 9
 = 28 d2= 144

dif 28 M dif 2 2 2 2
M dif   2 t      2.2497
N 14 d 2
144 144 0.7912 0.889
NN  1 14  13 182

Dobiveni t = 2.25 Razlika je statistički značajna uz rizik manji od 5%: trening "fizičko
df = N-1 = 13 vođenje" značajno više osamostaljuje korisnike, nego trening
Granični t (5%) = 2.16
Granični t (1%) = 3.01 imitacijom.
P < 0.05

13
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

PONOVIMO:

 T-test služi za određivanje statističke značajnosti razlike između dvije aritmetičke sredine.

 Osim vrijednosti aritmetičkih sredina, pri procjeni značajnosti važni su nam i varijabiliteti u
uzorcima, te veličine uzoraka.

 Vrste t-testa postoje s obzirom na veličinu uzorka i na to uspoređujemo li dvije različite


skupine (nezavisni), ili uspoređujemo dva mjerenja na istoj skupini (zavisni).

 Ako je razlika statistički značajna, onda tvrdimo da ona kao takva postoji i među
populacijama, tj. da tu razliku nismo dobili slučajno.

 Razlika mora biti minimalno jednaka graničnoj vrijednosti uz 5% rizika da bi ju proglasili


značajnom.

LITERATURA:

1. Dyer, C. (1995) Beginning research in psychology. Oxford: Blackwell Publishers Inc.

2. Howell, D.C. (1989) Fundamental Statistics for the Behavioral Sciences. Boston: PWS – Kent
Publishing Company.

3. Kolesarić, V. i Petz, B. (1999) Statistički rječnik. Jastrebarsko: Naklada Slap.

4. Petz, B. (1997) Osnovne statističke metode za nematematičare. Jastrebarsko: Naklada Slap.

NAPOMENE:
Svi podaci u ovim zadacima izmišljeni su za potrebe vježbi studenata i ne predstavljaju stvarno stanje u navedenim
populacijama.
U zadacima točni rezultati mogu biti i oni koji donekle odstupaju od navedenih rezultata, uslijed rada s drukčijim
brojem decimalnih vrijednosti.

Zadnja promjena 25.10.2017.

14

You might also like