You are on page 1of 41

Usporedba dviju

aritmetičkih sredina:
t-test
Psihologijska statistika I
13.12.2022.
Prof. dr. sc. Irena Burić
Predavanja
Što je t-test?

• t–odnos se općenito odnosi na razlomak kod kojeg se u


brojniku nalazi neka vrijednost, a u nazivniku standardna
pogreška te vrijednosti
• t–odnos je najpoznatiji kod testiranja značajnosti razlika između
dvije aritmetičke sredine i u tom slučaju on pokazuje KOLIKO
JE PUTA NEKA RAZLIKA VEĆA OD SVOJE POGREŠKE


t= Δ - razlika između dvije aritmetičke sredine
 σΔ- standardna pogreška razlike
Što je t-test?
• Pojmovi važni za uspješno korištenje i razumijevanje t-testa:
• t-distribucija
• Stupnjevi slobode
• Razina rizika
• Tablica t-vrijednosti
Distribucija t-vrijednosti
• zamislimo sljedeći pokus:
• iz iste populacije izvlačimo neizmjerno velik broj parova velikih uzoraka
• izračunamo aritmetičke sredine uzoraka
• odredimo razlike između aritmetičkih sredina pojedinih parova uzoraka – d
• nacrtamo distribuciju tih razlika → aritmetička sredina te distribucije
jednaka je PRAVOJ RAZLICI (koliko ona iznosi?), a standardna devijacija
te distribucije jednaka je STANDARDNOJ POGREŠCI RAZLIKE među
aritmetičkim sredinama
Distribucija t-vrijednosti
• zamislimo dalje da smo za svaku pojedinu razliku između dvije
aritmetičke sredine odredili i pripadajuću t-vrijednost tako što smo
izračunali omjer te razlike i pripadajuće standardne pogreške
razlike
• naposljetku, nacrtali smo i distribuciju tako dobivenih t-
vrijednosti

• Koliko bi iznosila aritmetička sredina ove distribucije?


• Kako bi izgledala distribucija t-vrijednosti?
Distribucija t-vrijednosti

→ako su uzorci dovoljno veliki, razlike između aritmetičkih sredina i


pripadajuće t-vrijednosti distribuirale bi se po NORMALNOJ
RASPODJELI s aritmetičkom sredinom koja iznosi 0 i kojoj standardna
devijacija iznosi 1 t (i približno odgovara izračunatoj standardnoj
pogrešci razlike): 0±3t

→t predstavlja jednu vrstu z–vrijednosti: kao i z, t predstavlja


odstupanje rezultata od aritmetičke sredine izraženo u terminima
standardne devijacije → t=1 znači da je neka nađena razlika među
aritmetičkim sredinama na jednoj standardnoj devijaciji raspršenja svih
slučajnih razlika koje se mogu dogoditi (pritom prava razlika iznosi 0)
Distribucija t-vrijednosti
• ako isti pokus ponovimo na malim uzorcima, razlike između
aritmetičkih sredina oko prave razlike u populaciji također će se
distribuirati po NORMALNOJ RASPODJELI
• ali distribucija njihovih pripadajućih t-vrijednosti neće biti
normalna, već će se t-vrijednosti distribuirati po tzv. t-
RASPODJELI
Distribucija t-vrijednosti
• oblik t-raspodjele ovisi o veličini uzorka tj. o STUPNJEVIMA
SLOBODE
• kao i normalna raspodjela, t-distribucija je zvonolika i
simetrična, ali je šira od normalne raspodjele tim više što je
veličina uzorka (tj. stupnjevi slobode) manja
• u normalnoj distribuciji 99.74% svih rezultata obuhvaćeno je
rasponom između M±3SD
• kod t-distribucije taj je postotak to manji što je manji uzorak:
t-distribucija je šira od normalne distribucije tim više što je
uzorak manji
t–distribucija
Stupnjevi slobode
• engl. “degrees of freedom” – df
• broj događaja koji pri izračunavanju neke statističke vrijednosti
mogu slobodno (nezavisno) varirati
• npr. ako zbrajanjem 4 broja moramo dobiti 10, tada prva tri
broja biramo kako želimo, ali posljednji mora biti jednak razlici
između zbroja prva tri broja i broja 10
Stupnjevi slobode
• njihov broj ovisi o tome što je sve zajedničko u dvije skupine
rezultata koje uspoređujemo – npr. ako testiramo je li neka
distribucija “normalna”, onda opažene distribucije i teoretske
(očekivane) distribucije imaju isti N, istu M i istu SD, pa zato
stupnjevi slobode iznose broj kategorija – 3
• ako provjeramo pripadaju li dva uzorka istoj ili različitim
populacijama, tada oba uzorka, prema nul-hipotezi, imaju istu
M, pa stupnjevi slobode iznose: (broj ispitanika prvog uzorka
minus 1) + (broj ispitanika drugog uzorka minus 1)
t - distribucija
• što t-distribucija nije, a što jest?
1. t-raspodjela nije distribucija rezultata na malom uzorku
2. t-raspodjela nije distribucija aritmetičkih sredina ili distribucija razlika
među aritmetičkim sredinama malih uzoraka oko prave aritmetičke
sredine ili prave razlike jer je ta distribucija normalna
3. t-distribucija jest distribucija t-odnosa kakva se dobiva kada se
računski određuje standardna pogreška aritmetičke sredine,
odnosno standardna pogreška razlike između dvije aritmetičke
sredine, a pri tome se u računu koristi standardna devijacija
uzorka (koja je to lošija procjena σ populacije što je N manji).
t-distribucija
• s obzirom da mi gotovo nikad ne raspolažemo s vrijednošću standardne
devijacije populacije, prilikom izračunavanja standardne pogreške razlike
koristimo se STANDARDNOM DEVIJACIJOM UZORKA
• kod velikih uzoraka, dobivamo uglavnom točnu procjenu standardne
devijacije razlika mnoštva uzoraka oko prave razlike među populacijama tj.
standardne pogreške razlike
• stoga, činjenica što u računu t-testa ne koristimo pravu standardnu
devijaciju populacije, ne uzrokuje odstupanje od t-distribucije od normalne
distribucije
• ali, kod MALIH UZORAKA, razlike između aritmetičkih sredina
(neizmjerno) velikog broja uzoraka distribuiraju se normalno oko prave
razlike, no izračunati t-odnosi ne distribuiraju se normalno, već po t-
distribuciji
Razina rizika ili nivo značajnosti – p
• p je vjerojatnost da ćemo u našem mjerenju dobiti t-vrijednost koja
će u apsolutnom smislu biti jednaka ili veća od određene granične t-
vrijednosti
• kada su UZORCI VELIKI, vjerojatnost da ćemo po slučaju dobiti t
koji će u apsolutnom smislu biti veći od 1.96 iznosi 5%; vjerojatnost
da ćemo po slučaju dobiti t koji će u apsolutnom smislu biti veći od
2.58 iznosi 1%
→ u distribuciji t-vrijednosti, kada su UZORCI VELIKI, apsolutna
t-vrijednost koja je jednaka ili veća od 1.96 može se pojaviti u
manje od 5% slučaja, a apsolutna t-vrijednosti koja je jednaka ili
veća od 2.58 može se pojaviti u manje od 1% slučajeva
Razina rizika ili nivo značajnosti – p

• 5% i 1% predstavljaju konvencionalne razine rizika ili nivoe


značajnosti
• najčešće se zapisuju kao p<0.05 i p<0.01
• obrnuto su proporcionalne STUPNJU SIGURNOSTI → ako je
razina rizika manja od 5%, stupanj sigurnosti je veći od 95%;
ako je razina rizika manja od 1%, stupanj sigurnosti je veći od
99%
Razina rizika
• uvriježeni kriteriji:
• RAZINA RIZIKA MANJA OD 5%: razlika mora biti barem 1.96 puta
veća od svoje pogreške (t>1.96) da bi se proglasila statistički
značajnom → svaka razlika koja se nalazi izvan intervala 0±1.96·σM1-M2
statistički je značajna
• RAZINA RIZIKA MANJA OD 1%: razlika mora biti barem 2.58 puta
veća od svoje pogreške (t>2.58) da bi se proglasila statistički
značajnom → svaka razlika koja se nalazi izvan intervala 0±2.58·σM1-M2
statistički je značajna

• Napomena: ovo vrijedi samo kad su uzorci veliki!!!


Tablica t-vrijednosti
• sadrže GRANIČNE t-VRIJEDNOSTI za određenu razinu rizika
i određene stupnjeve slobode:
• t-vrijednost koju smo mi dobili u svom istraživanju mora biti jednaka ili
veća od one u tablici da bismo taj parametar (npr. razliku između dvije
M) mogli proglasiti statistički značajnim uz odabranu razinu rizika
(najčešće je to razina rizika od 1% ili 5%)
Tablica t-vrijednosti
• što je uzorak manji, imamo manje stupnjeva slobode, a
granična t-vrijednost je veća pa je i kriterij za proglašavanje
neke razlike statistički značajnom stroži
• primjer: kad imamo 10 stupnjeva slobode, granična t-vrijednost
uz nivo rizika p<0.05 (ili <5%) iznosi 2.23 (što je veće od
granične vrijednosti 1.96 koja se pronalazi kod velikih uzoraka)
→ razlika između dvije aritmetičke sredine mora biti barem 2.23
puta veća od svoje pogreške da bi je mogli smatrati statistički
značajnom uz p<0.05
Kad su uzorci veliki…
• kada dobijemo t>1.96, to znači da je razlika između dvije
aritmetičke sredine statistički značajna uz rizik od pogrešnog
zaključka manji od 5% (u 5 od 100 slučajeva, što je malo
vjerojatno, ovako velika razlika može se pojaviti slučajno) → dakle,
odabravši ovaj kriterij, odlučili smo se za RAZINU ZNAČAJNOSTI ili
NIVO RIZIKA manji od 5% (sa sigurnošću većom od 95% možemo
tvrditi da dobivena razlika nije rezultat djelovanja slučajnih faktora)
• kada nam je važno uzeti stroži kriterij, razliku između dvije
aritmetičke sredine uz t>2.58 proglašavamo statistički značajnom uz
rizik pogrešnog zaključka manji od 1% (u 1 od 100 slučajeva, što je
malo vjerojatno, ovako velika razlika može se pojaviti slučajno) →
odabrali smo razinu značajnosti ili nivo rizika manji od 1% (sa
sigurnošću većom od 99% možemo tvrditi da razlika nije slučajna)
Formule za računanje t-testa
• t-test na jednom uzroku
• t-test za velike nezavisne uzorke
• t-test za male nezavisne uzorke
• t-test za velike zavisne uzorke
• t-test za male zavisne uzorke
t-test na jednom uzorku
• koristi se za provjeravanje razlika između aritmetičke sredine
uzorka (M) i prave aritmetičke sredine (µ), pri čemu nam je
poznata vrijednost µ, ali ne i σ populacije
• računa se po formuli:

M − M-aritmetička sredina
t= µ-aritmetička sredina populacije
M σM-standardna pogreška
aritmetičke sredine

df=N-1
t-test: veliki nezavisni uzorci
• Velikim uzorcima smatraju se uzorci koji imaju N > 30 ili N > 50,
ovisno i izvoru.
• Što su veliki uzorci prema tablicama t-vrijednosti?
Standardna pogreška razlike između dvije
aritmetičke sredine – VELIKI NEZAVISNI
UZORCI

 M1 − M 2 = ( M1
2
+ M 2 2
)
• σM1-M2 - standardna pogreška razlike
• σM1 – standardna pogreška aritmetičke sredine prvog uzorka
• σM2 – standardna pogreška aritmetičke sredine drugog uzorka
t-test: veliki nezavisni uzorci
• Koristi se za provjeravanje statističke značajnosti razlike između
dvije aritmetičke sredine izračunate na temelju dvije nezavisne
skupine ispitanika

M1 − M 2
t= df=(N1-1)+(N2-1)
 M1 +  M 2
2 2
t-test: veliki nezavisni uzorci
• statistička značajnost t - testa:
• t<1.96, p>0.05 (razlika nije statistički značajna; rizik od pogrešnog
zaključka veći je od 5%; ovako velika razlika po slučaju se dobiva u više
od 5% slučajeva što je neprihvatljivo visok rizik)
• 1.96<t<2.58, p<0.05, p>0.01 (razlika je statistički značajna uz rizik
pogešnog zaključka manji od 5%, ali veći od 1%; ovako velika razlika se
dobiva u manje od 5% slučajeva, ali više od 1% slučajeva; možemo biti
sigurni više od 95%, ali manje od 99% da razlika postoji i u populaciji)
• t>2.58, p<0.01 (razlika je statistički značajna uz rizik pogrešnog zaključka
manji od 1%; ovako velika razlika se po slučaju dobiva u manje od 1%
slučajeva; možemo biti sigurni više od 99% da razlika postoji i u
populaciji)

• granične vrijednosti t=1.96 i t=2.58 vrijede samo ako su uzorci vrlo veliki
(npr. N=500) – što je N manji, granična vrijednost t mora biti veća da bi se
neka razlika proglasila statistički značajnom (pogledati u t-tablicu!)
t-test: veliki nezavisni uzorci
• ako je razlika između dviju aritmetičkih sredina uzoraka
statistički značajna, to znači da se aritmetičke sredine dviju
populacija međusobno razlikuju
• to ne znači da se svi individualni rezultati jedne populacije
razlikuju od svih individualnih rezultata druge populacije – može
biti “prekrivanja” distribucija
• pitanje: koliko velika treba biti razlika u aritmetičkim sredinama
(izražena u standardnim devijacijama) da se distribucije gotovo
uopće ne preklapaju?
Vježbe
Vježba 1
• Na nekom sveučilištu studenti u prosjeku uče 17 h tjedno.
Jedan student je primijetio da njegovi kolege iz studentskog
doma uče više od 17 h tjedno. Na skupini od 16 studenata koji
žive u domu utvrdio je da u prosjeku uče 21 h tjedno (uz
SD=6.80). Razlikuju li se studenti koji žive u domu od studenata
sveučilišta općenito u broju sati koje tjedno provedu u učenju?
• nul-hipoteza: nema razlike u broju sati učenja između studenata
koji žive u domu i ostalih studenata na sveučilištu
Vježba 1
1. izračunati standardnu pogrešku aritmetičke sredine: σM
2. izračunati t-test prema zadanoj formuli
3. odrediti stupnjeve slobode: df=N-1
4. usporediti dobivenu t vrijednost s onom graničnom za
stupnjeve slobode kojima raspolažemo i za razine rizika od
1% i 5%.
5. zapisati izraz, interpretirati
Vježba 1
1. izračunati standardnu pogrešku aritmetičke sredine: σM=1.70
2. izračunati t-test: t = M −  = 21 − 17 = 2.35
M 1.70
3. odrediti stupnjeve slobode: df=N-1=16-1=15 → df=15
• dobivena t-vrijednost iznosi 2.35; za N=16 imamo 15 stupnjeva
slobode; uz razinu rizika od 1% i uz 15 stupnjeva slobode, granična
vrijednost t iznosi 2.947, a uz razinu rizika od 5% granična t-
vrijednost iznosi 2.132
• naša t-vrijednost je VEĆA OD GRANIČNE vrijednosti uz razinu rizika
od 5%, ali ne i uz graničnu vrijednost t uz rizik od 1% → to
zapisujemo ovako:
t=2.35, df=15, p<0.05, p>0.01
Vježba 1
• Interpretacija: „Utvrđena je statistički značajna razlika u broju
sati provedenih u učenju tjedno između studenata koji žive u
studentskom domu i ostalih studenata na sveučilištu uz razinu
rizika od pogrešnog zaključka manju od 5%, ali ne i uz razinu
rizika manju od 1%. Studenti koji žive u domu uče veći broj
sati tjedno.”
• praktično, to znači da sa sigurnošću većom od 95% možemo
tvrditi da ova razlika postoji i u populaciji, ali to isto ne možemo
tvrditi sa sigurnošću većom od 99%, odnosno vjerojatnost da
razlika ne postoji i u populaciji je manja od 5%, ali veća od 1%.
Vježba 2
• Na skupini od 500 arhitekata i skupini od 500 profesora
hrvatskog jezika primijenjen je test spacijalnih sposobnosti i
utvrđeni su sljedeći deskriptivni pokazatelji: MA=120, SDA=10;
MH=109, SDH=12
• istraživačko pitanje: Razlikuju li se dipl. ing. arhitekture i profesori
hrvatskog jezika u spacijalnim sposobnostima?
• istraživačka (direktivna) hipoteza: arhitekti imaju razvijenije spacijalne
sposobnosti od profesora hrvatskog jezika
• H0=nema razlike u spacijalnim sposobnostima između arhitekata i
profesora hrvatskog jezika
Vježba 2
• Izračunati standardne pogreške aritmetičkih sredina:
𝑆𝐷 𝑆𝐷
𝜎𝑀 𝐴 = ; 𝜎𝑀 𝐻 =
𝑁 𝑁
• Izračunati standardnu pogrešku razlike: σM1-M2
• Izračunati t-omjer:
𝑀1 − 𝑀2
𝑡=
2 2
𝜎𝑀1 + 𝜎𝑀2
• Izračunati stupnjeve slobode: df=(N1-1)+(N2-1)
• Interpretirati
Vježba 2
• Izračunati standardne pogreške aritmetičkih sredina:

𝑆𝐷 10 𝑆𝐷 12
𝜎𝑀 𝐴 = = = 0.447 ; 𝜎𝑀 𝐻 = = = 0.537
𝑁 500 𝑁 500

• Izračunati standardnu pogrešku razlike: σM1-M2= =0.70

• Izračunati t-omjer:
𝑀1 − 𝑀2 120 − 109
𝑡= = = 15.71
2 2 0.4472 + 0.5372
𝜎𝑀1 + 𝜎𝑀2

• Izračunati stupnjeve slobode: df=(N1-1)+(N2-1)=(500-1)+(500-1)=998


Vježba 2

• dobivena t–vrijednost je puno veća od granične 1.96, ali i 2.58,


što znači da je utvrđena razlika između dvije aritmetičke sredine
statistički značajna uz nivo rizika manji od 1%
• to se piše ovako: t=15.71, df=998, p<0.01
Vježba 2
• INTERPRETACIJA: „Utvrđena je statistički značajna razlika u
prosječnom rezultatu na testu spacijalnih sposobnosti između
skupine arhitekata i skupine profesora hrvatskog jezika uz razinu
rizika manju od 1% - arhitekti postižu veće rezultate na testu
spacijalnih sposobnosti od profesora hrvatskog jezika.”
• praktično, to znači da sa sigurnošću većom od 99% možemo tvrditi
da ova razlika postoji i u populaciji tj. da po pitanju spacijalnih
sposobnosti arhitekti i profesori hrvatskog jezika pripadaju dvjema
različitim populacijama;
• ili, tako velika razlika može se po slučaju pojaviti u manje od 1%
slučajeva što je dovoljno maleno da nam bude prihvatljivo

You might also like