You are on page 1of 35

Testiranje hipoteza: usporedba

dviju aritmetičkih sredina


pomoću granica pouzdanosti
Psihologijska statistika I
06.12.2023.
Prof. dr. sc. Irena Burić
Predavanja
Pitanja za ponavljanje
• Što je standardna pogreška aritmetičke sredine?
• Kako se računa standardna pogreška aritmetičke sredine?
• Što je prava aritmetička sredina?
• Na koje načine možemo otkriti vrijednost prave aritmetičke
sredine?
• Čemu služi standardna pogreška aritmetičke sredine?
Usporedba dvije aritmetičke sredine
• jedan od najčešćih slučajeva u statističkoj obradi podataka jest
usporedba dviju (ili više) aritmetičkih sredina tj. TESTIRANJE
RAZLIKE IZMEĐU DVIJE ARITMETIČKE SREDINE
• Primjer 1: usporedba spacijalnih sposobnosti arhitekata i
profesora hrvatskog jezika (2 skupine ispitanika tj. dva uzorka
→ nezavisni nacrt)
• Primjer 2: usporedba ukupnog broja zapamćenih riječi
prezentiranih vizualno i auditivno na skupini studenata
psihologije (2 eksperimentalne situacije → zavisni nacrt)
Logika usporedbe dviju aritmetičkih sredina
• kako mi u praksi vrlo rijetko provodimo istraživanja na čitavoj populaciji,
već uglavnom to činimo na uzorcima, postavlja se pitanje je li neka
pronađena razlika između skupine A i B rezultat djelovanja slučajnih
faktora prilikom odabira uzorka ili skupine A i B zapravo pripadaju
različitim populacijama
• čak i kad iz iste populacije izvučemo 2 uzorka slučajnim odabirom i
potom izračunamo njihove aritmetičke sredine, vrlo je vjerojatno da će se
one razlikovati u svojoj veličini, što je rezultat djelovanja pukog slučaja
prilikom odabiranja članova u uzorak (tj. posljedica je pogreške
uzorkovanja)
• kada imamo dva mjerenja na jednoj skupini ispitanika (npr. razlike u broju
zapamćenih riječi kada su one prezentirane auditivno i vizualno), glavno
je pitanje je li NZV (način prezentacije) djelovala na ZV (broj zapamćenih
riječi) (u ovom slučaju rezultati pojedine eksperimentalne situacije čine
različite populacije!)
Statistička značajnost
• ako dobivena razlika između aritmetičkih sredina nije rezultat
slučajnih faktora (dakle, skupine A i B tj. rezultati kontrolne i
eksperimentalne situacije pripadaju različitim populacijama),
kažemo da je ona STATISTIČKI ZNAČAJNA
Statistička značajnost
• ako je neka razlika između dvije aritmetičke sredine statistički
značajna, ona nije slučajna već uz određeni rizik donošenja
pogrešnog zaključka, postoji i u populaciji – istu razliku dobili
bismo i kad bismo ispitali sve članove tih dviju populacija
• riječ “značajno” ima drugačije značenje u svakodnevnom životu
– u svakodnevnom govoru riječ “značajno” upućuje na nešto
važno i veliko, a statistički značajna razlika zapravo ne mora
uopće biti važna ili velika! (npr. svi ljudi su navečer 1 – 3 mm
niži nego ujutro i ta je razlika statistički značajna, a ipak ta
razlika nema nikakvog praktičnog značenja)
Statistička značajnost
• u znanosti kao što je psihologija, gdje postoji dosta velik
varijabilitet pojava koje mjerimo, vrlo je važno ustanoviti je li
neka pojava odraz djelovanja slučajnih čimbenika ili je možemo
smatrati „općim zakonom”
• provjeravanje je li neka razlika statistički značajna od velike je
važnosti jer omogućuje generalizaciju činjenica utvrđenih na
uzorku na čitavu populaciju
• ako utvrdimo da je neka pojava statistički značajna, odnosno da
vrijedi i u populaciji, dobiveni rezultati dobivaju na znanstvenoj
vrijednosti
Testiranje hipoteza
• postupak odlučivanja jesu li rezultati dobiveni u našem istraživanju, i
na uzorku, u skladu s rezultatima prijašnjih istraživanja ili teorijskim
pretpostavkama koje se mogu primijeniti na čitavu populaciju
• HIPOTEZA – pretpostavka o odnosu među analiziranim pojavama
koja se bazira na teoriji, rezultatima prethodnih istraživanja, a
ponekad i na neformalnom opažanju
• TEORIJA
• skup principa i zakona koji nastoje objasniti neke pojave, događaje i odnose
među njima
• služe za deriviranje istraživačkih hipoteza, a rezultati provedenih istraživanja
ih nadograđuju, kreiraju, mijenjaju
Nul-hipoteza vs. afirmativna hipoteza
• nul-hipoteza podrazumijeva ne postojanje razlike među
pojavama koje mjerimo u populaciji
• npr. zanima nas jesu li u testu spacijalnih sposobnosti prosječno
uspješniji muškarci ili žene – prema nul-hipotezi nema razlike u
spacijalnim sposobnostima između muškaraca i žena, odnosno
distribucije spacijalnih sposobnosti svih muškaraca i svih žena (dakle,
čitavih populacija), međusobno se ne razlikuju te imaju iste
aritmetičke sredine i iste standardne devijacije – tj. one se preklapaju
• drugim riječima, ako je nul-hipoteza točna, muškarci i žene pripadaju
istoj populaciji (s jedinstvenom distribucijom)
Nul-hipoteza vs. afirmativna hipoteza
• afirmativna hipoteza podrazumijeva postojanje statistički
značajne razlike između dvije aritmetičke sredine
• može biti:
• jednosmjerna (eng. one-tailed) – razliku ćemo pronaći u jednom smjeru
(npr. muškarci postižu bolji prosječni rezultat na testu spacijalnih
sposobnosti od žena) – naziva se još i direktivna
• dvosmjerna (eng. two-tailed) – razliku ćemo pronaći i to u bilo kojem
smjeru (muškarci i žene se razlikuju u prosječnom rezultatu na testu
spacijalnih sposobnosti)
Primjer
• ISTRAŽIVAČKO PITANJE: postoji li razlika u spacijalnim sposobnostima
između arhitekata i profesora hrvatskog jezika, odnosno postoji li razlika
utvrđena na uzorcima arhitekata i profesora hrvatskog jezika i u populaciji?
• ISTRAŽIVAČKA HIPOTEZA (DIREKTIVNA): arhitekti imaju bolje razvijene
spacijalne sposobnosti od profesora hrvatskog jezika: μA>μH
• NUL-HIPOTEZA: nema razlike u stupnju razvijenosti spacijalnih
sposobnosti između arhitekata i profesora hrvatskog jezika, odnosno nema
razlike između ovih dviju populacija: μA=μH
Testiranje hipoteza
• hipoteze testiramo određenim statističkim postupkom (npr. t-
testom) na podacima dobivenim na uzorku
• rezultat tog testiranja može biti prihvaćanje ili odbacivanje
hipoteze
• iako je većina hipoteza koje postavljaju istraživači po svojoj
prirodi afirmativna i direktivna, najčešće se statistički testira
NUL-HIPOTEZA i to DVOSMJERNIM TESTOM!
Testiranje hipoteza prilikom usporedbe
dviju aritmetičkih sredina
• prihvaćanje nul-hipoteze znači da ne postoji statistički značajna
razlika između dviju aritmetičkih sredina (izračunatih na dvije različite
skupine ispitanika ili u dvije situacije mjerenja) u ispitivanoj pojavi
• međutim, to ne znači posve sigurno da ta razlika uistinu ne postoji u
populaciji, već to samo znači da mi ne možemo tvrditi da postoji jer je nismo
uspjeli potvrditi našim istraživanjem!
• odbacivanje nul-hipoteze znači da postoji statistički značajna
razlika između dviju aritmetičkih sredina (izračunatih na dvije različite
skupine ispitanika ili u dvije situacije mjerenja) u ispitivanoj pojavi
• međutim, utvrđivanje razlike ne znači da je zbog toga automatski prihvaćena
direktivna hipoteza jer nju nismo testirali!
Testiranje hipoteza prilikom usporedbe
dviju aritmetičkih sredina
• statističku značajnost razlike između dvije aritmetičke
sredine možemo provjeravati:
• uz pomoć “granica pouzdanosti” (najčešće se koristi za
testiranje razlike između aritmetičke sredine uzorka i neke
unaprijed poznate (populacijske) vrijednosti
• uz pomoć t-testa
Granice pouzdanosti
Testiranje razlike između aritmetičke sredine
uzroka (M) i populacijske aritmetičke sredine (µ)
Osnovna logika
• određivanje razlikuje li se neka dobivena aritmetička sredina
uzorka od jedne druge (najčešće populacijske) vrijednosti
• to je najčešće neka poznata vrijednost koja predstavlja
parametar populacije i za koju nam ne moraju biti poznati
podaci o varijabilitetu
• ako interval tj. granice pouzdanosti, uz određenu razinu
sigurnosti (najčešće 95% i/ili 99%) obuhvaća zadanu (fiksnu,
populacijsku) vrijednost, prihvaćamo nul-hipotezu tj.
zaključujemo da se prosječna vrijednost utvrđena na uzorku ne
razlikuje statistički značajno od populacijske vrijednosti
Usporedba M i μ
• da bismo mogli odrediti granice pouzdanosti tj. interval u kojem
se kreće prava aritmetička sredina (μ), najprije je potrebno
izračunati standardnu pogrešku aritmetičke sredine koristeći se
podacima dobivenim na uzorku, i to prema formuli:
𝑆𝐷
𝜎𝑀 =
𝑁
• potom određujemo granice pouzdanosti kao M ±1.96∙σM (95%
sigurnosti), odnosno kao M ±2.58∙σM (99% sigurnosti)
• ako dobiveni interval obuhvaća populacijsku (normativnu)
vrijednost, ostajemo na nul-hipotezi
Granice pouzdanosti
Testiranje razlike između dviju aritmetičkih
sredina dobivenih na dva nezavisna uzorka
Standardna pogreška razlike između
dvije aritmetičke sredine
• zamislimo sljedeće:
• iz dvije različite populacije uzimamo neizmjerno velik broj parova
uzoraka (iz svake populacije odabiremo uzorke iste veličine) i svaki put
za svaki uzorak izračunamo aritmetičku sredinu
• potom odredimo razlike između pojedinih parova aritmetičkih sredina
(d) i napravimo distribuciju tih razlika

Ove razlike distribuirat će se po normalnoj raspodjeli kojoj je


aritmetička sredina PRAVA RAZLIKA među aritmetičkim
sredinama dviju populacija, a pripadajuće raspršenje tj.
standardna devijacija te distribucije naziva se STANDARDNA
POGREŠKA RAZLIKE IZMEĐU DVIJE ARITMETIČKE
SREDINE.
Standardna pogreška razlike između dvije
aritmetičke sredine: 2 nezavisna uzorka

 M1 − M 2 = ( M1
2
+ M 2 2
)
• σM1-M2 - standardna pogreška razlike
• σM1 – standardna pogreška aritmetičke sredine prvog uzorka
• σM2 – standardna pogreška aritmetičke sredine drugog uzorka

VAŽNO! Formula za računanje standardne pogreške razlike ovisi o


samom nacrtu istraživanju. Međutim, njezin statističko-logički smisao
je uvijek isti – to je standardna devijacija u distribuciji neizmjerno
velikog broja razlika oko prave razlike
Standardna pogreška razlike između
dvije aritmetičke sredine
• standardna pogreška razlike po svom smislu predstavlja
standardnu devijaciju pa za nju vrijede isti zakoni kao i za
standardnu devijaciju:
• 68% je vjerojatno da se prava razlika nalazi u intervalu d±1σM1-M2
• 95% je vjerojatno da se prava razlika nalazi u intervalu d±2σM1-M2
• 99.7% vjerojatno da se prava razlika nalazi u intervalu d±3σM1-M2

d = dobivena razlika između dvije aritmetičke sredine


Standardna pogreška razlike između dvije
aritmetičke sredine: dva nezavisna uzorka
• uzimamo li neizmjerno velik broj uzoraka iz dviju populacija koje
se međusobno ni po čemu ne razlikuju (dakle, zapravo je riječ o
istoj populaciji), također dobivamo normalnu distribuciju
razlika između dviju aritmetičkih sredina jer se uzorci
međusobno razlikuju po aritmetičkim sredinama čak i kad
potječu iz iste populacije zbog djelovanja slučajnih faktora
• koliko će iznositi aritmetička sredina distribucije razlika u tom
slučaju?
• ARITMETIČKA SREDINA TIH RAZLIKA IZNOSI NULA – jer je
riječ o uzorcima koji zapravo pripadaju istoj populaciji!
• ako dva uzorka pripadaju istoj populaciji, aritmetička sredina
distribucije neizmjerno velikog broja razlika iznosit će 0, tj. prava
razlika bit će 0 → prihvaćamo nul-hipotezu
• ako dva uzorka pripadaju različitim populacijama, aritmetička
sredina distribucije neizmjerno velikog broja razlika bit će
različita od 0, tj. prava razlika bit će različita od 0 →
odbacujemo nul-hipotezu i utvrđujemo da postoji statistički
značajna razlika među uzorcima
Granice pouzdanosti
• je li neka dobivena razlika tj. d statistički značajna ili je ona
slučajna, možemo otkriti određivanjem granica pouzdanosti:

95% granice pouzdanosti: d±1.96∙σM1-M2


99% granice pouzdanosti: d±2.58∙σM1-M2

• ako izračunati interval ne zahvaća nultu vrijednost,


zaključujemo da postoji statistički značajna razlika
Vježbe
Vježba 1

• U nekom mjerenju na uzorku od 144 djece dobivena je


prosječna težina M=34 kg i SD=4.8 kg.
• Razlikuje li se dobivena aritmetička sredina statistički značajno od
vrijednosti 32 kg koja se smatra normom za djecu te dobi?
• Specificirajte i testirajte nul-hipotezu.
Vježba 1
• Nul-hipoteza: tjelesna težina uzorka djece ne razlikuje se od
normativne vrijednosti
• Postupak:
• Izračunati standardnu pogrešku aritmetičke sredine
𝑆𝐷
𝜎𝑀 =
𝑁
• Odrediti granice pouzdanosti kao M ± 1.96∙σM (95% sigurnosti),
odnosno kao M ± 2.58∙σM (99% sigurnosti)
• Odrediti obuhvaća li interval populacijsku vrijednost tj. prihvatiti ili
odbaciti nul-hipotezu
Vježba 1
1. standardna pogreška aritmetičke sredine:
𝑆𝐷 4.8
𝜎𝑀 = = = 0.4
𝑁 144
2. određivanje intervala u kojem se nalazi prava aritmetička sredina pomoću
granica pouzdanosti
• 34±1.96∙0.4 → 33.22 – 34.78 (95%-tna sigurnost)
• 34±2.58∙0.4 → 32.97 – 35.03 (99%-tna sigurnost)
2. zaključak
• populacijska vrijednost X=32 nalazi se izvan oba intervala, što znači da se
aritmetička sredina uzorka statistički značajno razlikuje od populacijske vrijednosti tj.
norme i to možemo tvrditi uz sigurnost veću od 99%
• to zapravo znači da uzorak na kojem je provedeno istraživanje pripada populaciji
različitoj od ove za koje imamo norme (i to tvrdimo s 99%-tnom sigurnošću)
Vježba 2
• Kakav bi bio zaključak da populacijska norma iznosi 33.15 kg?
• Vrijednost 33.15 se nalazi izvan intervala određenog uz 95%-
tnu sigurnost, ali se nalazi u intervalu određenom uz 99%-tnu
sigurnost.
• Zaključili bismo da uzorak ne pripada populaciji tj. da je
prosječna tjelesna težina djece u uzorku statistički značajno
veća prosječne težine djece u populaciji uz sigurnost veću od
95%; međutim, isto ne možemo tvrditi uz sigurnost veću od
99%.
Vježba 3
• U nekom mjerenju na 1000 ispitanika utvrđena je razlika između
dvije aritmetičke sredine d=3 i σM1-M2=0.5. Je li ova razlika
statistički značajna?
Vježba 3
• 95% granice pouzdanosti: d±1.96∙σM1-M2 3±1.96∙0.5
2.02 – 3.98
• 99% granice pouzdanosti: d±2.58∙σM1-M2 3±2.58∙0.5
1.71 – 4.29
• niti jedan interval ne obuhvaća 0, pa zaključujemo da je razlika
statistički značajna uz sigurnost veću od 99%

• Ako možemo odbaciti nul-hipotezu uz sigurnost veću od 99%,


to automatski podrazumijeva da je možemo odbaciti i uz
sigurnost veću od 95%.
Vježba 4

• U nekom mjerenju na 1000 ispitanika utvrđena je razlika između


dvije aritmetičke sredine d=3 i σM1-M2=4.0. Je li ova razlika
statistički značajna?
Vježba 4
• 95% granice pouzdanosti: d±1.96∙ σM1-M2
3±1.96∙4 -4.84–10.84
• 99% granice pouzdanosti: d±2.58∙ σM1-M2
3±2.58∙4 -7.32–13.32
• oba intervala obuhvaćaju 0, pa zaključujemo da razlika nije statistički
značajna; kada bismo zaključili da razlika jest statistički značajna,
sigurnost u naš zaključak bila bi manja od 95% što nam je neprihvatljivo
• Ako razlika nije statistički značajna uz razinu sigurnosti od 99%, to
automatski znači da nije značajna ni uz razinu sigurnosti od 95%
• NAPOMENA: granične vrijednosti 1.96 i 2.58 vrijede samo kad imamo
velike uzorke!!

You might also like