Professional Documents
Culture Documents
) Krešimir Kufrin & Ivan Landripet: OSNOVE SOCIOLOŠKE STATISTIKE (Odsjek za sociologiju FFZG, ak. god. 2018./2019.)
Slična opća ideja t–testa i analize varijance: Varijabilitet svakog pojedinog rezultata može se rastaviti na dvije
komponente:
t–test • odstupanje rezultata od aritmetičke sredine uzorka (varijabilitet unutar
uzorka)
• testiranje razlike između aritmetičkih sredina dvaju uzoraka (1 – 2) • odstupanje aritmetičke sredine uzorka (u koji spada dani rezultat) od
usporedbom te razlike s varijacijama unutar uzoraka (standardna zajedničke (ukupne, totalne) aritmetičke sredine svih rezultata u svim
pogreška razlike aritmetičkih sredina) uzorcima (varijabilitet između uzoraka)
• ako je razlika aritmetičkih sredina uzoraka velika u odnosu na varijacije
unutar uzoraka (tj. ako je njihov omjer – t–omjer – dovoljno velik u odnosu
na neku graničnu, kritičnu vrijednost), razlika je statistički značajna
Analiza varijance
Na intervalnoj “skali životne sreće” izmjereni su rezultati 15 studenata i Treba izračunati pokazatelj kojim se i inače izražava varijabilitet – varijancu –
studentica (po pet s društveno–humanističkih, tehničkih i medicinsko– i to tako da sume kvadrata podijelimo s odgovarajućim brojem stupnjeva
biotehnoloških fakulteta). Zanima nas postoji li između osoba s različitih slobode
fakulteta statistički značajna razlika u prosječnom rezultatu na skali.
Tako dobivene (procijenjene) varijance u analizi varijance se nazivaju
SREDNJIM KVADRATIMA:
1. PRVI KORAK ANALIZE VARIJANCE:
Izračunavanje sume kvadrata unutar grupa i sume kvadrata između SREDNJI KVADRAT IZMEĐU UZORAKA
grupa
SRKIG = SUKIG / dfIG
SUMA KVADRATA • dfIG = k – 1
UNUTAR IZMEĐU
X UKUPNA
GRUPA GRUPA
38 16 49 9 SREDNJI KVADRAT UNUTAR UZORAKA
42 0 49 49
SRKUG = SUKUG / dfUG
DH 43 1 49 64 DH = 42
43 1 49 64 • dfUG = NTOT – k
44 4 49 81
30 4 9 25
SRKIG = 370 / 2 = 185
32 0 9 9
TEH 32 0 9 9 TEH = 32 SRKUG = 116 / 12 = 9.67
32 0 9 9
34 4 9 1
26 25 16 81 3. TREĆI KORAK ANALIZE VARIJANCE:
27 16 16 64
MB 31 0 16 16 MB = 31 Izračunati omjer varijance između i varijance unutar uzoraka (F–omjer):
34 9 16 1
SRK IG
37 36 16 4 F=
SRK UG
TOT = 35 SUKUG = 116 SUKIG = 370 SUKTOT = 486
Odrediti kritični tablični F–omjer za odgovarajući broj dfIG (k – 1; u stupcima • "zavisna" varijabla je kvantitativna (imamo li ordinalnu "zavisnu"
tablice) i dfUG = (NTOT – k; u redovima tablice) na željenoj razini rizika varijablu rabimo neparametrijske procedure – npr. Kruskal–Wallis H test)
SUMA KVADRATA DEFINICIJA RAČUNSKE FORMULE Ako je F–omjer u analizi varijance statistički značajan, znamo da je malo
vjerojatno da je razlika među aritmetičkim sredinama uzoraka slučajna
SUK TOT = (NTOT − 1) s 2TOT
Ukupna SUK TOT = Σ (X − XTOT ) 2
SUK TOT = ( ΣX 2 ) − ( NTOT X TOT
2
) Zaključujemo da se neke populacije (populacijske skupine) vjerojatno
razlikuju u prosječnim rezultatima, ali ne znamo koje se sve populacije
( ) [Σ (NN X )] razlikuju
2
SUKIG = Σ k Nk X k2 − k k k
SUKIG = Σ Nk ( Xk − X TOT ) 2
TOT
Između grupa
Testovi multiple komparacije
( )
SUK IG = Σ k Nk X k2 − NTOT X TOT
2
Doskora najčešće korišten test u slučaju homogenih varijanci uzoraka; 0 Pretpostavke: proveli smo analizu varijance te znamo iznos
u novije vrijeme učestalo se koristi Bonferronijev test srednjeg kvadrata unutar uzoraka; varijance su homogene
UZORAK (GRUPA) 1 UZORAK (GRUPA) 2 UZORAK (GRUPA) 3 SRKUG – srednji kvadrat unutar uzoraka
3 5 1 k – broj uzoraka
F – kritična tablična F vrijednost na željenoj razini rizika i za
1 3 1 odgovarajući broj stupnjeva slobode
7 2 N1, N 2 – broj slučajeva (ispitanika) u uzorcima koje se testiraju
3
U našem primjeru imamo:
3
SRKUG = 2.0
k =3
SUKIG = 18.9 dfIG = 2 SRKIG = 9.45 F = 4.74 (za α = 0.05, dfIG = 2, dfUG = 7)
SUKUG = 14.0 dfUG = 7 SRKUG = 2.0 N1 = 3 (broj ispitanika u drugom uzorku)
N2 = 5 (broj ispitanika u trećem uzorku)
U1 = 2.0 U2 = 5.0 U3 = 2.0
pa je, dakle:
Zanima nas je li razlika aritmetičkih sredina 2. i 3. uzorka statistički
značajna ⎛ 1 1 ⎞
D S = SRK UG × (k − 1) × F × ⎜⎜ + ⎟⎟
⎝ N1 N 2 ⎠
⎛ 1 1⎞
D S = 2.0 × (3 − 1) × 4.74 × ⎜ + ⎟
⎝3 5⎠
U našem primjeru imamo: • "Na uslugu uvijek nastojim uzvratiti uslugom" (intenzitet slaganja)
• "Zakoni nikada ne mogu jednako važiti za sve" (intenzitet neslaganja)
D < DS • "Ljudima valja omogućiti veći utjecaj na važne odluke vlasti" (intenzitet
slaganja)
pa, stoga, razlika aritmetičkih sredina drugog i trećeg uzorka nije Varijablama je pridružena ljestvica procjene od 5 stupnjeva.
statistički značajna na razini rizika 5%
CIVILNOST
DOBNE SKUPINE
Još jednostavnije: aritmetičke sredine:
ANALIZA VARIJANCE
TREBA ZNATI: