Professional Documents
Culture Documents
Intervali Pouzdanosti
Intervali Pouzdanosti
Važno pitanje koje se nameće prilikom procjene veličine uzorka, a to je: „Koliko bi velik trebao biti
uzorak kako bi procjena bila što točnija?“. Na ovo pitanje nije lako odgovoriti jer veličina uzorka ovisi o
više faktora, kao što su željena preciznost i vjerojatnost stvaranja točne procjene.
Pretpostavimo da profesor želi odrediti srednju vrijednost godina svih studenata koji slušaju predmete
ovaj semestar. Recimo da je riječ o 100 studenata i nađe srednju vrijednost godina tih studenata,
recimo 22.3 godine. Profesor može zaključiti kako je srednja vrijednost godina svih studenata 22.3
godina. Ovakav tip procjene naziva se točkasta procjena (point estimate – procjena jednim brojem).
Točkasta procjena je specifična numerička vrijednost procjene srednje vrijednosti populacije. Najbolja
točkasta procjena populacijske sredine 𝜇 jest sredina uzorka 𝑋̅.
Drugi tip procjene naziva se intervalna procjena. Intervalna procjena srednje vrijednosti populacije je
interval ili opseg vrijednosti korištenih za procjenu te srednje vrijednosti. Ta procjena može, ali i ne
mora sadržavati vrijednost parametra kojeg se procjenjuje. U ovom slučaju to je srednja vrijednost
populacije.
U intervalnoj procjeni, srednja vrijednost populacije se nalazi između dviju vrijednosti. Npr. Intervalna
procjena za srednju dob svih studenata može biti 26.9 < 𝜇 < 27.7, ili 27.3 ± 0.4 godina.
Ili interval sadrži srednju vrijednost populacije, ili ga ne sadrži. Nivo pouzdanosti (obično postotak)
može biti dodijeljen prije nego što je stvorena intervalna procjena. Npr. Netko može biti 95% siguran
da interval sadrži istinitu srednju vrijednost populacije. Međutim, zašto baš 95%? Zašto ne 99% ili
99.5%?
Ako bi netko bio 99% ili 99.5% siguran, tada interval mora biti veći. Npr. za interval pouzdanosti 99%
za srednju vrijednost godina studenata može biti 26.7 < 𝜇 < 27.9, ili 27.3 ± 0.6 godina. Dakle, dogodi
se kompromis. Prema tome, jedan interval se mora proširiti kako bi pouzdanost da interval sadrži
istinitu srednju vrijednost populacije bila veća.
Interval pouzdanosti je specifična intervalna procjena srednje vrijednosti populacije određena koristeći
podatke iz uzorka i koristeći specifični nivo pouzdanosti.
Tri su najčešći intervali pouzdanosti koji se koriste: 90%, 95% i 99% interval pouzdanosti.
Primjenjujući centralni granični teorem može se zaključiti da kada je veličina uzorka velika, približno
95% sredine uzorka će pasti unutar ±1.96 standardne pogreške populacijske sredine. To jest,
𝜎
𝜇 ± 1.96 ( 𝑛)
√
Recimo da je uzeta sredina uzorka 𝑋̅. Tada je vjerojatnost 95% da ona pada unutar opsega od
𝜎 𝜎
𝜇 ± 1.96 ( ). Na isti način, vjerojatnost je 95% da će interval 𝑋̅ ± 1.96 ( ) sadržavati 𝜇.
√𝑛 √𝑛
Za interval pouzdanosti 95%, 𝑧𝛼/2 = 1.96; te ukoliko je interval pouzdanosti 99%, 𝑧𝛼/2 = 2.58.
𝜎
Član 𝑧𝛼/2 ( 𝑛) naziva se maksimalna greška procjene.
√
Za specifičnu vrijednost, recimo 𝛼=0.05, 95% sredine uzoraka će pasti unutar ove vrijednosti pogreške
sa svake strane populacijske sredine.
Slika 1. Raspodjela 𝑋̅
Maksimalna greška procjene je maksimalna razlika između točkaste procjene parametra i stvarne
vrijednosti parametra.
Primjer 1.
Za određeni lijek je poznato da povećava puls srca korisnika. Standardna devijacija iznosi 5 otkucaja
po minuti. Uzorak od 30 korisnika ima srednju vrijednost pulsa 104 otkucaja po minuti. Pronađi 99%
interval pouzdanosti.
Rješenje: Jer je tražen 99%-tni interval pouzdanosti, 𝑧𝛼/2 = 2.58. Uvrštavajući u formulu dobijemo:
𝜎 𝜎
𝑋̅ − 𝑧𝛼/2 ( ) < 𝜇 < 𝑋̅ + 𝑧𝛼/2 ( )
√𝑛 √𝑛
5 5
104 − 2.58 ( ) < 𝜇 < 104 + 2.58 ( )
√30 √30
Na Slici 2. je prikazan malo drugačiji pogled na interval pouzdanosti. Prema centralnom graničnom
teoremu, približno 95% sredine uzoraka pada unutar 1.96 standardne devijacije populacijske sredine
ako je veličina uzorka veća ili jednaka 30 te ako je 𝜎 poznat kada je 𝑛 < 30 kada imamo normalnu
raspodjelu populacije. Kad bi bilo moguće napraviti interval pouzdanosti oko svake sredine uzorka,
kako je to napravljeno u prethodnom primjeru za 𝜇, 95% tih intervala bi sadržavalo populacijsku
sredinu, kao što je to prikazano na Slici 3.
Ako je željena pouzdanost 99%, intervali pouzdanosti se moraju povećati tako da 99 od 100 intervala
sadrži populacijsku sredinu.
Jer se i ostali intervali pouzdanosti (osim 90%, 95% i 99%) nekad koriste u statistici, neophodno je
objašnjenje kako pronaći vrijednost za 𝑧𝛼/2 . Kao što je rečeno prije, grčko slovo 𝛼 označava ukupnu
površinu u oba „repa“ krivulje standardne normalne distribucije. Vrijednost za 𝛼 je pronađena
oduzimanjem decimalnog ekvivalenta traženog nivoa pouzdanosti od 1. Npr. Ako je potrebno pronaći
98% interval pouzdanosti, tada 𝛼 = 1 − 0.98, ili 0.02. Tada se 𝛼/2 dobije dijeljenjem 𝛼 sa 2. Dakle,
𝛼/2=0.01. Konačno, 𝑧0.01 jest vrijednost koja će dati površinu od 0.01 u desnom „repu“ krivulje
standardne normalne distribucije, što je prikazano na Slici 4.
Primjer 2.
Sljedeći podaci prikazuju uzorak imovine (u milijunima dolara) 30 kreditnih unija. Pronađi 90%-tni
interval pouzdanosti srednje vrijednosti.
Rješenje:
1. korak. Pronađi srednju vrijednost i standardnu devijaciju za dane podatke. Srednja vrijednost uzorka
jest 𝑋̅ = 11.091. Standardna devijacija jest 𝑠 = 14.405.
2. korak. Pronađi 𝛼/2. Jer je tražen 90%-tni interval pouzdanosti, 𝛼 = 1 − 0.90 = 0.10 i
𝛼 0.10
2
= 2
= 0.05
3. korak. Pronađi 𝑧𝛼/2 . Oduzimanjem 0.05 od 0.5000 dobijemo 0.4500. Traženu vrijednost 𝑧 dobijemo
iz Tablice 1 i iznosi 1.65. (Napomena: Ova vrijednost je pronađena promatrajući vrijednosti između
0.4495 i 0.4505. Preciznija vrijednost 𝑧, dobivena matematički, iznosi 1.645.)
Određivanje veličine uzorka je blisko povezano sa statističkom procjenom. Često postavljeno pitanje
je: „Koliko velik treba biti uzorak kako bi procjena bila ispravna?“. Odgovor na to pitanje nije
jednostavan jer ono ovisi o maksimalnoj pogrešci procjene, populacijskoj standardnoj devijaciji i o
stupnju pouzdanosti. Npr. Koliko blisko želimo biti srednjoj vrijednosti i koliku pouzdanost želimo (90%,
95%, 99%, itd.)? Za potrebe određivanja veličine uzorka pretpostaviti ćemo da je populacijska
standardna devijacija varijable poznata ili da je dobivena iz prethodnih proučavanja. Formula za
veličinu uzorka je dobivena iz formule maksimalne greške procjene,
𝜎
𝐸 = 𝑧𝛼/2 ( )
√𝑛
𝐸 √𝑛 = 𝑧𝛼/2 (𝜎)
𝑧𝛼/2 ∙ 𝜎 2
𝑛=( )
𝐸
Primjer 3.
Profesor statistike želi odrediti srednju dob studenata. Koliko velik uzorak je potreban? Profesor
statistike želi biti 99% siguran da će procjena biti istinita unutar jedne godine. Iz prethodnih istraživanja
poznata je standardna devijacija godina i iznosi 3 godine.
Rješenje: Jer je 𝛼 = 0.01 (ili 1 − 0.99), 𝑧𝛼/2 = 2.58 i 𝐸 = 1. Uvrštavajući u formulu dobijemo:
𝑧𝛼/2∙ 𝜎 2 2.58∙3 2
𝑛=( 𝐸
) =[ 1
] = 59.9
što se zaokruži na 60. Prema tome, profesor treba minimalno 60 studenata kako bi bio 99% siguran
da će procjena unutar 1 godine biti istinita.
Kao što je rečeno prije, sampling distribucija srednje vrijednosti je približno normalna kada se
proučava velik broj uzoraka 𝑛 ≥ 30. Vrijedi,
𝑋̅ − 𝜇
𝑧=
𝜎/√𝑛
Vjerojatnost da će 𝑧 imati vrijednost između −𝑧𝛼/2 i 𝑧𝛼/2 jest 1 − 𝛼. Grafički prikaz se vidi na Slici 6.
Prema tome,
𝑋̅ − 𝜇
−𝑧𝛼/2 < 𝜎 < 𝑧𝛼/2
√𝑛
𝜎
Pomnožimo s ,
√𝑛
𝜎 𝜎
−𝑧𝛼 ∙ < 𝑋̅ − 𝜇 < 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Oduzmemo s 𝑋̅,
𝜎 𝜎
−𝑋̅ − 𝑧𝛼 ∙ < −𝜇 < −𝑋̅ + 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Pomnožimo s −1,
𝜎 𝜎
𝑋̅ + 𝑧𝛼 ∙ > 𝜇 > 𝑋̅ − 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Zamjenom strana nejednakosti dobijemo formulu za interval pouzdanosti:
𝜎 𝜎
𝑋̅ − 𝑧𝛼 ∙ < 𝜇 < 𝑋̅ + 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Tablica 1.
Tablica 2.
Literatura:
[1] http://people.etf.unsa.ba/~ksokolija/c/ug/pees/definicije.html - preuzeto 9.11.2014.