You are on page 1of 12

Intervali pouzdanosti

Interval pouzdanosti za srednju vrijednost ( kada je 𝜎 poznat i 𝑛 ≥ 30)

Jedan aspekt inferencijalne (analitičke) statistike je proces procjenjivanja vrijednosti parametra iz


informacija sadržanih u uzorku (procjena). Npr.: „Jedan od 4 Amerikanaca je trenutno na dijeti.“ Ili
„Prosječna plaća učitelja jest 5 482 kune“.

Budući da su populacije iz kojih su te vrijednosti dobivene velike, te vrijednosti su procjene istinitih


parametara i izvedene su iz podataka sadržanih u uzorku.

Važno pitanje koje se nameće prilikom procjene veličine uzorka, a to je: „Koliko bi velik trebao biti
uzorak kako bi procjena bila što točnija?“. Na ovo pitanje nije lako odgovoriti jer veličina uzorka ovisi o
više faktora, kao što su željena preciznost i vjerojatnost stvaranja točne procjene.

Pretpostavimo da profesor želi odrediti srednju vrijednost godina svih studenata koji slušaju predmete
ovaj semestar. Recimo da je riječ o 100 studenata i nađe srednju vrijednost godina tih studenata,
recimo 22.3 godine. Profesor može zaključiti kako je srednja vrijednost godina svih studenata 22.3
godina. Ovakav tip procjene naziva se točkasta procjena (point estimate – procjena jednim brojem).

Točkasta procjena je specifična numerička vrijednost procjene srednje vrijednosti populacije. Najbolja
točkasta procjena populacijske sredine 𝜇 jest sredina uzorka 𝑋̅.

Drugi tip procjene naziva se intervalna procjena. Intervalna procjena srednje vrijednosti populacije je
interval ili opseg vrijednosti korištenih za procjenu te srednje vrijednosti. Ta procjena može, ali i ne
mora sadržavati vrijednost parametra kojeg se procjenjuje. U ovom slučaju to je srednja vrijednost
populacije.

U intervalnoj procjeni, srednja vrijednost populacije se nalazi između dviju vrijednosti. Npr. Intervalna
procjena za srednju dob svih studenata može biti 26.9 < 𝜇 < 27.7, ili 27.3 ± 0.4 godina.

Ili interval sadrži srednju vrijednost populacije, ili ga ne sadrži. Nivo pouzdanosti (obično postotak)
može biti dodijeljen prije nego što je stvorena intervalna procjena. Npr. Netko može biti 95% siguran
da interval sadrži istinitu srednju vrijednost populacije. Međutim, zašto baš 95%? Zašto ne 99% ili
99.5%?

Ako bi netko bio 99% ili 99.5% siguran, tada interval mora biti veći. Npr. za interval pouzdanosti 99%
za srednju vrijednost godina studenata može biti 26.7 < 𝜇 < 27.9, ili 27.3 ± 0.6 godina. Dakle, dogodi
se kompromis. Prema tome, jedan interval se mora proširiti kako bi pouzdanost da interval sadrži
istinitu srednju vrijednost populacije bila veća.

Nivo pouzdanosti intervalne procjene srednje vrijednosti populacije je vjerojatnost da će ta intervalna


procjena sadržavati srednju vrijednost populacije.

Interval pouzdanosti je specifična intervalna procjena srednje vrijednosti populacije određena koristeći
podatke iz uzorka i koristeći specifični nivo pouzdanosti.

Tri su najčešći intervali pouzdanosti koji se koriste: 90%, 95% i 99% interval pouzdanosti.

Primjenjujući centralni granični teorem može se zaključiti da kada je veličina uzorka velika, približno
95% sredine uzorka će pasti unutar ±1.96 standardne pogreške populacijske sredine. To jest,
𝜎
𝜇 ± 1.96 ( 𝑛)

Recimo da je uzeta sredina uzorka 𝑋̅. Tada je vjerojatnost 95% da ona pada unutar opsega od
𝜎 𝜎
𝜇 ± 1.96 ( ). Na isti način, vjerojatnost je 95% da će interval 𝑋̅ ± 1.96 ( ) sadržavati 𝜇.
√𝑛 √𝑛

Zapisano malo drugačije,


𝜎 𝜎
𝑋̅ − 1.96 ( 𝑛) < 𝜇 < 𝑋̅ + 1.96 ( 𝑛)
√ √

Taj se smisao može interpretirati na primjer tako da bi se otprilike u 95 od 100 ponavljanja


𝜎 𝜎
ovih 𝑛 mjerenja, populacijska sredina 𝜇 našla u intervalu < 𝑋̅ − 1.96 ( ) , 𝑋̅ + 1.96 ( ) >.
√𝑛 √𝑛
Vrijednost korištena za 95%-tni interval pouzdanosti, 1.96, je dobivena iz Tablice 1. Za interval
pouzdanosti 99%, vrijednost 2.58 se koristi umjesto 1.96 u formuli. Jer se i ostali intervali pouzdanosti
koriste u statistici, simbol 𝑧𝛼/2 se koristi u općenitoj formuli za intervale pouzdanosti. . Ako za neki
podatak izračunamo 𝑧𝛼/2 vrijednost, na primjer, 1.28, to znači da se taj podatak nalazi na 1.28
standardne devijacije desno od srednje vrijednosti. Jednako tako vrijednost z  0.94 znači
da se određeni podatak nalazi na 0.94 standardne devijacije lijevo od srednje vrijednosti. Grčko
slovo 𝛼 predstavlja ukupnu površinu u oba „repa“ krivulje standardne normalne distribucije. 𝛼/2
predstavlja površinu jednog „repa“. Veza između 𝛼 i nivoa pouzdanosti je ta da je navedeni nivo
pouzdanosti (postotak) ekvivalentan decimalnoj vrijednosti 1- 𝛼 i obrnuto. Kada je interval pouzdanosti
95%, 𝛼=0.05, jer 1-0.05=0.95, ili 95%. Kada je 𝛼=0.01, tada 1- 𝛼=0.99 i dobijemo interval pouzdanosti
99%.

Formula za interval pouzdanosti srednje vrijednosti za specifičan 𝛼:


𝜎 𝜎
𝑋̅ − 𝑧𝛼/2 ( ) < 𝜇 < 𝑋̅ + 𝑧𝛼/2 ( )
√𝑛 √𝑛

Za interval pouzdanosti 95%, 𝑧𝛼/2 = 1.96; te ukoliko je interval pouzdanosti 99%, 𝑧𝛼/2 = 2.58.
𝜎
Član 𝑧𝛼/2 ( 𝑛) naziva se maksimalna greška procjene.

Za specifičnu vrijednost, recimo 𝛼=0.05, 95% sredine uzoraka će pasti unutar ove vrijednosti pogreške
sa svake strane populacijske sredine.
Slika 1. Raspodjela 𝑋̅

Maksimalna greška procjene je maksimalna razlika između točkaste procjene parametra i stvarne
vrijednosti parametra.

Primjer 1.

Za određeni lijek je poznato da povećava puls srca korisnika. Standardna devijacija iznosi 5 otkucaja
po minuti. Uzorak od 30 korisnika ima srednju vrijednost pulsa 104 otkucaja po minuti. Pronađi 99%
interval pouzdanosti.

Rješenje: Jer je tražen 99%-tni interval pouzdanosti, 𝑧𝛼/2 = 2.58. Uvrštavajući u formulu dobijemo:
𝜎 𝜎
𝑋̅ − 𝑧𝛼/2 ( ) < 𝜇 < 𝑋̅ + 𝑧𝛼/2 ( )
√𝑛 √𝑛

5 5
104 − 2.58 ( ) < 𝜇 < 104 + 2.58 ( )
√30 √30

104 − 2.4 < 𝜇 < 104 + 2.4


101.6 < 𝜇 < 106.4
102 < 𝜇 < 106 ili 104 ± 2

Na Slici 2. je prikazan malo drugačiji pogled na interval pouzdanosti. Prema centralnom graničnom
teoremu, približno 95% sredine uzoraka pada unutar 1.96 standardne devijacije populacijske sredine
ako je veličina uzorka veća ili jednaka 30 te ako je 𝜎 poznat kada je 𝑛 < 30 kada imamo normalnu
raspodjelu populacije. Kad bi bilo moguće napraviti interval pouzdanosti oko svake sredine uzorka,
kako je to napravljeno u prethodnom primjeru za 𝜇, 95% tih intervala bi sadržavalo populacijsku
sredinu, kao što je to prikazano na Slici 3.

Slika 2. 95% interval pouzdanosti za sredine uzoraka


Slika 3. 95%-tni interval pouzdanosti za svaku sredinu uzorka

Ako je željena pouzdanost 99%, intervali pouzdanosti se moraju povećati tako da 99 od 100 intervala
sadrži populacijsku sredinu.

Jer se i ostali intervali pouzdanosti (osim 90%, 95% i 99%) nekad koriste u statistici, neophodno je
objašnjenje kako pronaći vrijednost za 𝑧𝛼/2 . Kao što je rečeno prije, grčko slovo 𝛼 označava ukupnu
površinu u oba „repa“ krivulje standardne normalne distribucije. Vrijednost za 𝛼 je pronađena
oduzimanjem decimalnog ekvivalenta traženog nivoa pouzdanosti od 1. Npr. Ako je potrebno pronaći
98% interval pouzdanosti, tada 𝛼 = 1 − 0.98, ili 0.02. Tada se 𝛼/2 dobije dijeljenjem 𝛼 sa 2. Dakle,
𝛼/2=0.01. Konačno, 𝑧0.01 jest vrijednost koja će dati površinu od 0.01 u desnom „repu“ krivulje
standardne normalne distribucije, što je prikazano na Slici 4.

Slika 4. 𝛼/2 za 98%-tni interval pouzdanosti


Da bi se dobila vrijednost 𝑧𝛼/2 za 98%-tni interval pouzdanosti, treba oduzeti 0.01 od 1 i dobije se
0.9900. Zatim treba pronaći u Tablici 1. vrijednost koja je najbliža 0.9900 ( u ovom slučaju 0.9901) i
onda pronaći odgovarajuću vrijednost 𝑧. U ovom primjeru, to je 2.33.

Slika 5. Postupak traženja 𝑧𝛼/2 za 98%-tni interval pouzdanosti

Za intervale pouzdanosti samo se pozitivne 𝑧 vrijednosti koriste u formuli.

Kada je početna varijabla normalno distribuirana i 𝛼 je poznat, standardna normalna raspodjela se


može koristiti za pronalazak intervala pouzdanosti bez obzira na veličinu uzorka. Kada je 𝑛 ≥ 30,
raspodjela srednjih vrijednosti će biti približno normalna pa makar se početna raspodjela razlikovala
od normalne. Također, ako je 𝑛 ≥ 30, 𝑠 se može zamijeniti sa 𝜎 u formuli za intervale pouzdanosti, te
se standardna normalna raspodjela može koristiti za pronalazak intervala pouzdanosti, kao što je to
prikazano u sljedećem primjeru.

Primjer 2.

Sljedeći podaci prikazuju uzorak imovine (u milijunima dolara) 30 kreditnih unija. Pronađi 90%-tni
interval pouzdanosti srednje vrijednosti.

Rješenje:
1. korak. Pronađi srednju vrijednost i standardnu devijaciju za dane podatke. Srednja vrijednost uzorka
jest 𝑋̅ = 11.091. Standardna devijacija jest 𝑠 = 14.405.

2. korak. Pronađi 𝛼/2. Jer je tražen 90%-tni interval pouzdanosti, 𝛼 = 1 − 0.90 = 0.10 i
𝛼 0.10
2
= 2
= 0.05

3. korak. Pronađi 𝑧𝛼/2 . Oduzimanjem 0.05 od 0.5000 dobijemo 0.4500. Traženu vrijednost 𝑧 dobijemo
iz Tablice 1 i iznosi 1.65. (Napomena: Ova vrijednost je pronađena promatrajući vrijednosti između
0.4495 i 0.4505. Preciznija vrijednost 𝑧, dobivena matematički, iznosi 1.645.)

4. korak. Uvrstimo u formulu:


𝑠 𝑠
𝑋̅ − 𝑧𝛼/2 ( 𝑛) < 𝜇 < 𝑋̅ + 𝑧𝛼/2 ( 𝑛)
√ √

(𝑠 se koristi umjesto 𝜎 kada je 𝜎 nepoznat, jer je 𝑛 ≥ 30.)


14.405 14.405
11.091 − 1.65 ( ) < 𝜇 < 11.091 + 1.65 ( )
√30 √30

11.091 − 4.339 < 𝜇 < 11.091 + 4.339


6.752 < 𝜇 < 15.430
Pa možemo reći da postoji 90%-tna pouzdanost da će se populacijska sredina imovina svih kreditnih
unija nalaziti između $6.752 milijuna i $15.430 milijuna dolara, bazirano na uzorku od 30 kreditnih
unija.

Određivanje veličine uzorka je blisko povezano sa statističkom procjenom. Često postavljeno pitanje
je: „Koliko velik treba biti uzorak kako bi procjena bila ispravna?“. Odgovor na to pitanje nije
jednostavan jer ono ovisi o maksimalnoj pogrešci procjene, populacijskoj standardnoj devijaciji i o
stupnju pouzdanosti. Npr. Koliko blisko želimo biti srednjoj vrijednosti i koliku pouzdanost želimo (90%,
95%, 99%, itd.)? Za potrebe određivanja veličine uzorka pretpostaviti ćemo da je populacijska
standardna devijacija varijable poznata ili da je dobivena iz prethodnih proučavanja. Formula za
veličinu uzorka je dobivena iz formule maksimalne greške procjene,
𝜎
𝐸 = 𝑧𝛼/2 ( )
√𝑛
𝐸 √𝑛 = 𝑧𝛼/2 (𝜎)

𝑧𝛼/2 ∙ 𝜎 2
𝑛=( )
𝐸

Formula za minimalnu veličinu uzorka potrebnu za procjenu intervala populacijske sredine


𝑧𝛼/2∙ 𝜎 2
𝑛=( )
𝐸
gdje je E maksimalna greška procjene. Ukoliko je potrebno, treba zaokružiti odgovor na cijeli broj, tj.
ako se dobije decimalni broj, koristiti sljedeći cijeli broj za veličinu uzorka, 𝑛.

Primjer 3.
Profesor statistike želi odrediti srednju dob studenata. Koliko velik uzorak je potreban? Profesor
statistike želi biti 99% siguran da će procjena biti istinita unutar jedne godine. Iz prethodnih istraživanja
poznata je standardna devijacija godina i iznosi 3 godine.

Rješenje: Jer je 𝛼 = 0.01 (ili 1 − 0.99), 𝑧𝛼/2 = 2.58 i 𝐸 = 1. Uvrštavajući u formulu dobijemo:

𝑧𝛼/2∙ 𝜎 2 2.58∙3 2
𝑛=( 𝐸
) =[ 1
] = 59.9

što se zaokruži na 60. Prema tome, profesor treba minimalno 60 studenata kako bi bio 99% siguran
da će procjena unutar 1 godine biti istinita.

Algebarski izvod formule za interval pouzdanosti

Kao što je rečeno prije, sampling distribucija srednje vrijednosti je približno normalna kada se
proučava velik broj uzoraka 𝑛 ≥ 30. Vrijedi,

𝑋̅ − 𝜇
𝑧=
𝜎/√𝑛
Vjerojatnost da će 𝑧 imati vrijednost između −𝑧𝛼/2 i 𝑧𝛼/2 jest 1 − 𝛼. Grafički prikaz se vidi na Slici 6.

Slika 6. Grafički prikaz vrijednosti z

Prema tome,

𝑋̅ − 𝜇
−𝑧𝛼/2 < 𝜎 < 𝑧𝛼/2
√𝑛
𝜎
Pomnožimo s ,
√𝑛
𝜎 𝜎
−𝑧𝛼 ∙ < 𝑋̅ − 𝜇 < 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Oduzmemo s 𝑋̅,
𝜎 𝜎
−𝑋̅ − 𝑧𝛼 ∙ < −𝜇 < −𝑋̅ + 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Pomnožimo s −1,
𝜎 𝜎
𝑋̅ + 𝑧𝛼 ∙ > 𝜇 > 𝑋̅ − 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
Zamjenom strana nejednakosti dobijemo formulu za interval pouzdanosti:
𝜎 𝜎
𝑋̅ − 𝑧𝛼 ∙ < 𝜇 < 𝑋̅ + 𝑧𝛼/2 ∙
2 √𝑛 √𝑛

Tablica 1.
Tablica 2.
Literatura:
[1] http://people.etf.unsa.ba/~ksokolija/c/ug/pees/definicije.html - preuzeto 9.11.2014.

[2] http://www.phy.pmf.unizg.hr/~bp/statistics.pdf - preuzeto 9.11.2014

You might also like