You are on page 1of 279

STATISTIKA

Prof. dr Rade Tanjga

Banja Luka 2013.

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Izdava
ISA - Informatiki savez Republike Srpske

Za izdavaa
Prof. dr Rade Tanjga, predsjednik

Tehniki urednik
Mitja Tanjga
Naslovna strana
Dragan Drobac

Copyright 2013. ISA, Banja Luka


Nijedan dio ove knjige ne smije se umnoiti, fotokopirati niti reprodukovati
na bilo koji nain bez dozvole izdavaa.

tampa
Grafid Banja Luka

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Predgovor
Knjiga Statistika rezultat je realizacije nastave iz predmeta Statistika na
Banjaluka College u Banjoj Luci.
Knjiga je namjenjena studentima prve godine i kao takva u potpunosti slijedi
nastavni plan i program.
U knjizi je napravljen pokuaj da se statistika posmatra ne samo i nuno kao
matamatika disciplina, ve prije svega kao metodologija i skup alata za
rjeavanje nematematikih problema. Zbog toga su izvoenja i dokazi
pojedinih tvrdnji svedeni na minimum, a panja je usmjerena na nain
statistikog miljenja i povezivanja tog naina miljenja sa strukom
(menadmentom, ekonomijom, raunarstvom i informatikom).
Da bi se ovaj koncept udbenika ostvario svaka izloena cjelina potkrepljena
je sa vie konkretnih primjera. Najvie je primjera iz medicine, to je i
razumljivo s obzirom na autorovo iskustvo u realizaciji nastave za
medicinare u periodu 1998-2010.

U Banjoj Luci, januar 2013.


Autor

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sadraj:
1.
Uvod
1.1. Pojam i definicija statistike
1.2. Razvoj statistike
1.3. Klasifikacija statistike
1.4. Statistika metodologija
1.5. Osnovni statistiki pojmovi
1.6. Uvod u medicinsku statistiku
2.
Deskriptivna statistika
2.1. Prikupljanje podataka
2.1.1. Odreivanje cilja istraivanja
2.1.2. Mjerne skale
2.1.3. Metode prikupljanja podataka
2.2. Sreivanje, grupisanje i prikazivanje podataka
2.2.1. Grupisanje podataka
2.2.2. Tabelarno prikazivanje statistikih podataka
2.2.3. Grafiko prikazivanje statistikih podataka
2.2.4. Dijagrami
2.3. Deskriptivna statistika (statistiko opisivanje)
2.3.1. Relativni brojevi
2.3.2. Mjere centralne tendencije
2.3.3. Mjere varijabliteta
2.3.4. Mjere oblika distribucije
3.
Analitika statistika
3.1. Statistika analiza
3.1.1. Ispitivanje razlike
3.1.2. Greke u zakljuivanju
3.1.3. Jaina, efikasnost i osjetljivost metoda
3.1.4. Analitiki metodi
3.2. Teorijska statistika
3.2.1. Vjerovatnoa
3.2.2. Sluajna varijabla i distribucija vjerovatnoe
4.
Uzorak i statistike uzorka
4.1. Izbor uzorka
4.2. Statistika uzorka
5.
Ispitivanje razlike
5.1. Parametarski metodi za ispitivanje razlike
5.1.1. Zed test
5.1.2. Studentov t-test
5.1.3. Zakljuak
5.2. Neparametarski metodi za ispitivanje razlike
4

6
6
7
9
10
14
18
25
25
25
26
28
30
30
40
47
54
77
77
81
106
124
131
131
136
146
149
151
154
154
175
256
256
271
313
314
314
319
328
329

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

5.2.1. Hi kvadrat test


5.2.2. Primjena hi kvadrat testa kao testa slaganja
5.2.3. Tablice kontigencije
5.2.4. Tablice kontigencije tipa razliitog od 2x2
5.2.5. Ogranienja i uslovi za primjenu hi kvadrat testa
5.2.6. Zakljuak
6.
Regresija i korelacija
6.1. Regresija
6.1.1. Uvod
6.1.2. Regresioni model
6.1.3. Regresiona analiza
6.1.4. Evaluacija regresionog modela
6.1.5. Procjena linije regresije
6.1.6. Predvianje pomou regresije
6.1.7. Linearni trend
6.2. Korelacija
6.3. Opte napomene o upotrebi metoda regresije i korelacije
6.4. Zakljuak
6.5. Korelacija ranga
7.
Statistike tablice
8.
Literatura

330
332
334
347
350
350
351
351
351
351
354
358
375
377
377
380
384
384
385
390
401

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1. Uvod
1.1. Pojam i definicija statistike
Rije statistika, po svim izvorima, najvjerovatnije vodi porijeklo od
latinske rijei status to znai stanje. Najprije se upotrebljavala da oznai
rezultat registrovanja numerikih podataka o posmatranoj pojavi.
Pojam statistika kao naziv nove nauke prvi je sredinom 18. vijeka (1748)
upotrebio Gotfrid Ahenval (Gottfried Achenvall; 1719-1772), profesor
Univerziteta u Getingenu kad je sistemu numerikog opisivanja drave,
njenih funkcija i elemenata, dao naziv statistika.
Od profesora Gotfrida do danas statistika se do te mjere razvila da je
nadmaila svoje prvobitno znaenje. Danas, moderna statistika ima vie
znaenja.
Pod statistikom se, s jedne strane, podrazumijeva rezultat rada statistikih
slubi na prikupljanju, sreivanju, opisivanju i objavljivanju podataka.
S druge strane, statistika podrazumijeva i obuhvata nauno istraivaku
metodologiju i rezultate njene primjene.
Ovdje emo se pozabaviti statistikom kao naunim metodom i
metodologijom istraivanja. Statistika je, kao nauni metod, grana opte
naune metodologije. Meutim, s obzirom na injenicu da je statistika
neophodna u svim naunim istraivanjima i istraivanjima uopte, moe se
slobodno rei da je statistika osnovna grana opte naune metodologije.
U tom smislu, statistika je metod kvantitativnog istraivanja masovnih
pojava. Vodei rauna o injenici da se statistiki metod prilogoava
specifinostima i ciljevima istraivanja naune discipline gdje se
primjenjuje, statistika se moe definisati i kao sistematizovani skup znanja o
statistikim metodama.
Dakle, statistika je, kao nauni metod, grana opte naune metodologije koja
predstavlja sistematizovani skup znanja o statistikim metodama
kvantitativnog istraivanja masovnih pojava.
1.2. Razvoj statistike
Razvojni put statistike, od prapoetaka do danas, veoma je dug i iznosi
priblino oko 6000 godina.
U svom razvoju statistika se najprije razvijala kao potreba organizovanih
drutvenih zajednica - kao praksa.
Statistika praksa, a time i statistika uopte, primijenjivana je kod
prebrojavanja stanovnitva u Kini (4000 godina p.n.e.) i u Egiptu (3000
6

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

godina p.n.e.). Prvi pisani dokument o prvobitnom obliku statistike je


Mojsijeva Knjiga brojeva iz 1200. godine p.n.e.
Stari Grci su u Atini povremeno popisivali stanovnitvo, vojsku i uvoz i
izvoz roba. Meutim, najvanija statistika aktivnost starog vijeka bio je
rimski census koji se sprovodio svake pete godine od 550. godine p.n.e. pa
do sedamdesetih godina nove ere. Cenzus je podrazumijevao registrovaanje
svih slobodnih rimskih graana po broju, polu, starosti, mjestu stanovanja i
imovinskom stanju.
U srednjem vijeku praktino zamire svaka statistika aktivnost a objanjenje
se nalazi u feudalnoj rascjepkanosti Evrope.
Prvi moderni periodini popisi stanovnitva organizovani su u SAD 1790.
godine a nedugo zatim organizuje se stalna statistika sluba koja se bavi
tekuom statistikom a kasnije i anketiranjem.
Tenja da se sa statistike prakse pree na statistiku teoriju javila se ve
poetkom 17. vijeka kad se javljaju dvije statistike kole: njemaka
univerzitetska statistika i engleska politika aritmetika.
Njemaka univerzitetska statistika shvaena je kao dravopis iji je cilj
uspostavljanje sistema obavjetavanja o stanju drave. Osniva
univerzitetske statistike bio je Herman Konring (1606-1881), profesor
Univerziteta u Helmtatu, koji se istovremeno bavio istorijom, pravom i
medicinom.
Engleska Politika aritmetika je u prvi plan svog interesa stavila ne
praktino ve nauno saznanje o drutvu i drutvenim pojavama i njihovim
zakonitostima primjenom matematikih metoda za obradu statistikih
podataka. Osniva ove kole bio je Don Graunt (1620-1674) dugogodinji
gradonaelnik Londona.
Osnivaem savremene statistike smatra se belgijski astronom i statistiar
Adolf Ketle (1796-1874). Osnovna Ketleova zasluga je uvoenje teorije
vjerovatnoe u statistika istraivanja, kao sredstvo kontrole statistikih
ocjena. Uvoenje teorije vjerovatnoe presudno je uticalo na razvoj statistike
jer je omoguilo ne samo da statistika prodre u sve naune oblasti nego i
istraivanje injenica koje se ne mogu obuhvatiti potpunim posmatranjem.
Ovaj Ketleov rad dobio je na znaenju tek poslije njegove smrti. Krajem 19.
vijeka Karl Pirson (1857-1936), biolog i statistiar, razradio je metode
statistikih ocjena na osnovu vjerovatnoe, teoriju distribucija i teoriju
korelacije.
Slijedei Ketleovo i Pirsonovo djelo, u prvoj polovini 20. vijeka, razraena
je metoda uzorkovanja, metoda ocjene podataka iz uzorka i metoda
statistikog eksperimenta. Ovdje se posebno istiu Fier, Goset i Jets.
U drugoj polovini 20. vijeka poseban stimulans brzom razvoju statistike dao
je razvoj i primjena informacionih i telekomunikacionih tehnologija.
7

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1.3. Klasifikacija statistike


Statistika se moe klasifikovati u dvije osnovne kategorije:
evidencionu statistiku;
statistiki metod istraivanja.
Osnovni zadatak evidencione statistike je prikupljanje (registrovanje),
sreivanje, opisivanje (uslovno) i objavljivanje numerikih podataka o nekoj
pojavi.
Kao metod naunih istraivanja statistika se moe klasifikovati u vie
kategorija.
Po osnovnoj klasifikaciji razlikuju se teorijska i primjenjena statistika, Po
drugoj klasifikaciji i jedna i druga statistika mogu biti opte i specijalne,
odnosno, posebne statistike.
Teorijska statistika
Teorijska statistika je velika i veoma razgranata oblast primjenjene
matematike. Ona ima zadatak da formira, objanjava, dokazuje i usavrava
statistike metode.
Opta teorijska statistika bazira se na teoriji vjerovatnoe, a ine je etiri
fundamentalne oblasti:
teorija raspodjela
teorija statistikih ocjena
teorija testova
teorija povezanosti.
Osim opte teorijske statistike postoje i specijalne grane teorijske statistike:
teorija programiranja, teorija diskriminacije itd.
Primjenjena statistika
Ustvari postoje primjenjene statistike koje se koriste za istraivanja u raznim
naunim oblastima i za razne praktine svrhe. Moe ih se definisati kao
teorijske statistike koje su prilagoene specifinostima i potrebama bazine
naune discipline u kojoj se primjenjuju. To znai da postoji onoliko
primjenjenih posebnih statistika koliko ima i oblasti istraivanja.
Pored posebnih primjenjenih statistika postoji i opta primjenjena statistika
koja daje sintezu metodolokog i iskustvenog u primjeni statistike u raznim
oblastima istraivanja.

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1.4. Statistika metodologija


Okolina u kojoj ovjek ivi i radi obiluje mnogim pojavama koje utiu na
njegovu egzistenciju. Do ove konstatacije nije se moglo doi na osnovu
izdvojenog posmatranja malog broja pojava u vremenu i prostoru. Pravilnost
ponaanja i njihova zakonitost uoavala se samo pri posmatranju pojava koje
su se javljale u velikom broju.
Da bi se otkrila brojnost i raznovrsnost ovih pojava, ustanovilo njihovo
porijeklo, saznala njihova sutina, i predvidio njihov uticaj u budunosti
potrebno je, pored naih ula i vlastitog iskustva, koristiti pomone mjerne
instrumente i metode meu kojima najznaajnije mjesto zauzima statistika.
Kao i sve nauke, i statistika ima svoju metodologiju iji principi obezbjeuju
da svako ispitivanje vreno u bilo kom vremenu, na bilo kom mjestu i sa bilo
kojim ciljem prolazi kroz iste i ve usvojene etape rada.
Ovakav nain rada omoguava da se vri usporeivanje rezultata razliitih
ispitivanja.
Svako nauno ispitivanje mora se zasnivati, prije svega, na posmatranju. Kad
se posmatranjem utvrdi postojanje izvjesne pojave, koja se eli ispitivati,
tada se putem usporeivanja, pretpostavki (hipoteza) i drugim metodama
pristupa njenom objanjavanju.
Meutim, postoje razlike izmeu raznih naunih disciplina i one se
odraavaju u samoj metodici ispitivanja i istraivanja pojava u ivoj ili
neivoj prirodi. Bez obzira na te razlike, sva ispitivanja ovih pojava
zasnovana na statistikoj metodologiji podeljena su u tri etape:
statistiko posmatranje ili/i prikupljanje podataka,
sreivanje i grupisanje podataka,
obrada sa statistikom analizom.
Prva etapa: Statistiko posmatranje ili/i prikupljanje podataka
Prva etapa obuhvata plansko i sistematsko registrovanje jedinica posmatranja
koje sainjavaju posmatrani statistiki skup, a sastoji se iz dva dijela.
Prvi se sastoji od niza elemenata kao to su: upoznavanje sa raspoloivim
materijalom slinih ispitivanja, odreivanjem cilja, predmeta, jedinice i
obiljeja posmatranja, a drugi dio se sastoji od organizacije sprovoenja
samog posmatranja i prikupljanja podataka.
Druga etapa: Sreivanje i grupisanje podataka
Druga etapa se sastoji u sistematizovanju prikupljenih statistikih podataka
prema unaprijed dogovorenim obiljejima.
9

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Podaci se grupiu, prebrojavaju i dobijaju statistike serije koje se unose u


statistike tabele a zatim se vri sabiranje po kolonama i redovima.
Na taj nain dobija se slika posmatrane masovne pojave u apsolutnim
brojevima i tako sreeni i grupisani podaci mogu da slue i kao publikacioni
materijal.
Trea etapa: Obrada sa statistikom analizom
Trea etapa sastoji se od upotrebe raznih raunskih operacija kako bi se
izvrila analiza dobijenih statistikih serija.
Apsolutni brojevi se pretvaraju u relativne, vre se poreenja pomou mjera
centralne tendencije (srednje vrijednosti i sl.), mjera varijabiliteta (disperzije
i sl.), izraunava jaina meusobne zavisnosti itd., s ciljem dobijanja uvida u
strukturu pojave koja se posmatrala i odreivanja daljih tendencija stanja i
kretanja pojave.
U ovu etapu spadaju i komplikovanije statistike metode radi testiranja
rezultata pojedinih grupa, vre se razna ocjenjivanja parametara osnovnog
skupa, potvruju, odbacuju, proiruju ili uoptavaju postavljene hipoteze i
raznim grafikim prikazima upotpunjavaju i potkrepljuju izvedeni zakljuci.
Svako statistiko istraivanje ne mora nuno proi kroz sve tri etape. Prikazi
pojedinih podataka pomou tabela, koje se kao takve publikuju, redovno se
zavravaju sa drugom etapom. Koritenje prikupljenog, ali nesreenog i
negrupisanog materijala i njegova analiza ili samo analiza tabelarnog
materijala, predstavljaju drugu i treu ili samo treu etapu. Ali treba uoiti da
postoji povezanost svih etapa rada i da one sainjavaju jednu cjelinu o kojoj
se mora voditi rauna prije nego to se pristupi posmatranju odnosno prvoj
etapi.
U svim primjenjenim istraivanjima navedenu statistiku metodologiju treba
shvatiti kao pomonu, ali ipak nezaobilaznu metodologiju. esti su sluajevi
minimiziranja vanosti ove metodologije u pojedinim primjenjenim
istraivanjima to se u pravilu zavrava na tetu kvaliteta istraivanja. Ova
injenica posebno vrijedi za prvu etapu kod planiranja istraivanja i
eksperimenta. Ne vodei rauna i o statistikoj metodologiji, esto istraiva
dolazi u poziciju da eksperiment planira aposteriorno i time automatski
ugroava validnost ukupnog istraivanja.
Poseban dio statistike metodologije, ili bolje reeno statistike filozofije, je
svijest o grekama. U statistikihm istraivanjima razlikuju se dvije vrste
greaka: greke u radu i greke u zakljuivanju. Greke u radu mogu nastati
u svim etapama statistikog istraivanja i dijele se na sistematske i sluajne.
Sistematske greke su one koje se pri ponavljanju postupka (eksperimenta)
stalno ispoljavaju na isti nain. One su opasnije od sluajnih jer dovode u
pitanje validnost istraivanja.
10

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sluajne greke najee nastaju omakom i pri ponavljanju postupka se


javljaju u oba smisla to uglavnom dovodi do njihovog potiranja.
1.5. Osnovni statistiki pojmovi
Statistika je nauka (nauni metod, skup naunih metoda) koja se bavi
kvantitativnim i kvalitativnim istraivanjem masovnih pojava u cilju njihove
deskripcije, analize i generalizacije zakljuaka.
Deskriptivna statistika opisuje razliite grupe podataka koristei se pri tom
prikupljanjem, sortiranjem, prikazivanjem i raznim matematikim
operacijama za raunanje opisnih (deskriptivnih) parametara.
Inferencijalna statistika (statistika zakljuivanja) donosi zakljuke o
itavom skupu podataka u cilju relevantne procjene stvarnog i budueg
stanja, a na osnovu dijela podataka uzetih iz cjeline.
Predmet posmatranja i prouavanja statistike je statistiki skup. On
predstavlja cjelinu sastavljenu od istovrsnih elemenata sa zajednikim
varijabilnim obiljejem (obiljejima). Statistiki skup mora biti homogen, tj.
sastavljen od istovrsnih i meusobno usporedivih elemenata. On mora biti
varijabilan. Elementi skupa koji su istovrsni nikada nisu istovjetni u odnosu
na zajedniko obiljeje.
Istovrsni elementi statistikog skupa, odnosno karakteristike jedinice
posmatranja, bilo da su kvalitativne ili kvantitativne prirode, nazivaju se
obiljejima. Ona mogu biti atributivna ili numerika, odnosno
diskontinuirana ili kontinuirana.
Atributivna obiljeja ne izraavaju se cifrom tj. brojem. Atributivna obiljeja
mogu se prikazati samo opisno (npr. pol, starost, vrsta proizvoda, ishod
poslovne analize, tip klime, brzina povrata investicije, oblik promjene, boja
proizvoda, konzistencija materijala, intezitet proizvodnje, itd.).
Pod varijacijom, variranjem, odnosno varijabilitetom, podrazumijeva se
promjenjivost obiljeja posmatranja od jedinice do jedinice posmatranja
statistikog skupa. Varijabilnost obiljeja je inherentno svojstvo statistikog
skupa, odnosno, gubio bi se smisao postojanja statistikog skupa ukoliko bi
sve jedninice posmatranja bile jednake.
Varijabla je jedan kvantitet, jedan iznos, jedna vrijednost numerikog
obiljeja (npr. 36,50 C aksilarne temperature), odnosno jedan kvalitet, jedan
vid, jedna kategorija atributivnog obiljeja (npr. normalna aksilarna
temperatura.
11

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Podatak je bilo koja injenica ili zapaanje za koju se unaprijed ne zna da li


e uveati znanje subjektu kome je upuena (koji s njom raspolae). Podatak
je osnovni material, koji se u statistici opisuje i analizira. Generie se
mjerenjima ili prebrojavanjem zbog ega predstavlja i realizaciju neke
sluajno promjenjive veliine.
OBILJEJA

NUMERIKA

ATRIBUTIVNA

KONTINUIRANA

DISKONTINUIRANA

DISKONTINUIRANA

RJEENJE

BROJANJE

OPIS

Slika 1.5.1: Podjela obiljeja statistikog skupa


Statistiko istraivanje je kontinuirani spoznajni proces zasnovan na
odreenoj metodi i proceduri.
Istraivanje se sastoji od:
1. Izbora istraivakog problema (sa pretraivanjem i kritikom
evaluacijom odgovarajue literature u cilju potvrde i definisanja
konteksta istraivakog problema);
2. Definisanja problema i predmeta istraivanja;
3. Formulacija ciljeva i hipoteza istraivanja:
Ciljevi i hipoteze se formuliu s obzirom na relevantne varijable,
istraivake strategije i ogranienja;
4. Istraivaki plan specificira vrste i veliine uzoraka, relevantne varijable,
istraivake strategije, istraivaki dizajn itd;
5. Prikupljanje podataka (sa instrumentima mjerenja i njihovim kvalitetom,
nainima i grekama mjerenja, kao i mjernim skalama dostupnim za
istraivaku procjenu);
6. Eksploracija podataka:
Priprema podataka koja ukljuuje formiranje istraivake baze podataka i
njihovu provjeru sa eventualnom modifikacijom ili transformacijom i
opisivanje podataka alatima deskriptivne statistike;
7. Analiza podataka:
Primjena principa vjerovatnoe u oblasti statistike zakljuivanja i
statistikih modela s ciljem donoenja odluka o tome da li podaci
podravaju eksperimentalnu hipotezu ili model;
12

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

8. Interpretacija i zakljuivanje (koji mogu podrati postojeu teoriju ili


praksu; mogu ukazati da je nova tehnika efektivnija od stare ili mogu
ukazati na nove teotijske koncepte koji bolje opisuju ispitivni fenomen);
9. Saoptavanje rezultata istraivanja:
Da bi nauno istraivanje imalo smisla treba ga publikovati. Publikovano
istraivanje izloeno je metodolokoj kritici i moe biti ponovljeno od
strane drugih istraivaa. Tek tada i takvo istraivanje moe postati dio
naunog znanja.
Eksperimentacija (eksperiment) i opservacija (posmatranje)
Eksperimentacija (eksperiment) se koristi kod dobijanja podataka pri emu
smo prije svega zainteresovani za njihov uzrono-posljedini odnos. U
eksperimentaciji se pretpostavlja da mi izazivamo promjene na subjektu da
bi utvrdili veliinu i uticaj eventualne promjene na njemu.
Observacija (posmatranje) se koristi kod dobijanja podataka kada su u
pitanju samo odnosi, bilo da je rije o povezanosti ili razlikama meu
varijablama.
Uzorkovanje je proces formiranja (reprezentativnog) uzorka:
Uzorak je odabrani podskup osnovnog statistikog skupa (uzorak moe biti
sluajan ili nesluajan, reprezentativna ili nereprezentativan).
Mjerenje je postupak po kome se proizvode podaci kroz opservaciju ili
eksperimentaciju. Teorija mjerenja bavi se odnosom i vezom izmeu
podataka i realnosti. Karakteristike mjerenja su:
Nivo mjerenja - priroda moguih mjerenja meu opservacijama u razliitim
kategorijama.
nominalni nivo mjerenja - nema nivoa mjerenja izmeu
kategorija;
ordinalni nivo mjerenja - opservacije u jednoj kategoriji
usporeuju se relativno sa onima u drugoj;
numeriki - intervalni i omjerni nivo mjerenja - opservacije u
jednoj kategoriji funkcionalno se odnose prema onima u drugoj.
Proces mjerenja definie prirodu dozvoljenog odnosa izmeu opservacija
u istoj kategoriji. Kod diskretnog procesa mjerenja sve opservacije u jednoj
kategoriji predstavljene su istim brojem dok su kod neprekidnog procesa
mjerenja opservacije u jednoj kategoriji predstavljene definisanim
intervalom brojeva.
Uslovljenost mjerenja definie odnos izmeu opservacija u skupovima
kategorija. Razlikuju se: nezavisni odnosi (sve opservacije su usporedive) i
red/kolona zavisni odnosi (mjerenja se obavljena u vie vremena).

13

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Nedostajui podaci (mjerenja nisu obavljena, mjerenja su obavljena ali nisu


zabiljeena).
Skale mjerenja
Postoje etiri tipa skala mjerenja koje se razlikuju po tipu brojeva koje
proizvodi mjerenje specifine varijable (tzv. Stivensova klasifikacija):
Nominalna skala je najjednostavnija i najmanje informativna od svih i
kod mjerenja varijable ukljuuje samo imenovanje, kategorizaciju ili
klasifikaciju njenih moguih vrijednosti. Proizvedena mjerenja su
kvalitativna, a ako se kategorijama dodijeljuju brojevi oni su samo
kodovi i ne predstavljaju stvarne kvantitete. Izmjena vrijednosti
nominalne skale moe se vriti bez gubitka informacije.
Ordinalna skala je sljedei nivo mjerenja koji ukljuuje rangiranje
vrijednosti varijable (prvi, drugi, trei itd.)
Intervalna skala je mjerna skala na kojoj su razlike izmeu sukcesivnih
vrijednosti varijabli uvijek jednake, ali bez apsolutne nulte take.
Omjerna skala pored jednakosti rastojanja izmeu uzastopnih vrijednosti
ima i apsolutnu nulu.
Instrument mjerenja je tehnologija koja se koristi za mjerenja. Postoje
sljedei instrumenti mjerenja:
upitnik,
intervju,
opservacija,
objektivne i subjektivne mjere,
standardizovane mjere i testovi.
1.6. Uvod u statistiku
Interesantan je primjer svjesne primjene statistike u medicini: Statistika je
prvi put upotrebljena svjesno u dokazivanju hipoteze zasnovane na
medicinskim razmatranjima sredinom devetnaestog vijeka. Desilo se to u
porodilitu Beke Akuerske klinike, kada je Ignac Filip Zimelvajs (Ignaz
Philipp Semmelweis, 1818-1865) 1847. godine morao natjerati svoje kolege
da potuju higijenske mjere rada. U to vrijeme jo se nita nije znalo o
patogenim bakterijama (niti o bakterijama uopte) kao o ivim biima koja
uzrokuju bolesti. Bolest od koje su stradale porodilje dobro je bila poznata u
to vrijeme - to je bila puerperalna sepsa.
Zimelvajsov problem bio je u tome to se i poslije uvoenja higijenskih
mjera pri smjetaju porodilja pojavljivala smrtnost. No ona je u toku
prethodnog perioda, od 1840 do 1846 godine, iznosila 10,7%, a ve u prvoj
14

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

godini primjene ovih higijenskih mjera, 1847, pala na 5,2% da bi sljedee,


1848 godine, bila 1,3%.
Zimelvajs je dobro shvatio dvije vane okolnosti. Prvo, smrtnost je znaajno
smanjena i to smanjenje moe se objasniti, moe se shvatiti kao posljedica
uvoenja higijenskih mjera u smjetaju porodilja (Tragajui za ovim
podacima, Leski je utvrdio da je Zimelvajs smrtnost ocjenjivao na osnovu
dovoljnog broja porodilja: 1840-1946 bilo ih je 21120, 1847 ih je bilo 3375,
a u 1848 godini 3556). Zimelvajs se, zahvaljujui statistikoj analizi
uvjerio da je smrtnost porodilja znaajno manja i da je uzrona promjena u
sprovoenju higijenskih mjera smjetaja porodilja. Drugo, puerperalna sepsa
nije iskorjenjena, a to se moe objasniti time da na puerperalnu sepsu, osim
higijenskih mjera, vjerovatno utiu i drugi faktori koji u tom trenutku nisu
bili poznati ili interesantni za istraivanje.
Na ovom primjeru mogu se zapaziti neke osnovne statistike pojave i
definisati osnovni statistiki pojmovi.
Zimelvajs je porodilje posmatrao iskljuivo kao tragina ljudska bia koja
mogu u toku poroaja i neposredno poslije njega umrijeti. Stanje koje se
svodi na to da je porodilja mrtva je relevantna osobina, pored beskonano
mnogo drugih osobina, a koje se mogu zapaati i zabiljeiti kod porodilje.
Ovo stanje - biti mrtav - dato je u punom iznosu. Porodilja ili je mrtva, ili
nije mrtva, odnosno iva je. Nije vano da li je bolesna, da ima visoku
temperaturu, ili bolove. Vano je da nije mrtva. injenica da je bolesnica jo
iva biljei se da kod nje ne postoji stanje relevantno za aktuelno
ispitivanje, odnosno da nije mrtva.
Za manje sretne jedinke, biljei se da je dolo do pojave relevantnog stanja nije vie iva nego je porodilja mrtva. To to je porodilja mrtva, bez obzira
to sadri u sebi neispisani roman ovjekovog ivota i stradanja, svodi itavu
sloenu istoriju na svega jednu, vjetaki izolovanu kategoriju - obiljeje
posmatranja.
Poto je dato u punom iznosu, znai da porodilja ne moe biti mrtvija, niti
meu njima postoje one koje su najmrtvije, ovakvo obiljeje posmatranja
naziva se atributivno ili kvalitativno. Posmatrajmo za trenutak malo bolje
ovo kvalitativno obiljeje. Oigledno je da prethodno mora postojati dogovor
o tano definisanom stanju koje zasluuje atribut mrtav. To je dogovor o
kategoriji unutar koje e se prebrojavati svaki od nosilaca pozitivnog
dogaaja.
Zapazimo da svaka porodilja moe pripadati samo dvjema kategorijama koje
se uzajamno iskljuuju (iv-mrtav). To je karakteristika binomnih
populacija. Statistiki posmatrano, postoji ukupan broj ispitanica koje mogu
biti nosioci jedne od dvije alternativne osobine.
15

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Za sada je zbog odreenih medicinskih razloga bitno da se tano odredi broj


porodilja koje su podlegle sepsi i zbog toga pripadaju kategoriji mrtvih.
Odnos ukupnog broja mrtvih prema ukupnom broju i mrtvih i ivih, tj.
prema ukupnom broju posmatranih porodilja definie empirijsku
vjerovatnou da se pri ponovljenom posmatranju pri istom sticaju okolnosti i
istim uslovima ponovi isti rezultat posmatranja.
Ova vjerovatnoa se opisuje odnosom u kome je brojilac broj mrtvih, a
imenilac ukupan broj posmatranih:
broj mrtvih porodilja
vjerovatnoa P
(broj mrtvih broj ivih) porodilja
Simbol P preuzet je od latinske rijei Probabilitas to znai vjerovatnoa.
Broj mrtvih moe da se smanjuje i da se poveava. Najmanja mogua
vrijednost je 0 (nema niti jednog smrtnog sluaja), tada je vjerovatnoa da se
pri ponovljenom posmatranju opservira isti odnos mrtvih prema svim
ispitanicama jednaka nuli. Najvea vrijednost broja mrtvih moe biti takva,
da sve posmatrane ispitanice podlegnu i da nema niti jedne ive.
Tada e odnos brojnika prema nazivniku u odnosu koji opisuje vjerovatnou
biti tano 1:
sve posmatrane porodilje mrtve
vjerovatnoa P
1
(sve mrtve 0 ivih) porodilja
Prema tome, veliina pokazatelja vjerovatnoe moe da dobije sve
vrijednosti izmeu 0 i 1. To se pie na sljedei nain:
0 P 1,00
a ita pe je jednako ili vee od nule i jednako ili manje od jedan.
U binarnom nainu opisivanja atributivnih obiljeja uobiajeno je da se
oekivani dogaaj oznaava sa p, a ona druga alternativna osobina (suprotan
dogaaj) sa q.
Prema tome, moe se pisati da je:
p+q=1
odakle se lako nalazi da je:
p=1-q
Treba imati u vidu da prihvatanjem definicije o kategoriji kvalitativnog
obeleja nije izbjegnuta promjenjivost koja je opta pojava u prirodi.
ak i takva svojstva kao mrtav podleu diskusiji. Poznato je da se danas
opti dogovor o definiciji mrtav mijenja zbog problema presaivanja
organa. Problem ne mora uvijek dobiti dimenzije sudsko-medicinskog spora.
Na primjer, za nekog ljekara jedan bolesnik moe biti cijanotian, a za
drugog ne. Posebno je zanimljivo da, na primjer, jedan ljekar uje um na
srcu a drugi ne.
Neka atributivna obiljeja, kao hrabrost, agitiranost, sugestibilnost, itd. u
naelu su podlona linim tumaenjima.
16

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ova intrinsina varijabilnost unutar prividno tano definisane kategorije


moe biti razlog za razliiti rezultat ponovljenog statistikog posmatranja.
Ponovimo jo jednom da statistika sa posebnom panjom prouava
znaajnost zapaenih razlika upravo zbog toga to ponekad nije lako ocijeniti
prirodu razlike, odnosno izbjei greku.
Do greke dolazi ako se sluajno nastala razlika proglasi za znaajnu.
Posljedica je to to se ma koji prethodni dogaaj bez osnova proglaava za
uzrok nastale promjene (posljedice). To je tzv. greka prvog reda, kada
stvarno znaajna razlika ostaje neprimijeena - uzrok nastale promjene se
nee otkriti.
Na primjeru Zimelvajsovih razmatranja moe se objasniti jo jedan vaan
statistiki pojam.
Pretpostavka da smrtnost u sve tri ispitivane grupe ispitanica (onih iz
razdoblja 1840-1846, onih iz 1947 i onih iz 1948 godine) nije znaajno
smanjena, nego je do ovih razlika dolo zbog sluajnih kolebanja naziva se
nulta hipnoza.
Ako se ova pretpostavka moe odbaciti, moramo dokazati da je razlika
znaajna: poreene grupe nisu vie iste, nego se u pogledu obiljeja
posmatranja (umiranje od sepse) izmeu sebe sutinski razlikuju i u
Zimelvajsovom sluaju ta razlika je nastala uvoenjem higijenskih mjera
smjetaja porodilja.
Ovako upotpunjena, logina objanjenja promjena koja sadri i uzrok
promjena naziva se radna hipoteza. Dokazna mo radne hipoteze je suverena
i otvorena za dalja usavravanja teorije i sistema kojem pripada.
Ovaj postupak Zimelvajsa izjednauje se sa Liverijeovim otkriem planete
koja jo nije viena, ali je do njenog postojanja ovjek doao utvrujui
znaajna odstupanja susjednih nebeskih tijela od svojih teorijskih putanja.
Statistika suprotstavlja svakoj nultoj hipotezi radnu hipotezu, to znai da
odstupanje od nulte hipoteze mora biti bar u elementarnom smislu vezano za
neki (relevantan) uzrok. Inae u svakom drugom sluaju, statistika ne eli da
se uplie u probleme van domaaja svoje moi nego svaku hipotezu suprotnu
od nulte objanjava kao alternativnu hipotezu.
Dakle, sve porodilje koje su dospjele u posmatranje samo su dio svih
porodilja koje se mogu zamisliti da su postojale i postoje do Zimelvajsovog
doba.
Kada se govori o statistikom posmatranju, u ovom sluaju svih posmatranih
porodilja, jedino okolnost da neke od porodilja nesreno podlijeu sepsi ili
ne predstavlja obiljeje relevantno za statistiko zakljuivanje. Prema tom
obiljeju (podlijee sepsi - ne podlijee sepsi) formiran je osnovni skup ili
populacija. Tri grupe ispitanica obuhvaenih Zimelvajsovim razmatranjem
ine tri uzorka istog osnovnog skupa, ako meu njima nema razlika.
Poto Zimelvajs nije imao na raspolaganju mona sredstva statistike
provjere nulte hipoteze kao to postoje danas (Hi-kvadrat test je Abbe opisao
17

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

jo u osamnaestom vijeku, ali nije se primenjivao sve do poetka


devetnaestog vijeka kada ga je ponovo otkrio Pearson), svoje je razmatranje
zasnivao na elementarnim odnosima teorije vjerovatnoe.
Ovaj rad Zimelvajsa, iako se bitno razlikuje, i metodoloki i konceptualno,
od dananjih statistikih istraivanja na velika vrata uveo je statistiku u
medicinska istraivanja.
Od Zimelvajsa do danas primjenjena statistika (medicinska statistika) dala je
ogroman i nemjerljiv doprinos razvoju medicine. S druge strane medicinske
potrebe bile su veliki motiv i stimulans za razvoj statistikih metoda u
primjenjenom obliku ali i u teorijskom smislu pa se moe rei da je medicina
znaajno i nemjerljivo uticala na razvoj statistikih metoda i statistike
uopte. Gotovo da i nema podruja ljudske djelatnosti za koje ne bi vrijedila
ova tvrdnja.

18

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2. Deskriptivna statistika
Statistike metode istraivanja masovnih pojava mogu se podijeliti u dvije
osnovne grupe. Prva grupa obuhvata metode prikupljanja, sreivanja i
prikazivanja podataka i metode odreivanja parametara skupova podataka.
Ova grupa spada u domen deskriptivne statistike.
Drugoj grupi pripadaju metode statistike analize, iji je osnovni zadatak
objanjenje varijabiliteta pomou klasifikacionih, korelacionih i drugih
statistikih pokazatelja, kao i statistiko zakljuivanje na osnovu uzorka.
Ovim metodama bavi se analitika statistika i statistika zakljuivanja
(inferencijalna statistika), koja se, meutim, ne moe strogo razgraniiti od
deskriptivne statistike.
2.1. Prikupljanje, sreivanje i obrada statistikih podataka
2.1.1. Odreivanje cilja istraivanja
U prvoj etapi statistikog istraivanja rjeavaju se metodoloki problemi
istraivanja. Odreuju se: problem i predmet, cilj i hipotetiki okvir,
jedinice, obiljeja, vrijeme posmatranja, instrumenti istraivanja, eme
grupisanja i obrade i drugo. Prije svega se definie problem i postavlja cilj
istraivanja, jer od njih zavise i metodoloko-tehnike i organizacione
osnove istraivanja.
Problem i cilj se moraju postaviti jasno, konkretno i precizno, kako bi se to
bolje definisali predmet istraivanja, obiljeja i jedinice posmatranja.
Nejasno definisan problem i cilj moe dovesti kako do suvinih pitanja, to
dodatno optereuje i poskupljuje statistiko istraivanje, tako i do isputanja
pitanja neophodnih za dobijanje rezultata zbog kojih se statistiko
istraivanje sprovodi.
Planom prikupljanja podataka odreuju se i definiu modaliteti istraivanja i
dogaaji koji e se obuhvatiti, a u sklopu njihovih definicija i nain mjerenja
i iskazivanja. Mjerenje nije uvijek mogue izvriti sa istom preciznou.
Nivo mjerenja zavisi od prirode same pojave i posmatranih obiljeja. Tako
se uspjeh studenata, na primjer, moe mjeriti i iskazivati opisno (odlian,
vrlo dobar, dobar, dovoljan, slab) ili brojano (10, 9, 8, 7, 6, 5). Radnike
moemo razvrstati na nekvalifikovane (NKV), kvalifikovane (KV), visoko
kvalifikovane (VKV), i (ili) na kvalifikovane, polukvalifikovane i
nekvalifikovane, zavisno od cilja istraivanja. Tjelesnu temperaturu moemo
19

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

klasifikovati kao atributivno obiljeje (normalna, sniena, poviena, visoka)


ili mjereno na mjernoj skali T0 C.
2.1.2. Mjerne skale
Svaki nivo mjerenja ima posebnu skalu sa odreenim jedinicama mjere, pri
emu se uspjenost mjerenja izraava koliinom prikupljenih informacija.
Postoje etiri nivoa mjerenja i etiri mjerne skale: nominalna, ordinalna,
intervalna i skala odnosa ili omjerna skala.
Nominalna skala je najnepreciznija. U ovoj skali brojevi se koriste kod
pojava koje se mogu klasifikovati samo na odreen broj i tip modaliteta.
Tako se klasifikuju pol, brano stanje itd. Modalitete branog stanja moemo
redom oznaiti sa: 1, 2, 3, 4 (neuenjen/neudata sa 1, oenjen/udata sa 2,
udovac/udovica sa 3 i razveden/razvedana sa 4). Broj je upotrebljen kao
simbol i ne iskazuje kvalitet, ve slui za odvajanje i obiljeavanje razliitih
modaliteta. Modaliteti branog statusa mogli su biti navedeni bilo kojim
redom. Izmeu ovih modaliteta ne postoji obavezan radoslijed, ali se oni
meusobno iskljuuju. Mjerenje se svodi na razvrstavanje po odreenoj emi
- na klasifikaciju.
Za atributivna obiljeja koja imaju veliki broj modaliteta (zanimanje, uzrok
smrti, naziv bolesti itd.) razvrstavanje (klasifikacija) se vri u srodne grupe u
okviru posmatranog obiljeja. Jednoobrazno utvreni nazivi grupa i
podgrupa nazivaju se nomenklature (nomenklatura djelatnosti, nomenklatura
robe, nomenklatura uzroka smrti, nomenklatura bolesti (Meunarodna
klasifikacija bolesti 10. Revizija, nomenklatura zanimanja, itd.).
Ordinalna skala svodi mjerenje modaliteta na njihovo rangiranje po znaaju
s obzirom na usvojene kriterijume i to brojevima koji oznaavaju rang, ali ne
pokazuju veliinu njihovog razlikovanja. Tako, na primjer, lokaciju
prodavnica moemo oznaiti kao: izuzetno povoljnu, povoljnu, osrednju,
nepovoljnu i izuzetno nepovoljnu ili ove modalitete rangirati poevi od
rednog broja 1 za izuzetno povoljnu pa do rednog broja 5 za izuzetno
nepovoljnu lokaciju.
Na ovaj nain dobija se redoslijed znaaja pojedinih modaliteta, prvi je bolji
od drugog (ili obratno), Meutim ni ova skala ne omoguava sagledavanje
mjere razlikovanja pojedinih modaliteta. Drugi po rangu moe se razlikovati
mnogo vie od prvog po rangu nego trei od drugog itd. Relativan znaaj
pojedinih modaliteta zavisi i od samog broja modaliteta.
Na primjeru lokacija to bi znailo da je peta lokacija istovremeno i najgora.
Meutim, ukoliko je broj modaliteta, na primjer 100 rangiranih poevi od
najboljeg ka loijem, peti u rangu bio bi u ovom sluaju meu najboljima.
20

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Intervalna skala prikazuje istovremeno redoslijed modaliteta i mjeru


njihovog razlikovanja. Intevalnu skalu karakterie odreena jedinica mjere,
na primjer, za kalendarsko vrijeme, za potencijalnu energiju, za temperaturu
itd. Skala na termometru pokazuje kolika je temperatura u datom tenutku, a u
usporedbi sa prethodnim mjerenjem moe se vidjeti kolika je apsolutna
razlika razultata mjerenja: za deset stepeni vie, za pet stepeni manje itd.
Meutim, veliine jedinica intervalne skale ne moraju biti jednoznano
odreene, ve se biraju po nekom kriterijumu. Moe postojati vie razliitih
intervalnih mjera za mjerenje iste veliine. Tipian primjer je mjerenje
temperature (Celzijusova i Farenhajtova skala), gdje se kod svake skale nula
nalazi na razliitoj fizikoj temperaturi i gdje temperaturne jedinice nisu
meusobno jednake. Ovakvih primjera ima vie kod usporedbe metrikog i
anglosaksonskog sistema mjerenja.
Skala odnosa (omjerna skala) daje najvii nivo mjerenja. Ona obezbjeuje
znaenje bilo kog odnosa mjernih objekata, kao to su: visina u
centimetrima, tjelesna masa u kilogramima, starost u godinama, prihod u
konvertibilnim markama i sl. Omjernu skalu ne karakterie samo upotreba
jedinice mjerenja nego i prava nulta taka. injenica da je termometar na
nuli (intervalna skala) ne znai odsustvo temperature.
Meutim, kad se kod omjerne skale vaga zaustavi na nuli to znai da nema
mase. Omjerna skala doputa izraavanje proporcionalnog odnosa modaliteta
koji se mjere. Na primjer, pakovanje eera koje ima tri puta vie mjernih
jedinica od drugog pakovanja tri puta je tee. Ova skala je, prema tome,
najpreciznija.
esto se i intervalna i omjerna skala nazivaju i kardinalnim skalama.
2.1.3. Metode prikupljanja podataka
Da bi se saznale karakteristike ranije definisanog statistikog skupa, bira se
ona metoda posmatranja (prikupljanja podataka) koja e sa najmanje
trokova obezbjediti traene rezultate. To znai da se za svaku statistiku
akciju treba odabrati najefikasnija metoda.
Pojava koja se istrauje moe se posmatrati na svim jedinicama statistikog
skupa (potpuno posmatranje) ili samo na jednom njegovom dijelu
(djelimino posmatranje). Potpuno posmatranje ostvaruje se, uglavnom, u
vidu statistikih popisa i u vidu tekue registracije (statistiki izvjetaji). U
prvom sluaju radi se o utvrivanju stanja pojave (popis stanovnitva) u
jednom momentu a u drugom sluaju radi se o kontinuiranom praenju
pojave. Od metoda (tehnika) koje stoje na raspolaganju za realizaciju
statistikog posmatranja razlikuju se: statistiki popis, statistiki izvjetaj i
statistiki uzorak.
21

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Statistiki popis je takav oblik posmatranja pri kojem se obuhvataju sve


jedinice posmatranja jednog statistikog skupa u odreenom momentu koji
se naziva kritini momenat. Vremenski intervali izmeu popisa su
relativno veliki (popis stanovnitva svakih deset godina).
Statistiki izvjetaj obezbjeuje snimanje promjena statistikog skupa u
sukcesivnim vremenskim intervalima. Statistike izvjetaje sprovode
izvjetajne jedinice na statistikim upitnicima i u rokovima koji su propisani
metodolokim uputstvima statistikih organa koji organizuju odreenu
statistiku izvjetajnu slubu.
Statistiki uzorak se primjenjuje po pravilu kao zamjena ili dopuna popisne
metode posmatranja, ali i kao zamjena za izvjetajnu metodu. Osnovni
problemi koji se moraju rijeiti kod statistikog uzorka su: izbor vrste
uzorka, nain izbora jedinica u uzorak, veliina uzorka.
Bez obzira na metodu koja se primijenjuje kod statistikog posmatranja,
vano je obezbjediti jednoobrazno prikupljanje podataka. Jednoobraznost se
obezbjeuje izradom odgovarajuih upitnika (unaprijed pripremljenih) kod
kojih su zastupljana sva pitanja (mjerenja) koja su od interesa za posmatranu
pojavu i istraivanje.
2.2. Sreivanje, grupisanje i prikazivanje podataka
Sreivanje i osnovna obrada prikupljenih podataka veoma je obiman, a u
organizaciono-tehnikom smislu veoma sloen posao. Zbog efikasnosti u
radu potrebno je izraditi plan sreivanja statistikog materijala kojim se
predvia tehnika sreivanja i rokovi. Sreivanje statistikog materijala dijeli
se na centralizovano, decentralizovano i kombinovano, to zavisi od prirode
pojave, mjesta sreivanja itd.
Kao rezultat sreivanja statistikog materijala dobijaju se statistike serije,
koje se mogu definisati kao nizovi sreenih statistikih podataka koji
prikazuju strukturu skupa po nekom obiljeju, ili raspored skupa u prostoru,
ili promjenu skupa u vremenu.
2.2.1. Grupisanje podataka
Da bi se prikupljeni materijal mogao koristiti u svrhe statistikog istraivanja
treba ga uiniti preglednim.
Da bi se bolje shvatio problem preglednosti uzmimo primjer istorija bolesti
pacijenata u ambulanti porodine medicine. Svi podaci oubiajeno se nalaze
u zdravstvenom kartonu pacijenta. Nazvan je zdravstveni karton zato to su
22

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

na i u kartonskom omotu smjeteni svi podaci o svakom pacijentu


ukljuujui:
- Demografske podatke: godina roenja, pol, ime i prezime,
jedinstveni matini broj, broj osiguranja, struna sprema, zanimanje,
podaci o zaposlenju itd.;
- Anamnestike podatke: lina anamneza, porodina anamneza,
socijalna anamneza, profesionalna anamneza itd.;
- Faktore rizika: pretilost, status zavisnosti (droga, duvan, alkohol,
alergijski status, fizika aktivnost, osjetljivost na stres itd.;
- Podaci o posjetama porodinom ljekaru;
- Laboratorijski nalazi;
- Specijalistiki nalazi itd.
Za potrebe pojedinanog rada s pacijentima doktor mara imati sve podatke o
pacijentu u zdravstvenom kartonu (elektronskom zapisu). Meutim, za
potrebe bilo koje vrste istraivanja, koja u principu posmatra pacijenta u
srednjem, odnosno tipinog pacijenta, jasno je po sebi da takvi podaci za,
na primjer, 2000 pacijenata ne mogu biti pregledni ako ih posmatramo
pojedinano. Treba ih uiniti preglednim. Zbog toga (preglednosti) kao
logino se postavlja pitanje (zadatak): Moemo li sve relevantne podatke za
sve pacijente svrstati na jedan papir A4 formata? Ako u tome uspijemo
podatke emo napraviti preglednima jer ih istraiva moe obuhvatiti
jednim pogledom. Pokuajmo odgovoriti na ovo pitanje!
Preglednost prikupljenog materijala postie se prije svega metodom
grupisanja. Grupisanje je od velikog znaaja u statistici jer osigurava
sprovoenje svih ostalih statistikih metoda. Pravilno grupisanje je osnov
objektivnog uvida u postojee stanje. U skladu sa ciljem istraivanja ono
istie znaajne injenice i na taj nain omoguava pravilno ocjenjivanje u
daljem statistikom radu.
Da bi grupisanje podataka bilo ispravno treba se drati osnovnih pravila
grupisanja: sveobuhvatnost, sistematinost i odreenost.
Sve jedinice statistikog skupa moraju biti obuhvaene grupisanjem.
Raspored jedinica posmatranja unutar skupina (grupa) dobijenih grupisanjem
kao i skupina unutar cjeline, tj. statistikog skupa, treba da bude povezan u
skladan (logiki ili numeriki) sistem. Homogenost je maksimalno izraena
unutar skupina dobijenih grupisanjem, a odnos samih skupina meu sobom
mora da doputa kvalitativnu i kvantitativnu diferencijaciju, ako je
grupisanje pravilno izvedeno.
Grupisanje je metoda razvrstavanja jedinica posmatranja statistikog skupa u
grupe ili grupne intervale. Svrstavanje jedinica posmatranja u grupe odnosno
23

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

grupne intervale je saglasno specifinostima karakteristika jedinica


posmatranja odnosno obiljejima.
Jedinice posmatranja koje su nosioci numerikih kontinuiranih obiljeja
razvrstavaju se u grupne intervale gradacija ovog obiljeja. Pri formiranju
grupnih intervala potrebno je drati se osnovnih pravila i redosljeda.
Prvi korak je utvrivanje minimalne i maksimalne vrijednosti empirijskih
podataka da bi sve vrijednosti statistikog skupa bile obuhvaene
grupisanjem. Nadalje, pravei razliku maksimalne i minimalne vrijednosti
utvrdi se koliki je raspon vrijednosti jedinica posmatranja. Na osnovu
izraunatog raspona i prirode ispitivane pojave utvruje se irina grupnog
intervala.
Ukoliko je manji broj grupnih intervala, tj. ukoliko su intervali vei dobija se
u preglednosti, ali se gubi u informaciji i obratno. Rjeenje je kompromis i
treba omoguiti solidnu preglednost i dovoljno dobru informaciju.
No bez obzira na njihov broj, potrebno je da grupni intervali budu jednake
irine da bi bili meusobno usporedivi.
Kada se odrede ekstremne vrijednosti i odredi irina grupnog intervala
prelazi se na odreivanje granica intervala. Svaki interval razumljivo ima
dvije granice, donju i gornju. Donja granica prvog intervala, koja obavezno
mora da sadri minimalnu empirijsku vrijednost, treba da bude broj koji je
djeljiv sa irinom intervala. Na primjer, ako je irina grupnog intervala tri
mjerne jedinice donja granica prvog intervala mora biti djeljiva sa tri, ili ako
je irina grupnog intervala 5 mjernih jedinica donja granica prvog intervala
bie broj koji se zavrava sa 5 ili nulom, itd. Opte pravilo je da donja
granica prvog intervala bez obzira na irinu intervala moe da pone nulom.
Granice intervala moraju biti jasno razgraniene. Donja granica aktuelnog
intervala mora biti za jedinicu mjere vea od gornje granice prethodnog
intervala. Gornja granica posljednjeg intervala odreuje se sa istom tanou
sa kojom su vrena mjerenja. Na primjer, ako su empirijski podaci dati u
cijelim brojevima jedinice mjere i irina intervala e se formirati sa cijelim
brojevima odnosno ako su empirijske vrijednosti mjerene sa jednom, dvije ili
tri decimale mjerne jedinice i irina intervala bie odreena sa jednom, dvije
ili tri mjerne jedinica respektivno.
Primjer 1.
Trajanje kompletne remisije kod 35 bolesnika od ANL (akutne
nelimfoblastne leukemije) iznosilo je 12, 5, 10, 32, 11, 4, 14, 14, 6, 14, 9, 3,
4, 17, 9, 23, 38, 2, 8, 1, 3, 6, 24, 34, 12, 12, 6, 3, 5, 10, 11, 3, 1, 7 i 26
mjeseci. Grupisati date podatke.

24

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Problem rjeavamo tako da formiramo radnu tabelu u kojoj je prva kolona


interval (duina remisije), druga kolona pojedinaan nain zapisivanja
podataka o svakom sluaju, a trea kolona uestalost podataka u intervalu
(frekvencija).
Tabela 2.2.1.1.a: Grupisanje prema duini remisije grupisanje sa irinom
intervala od 6 mjeseci
Duina remisije Broj bolesnika
06
///// ///// ////
7 12
///// /////
13 18
/////
19 24
//
25 30
/
31 36
//
37 42
/
Ukupno
------------

(f)
14
10
5
2
1
2
1
35

Tabela 2.2.1.1.b: Grupisanje prema duini remisije grupisanje sa irinom


intervala od 10 mjeseci
Duina remisije Broj bolesnika
0 10
///// ///// ///// /////
11 20
///// ////
21 30
///
31 40
///
Ukupno
------------

(f)
20
9
3
3
35

Tabela 2.2.1.1.c: Grupisanje prema duini remisije grupisanje sa irinom


intervala od 5 mjeseci
Duina remisije Broj bolesnika
05
///// ///// /
6 10
///// ///
11 15
///// ///
16 20
/
21 25
//
26 30
/
31 35
//
36 40
/
Ukupno
------------

(f)
11
8
8
1
2
1
2
1
23

Granice intervala date su cijelim brojem to je u saglasnosti sa empirijskim


podacima. Minimalna vrijednost je 1, maksimalna 38, raspon 37 mjeseci, a
irina grupnog intervala 6 mjeseci. Donja granica prvog intervala poinje
25

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

nulom. Kod sva tri sluaja grupisanja postupak je ispravan, ali se postavlja
pitanje koju irinu intervala odabrati. Kad su u pitanju jedinice posmatranja
koje podlijeu dekadskom zakonu prirodno je odabrati interval koji odgovara
dekadskoj mjeri, dok vrijeme treba uzimati sa intervalima vremenskih
jedinica itd.
Primjer 2.
Grupisati vrijednosti hemoglobina 10 zdravih osoba: 150,5 - 170,2 - 130,8 160,2 - 120,3 - 160,5 - 150,7 - 160,7 - 140,2 gr/l.
Tabela 2.2.1.2: Grupisanje hemoglobina grupisanje sa irinom intervala od
20 gr/l.
Hemoglobin
120,0 - 130,9
140,0 - 150,9
160,0 - 170,9
Ukupno

Broj osoba
//
///
/////
-----------

(f)
2
3
5
10

U primjeru 2, empirijski podaci dati su sa tanou od jedne decimale pa su i


granice intervala ija irina iznosi 20 gr/l utvrene sa tanou jedne
decimale. Ova irina intervala odreena je na osnovu irine raspona od 49,9
gr/l. Donja granica prvog intervala poinje vrijednou manjom od
minimalne empirijske vrijednosti (120,3 gr/l), koja je djeljiva sa 2 tj. irinom
intervala.
Broj intervala odreen je tako da posljednji trei interval obuhvata
maksimalnu empirijsku vrijednost (170,2 gr/l).
Jedinice posmatranja koje su nosioci numerikih diskontinuiranih obiljeja
razvrstavaju se u grupne intervale ili grupne gradacije numerikog
diskontinuiranog obiljeja. Kada diskontinuirano numeriko obiljeje ima
veliki raspon vrijednosti, jedinice posmatranja se svrstavaju u grupne
intervale (primjer 3).
Primjer 3.
Grupisati vrijednosti eritrocita 20 zdravih osoba.
Vrijednosti iznose:
4,125 - 4,250 - 4,580 - 4,345 - 4,680 - 4,080 - 4,460
4,290 - 4,830 - 4,950 - 4,620 - 4,390 - 4,690 - 4,425
5,050 - 4,680 - 4,750 - 4,790 - 4,520 - 4,490 x 1012/1.

26

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Tabela 2.2.1.3: Grupisanje eritrocita grupisanje diskontinuiranog


numerikog obiljeja sa irinom intervala od 0,20 x 1012/l.
Broj eritrocita
4,00 - 4,19
4,20 - 4,39
4,40 - 4,59
4,60 - 4,79
4,80 - 4,99
5,00 - 5,19
Ukupno

Broj osoba
//
////
/////
///// /
//
/
----------------

(f)
2
4
5
6
2
1
20

Grupni intervali numerikog diskontinuiranog obiljeja dati su uvijek cijelim


brojevima jer ovo obiljeje moe da uzima samo cijele vrijednosti iz brojnog
intervala u kome varira.
Ukoliko numeriko diskontinuirano obiljeje ima mali broj vrijednosti tj.
mali raspon, jedinice posmatranja razvrstavaju se u grupe koje odgovaraju
pojedinim vrijednostima obiljeja (primjer 4).
Primjer 4.
Grupisati podatke prema broju spontanih pobaaja 50 sluajno izabranih
ginekolokih pacijentica:
0, 0, 0, 1, 0, 0, 2, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 2, 0, 0, 0, 1, 0, 0, 0, 2, 0, 0,
3, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0.
Tabela 2.2.1.4: Grupisanje spontanih pobaaja grupisanje diskontinuiranog
numerikog obiljeja sa malim brojem vrijednosti irina interval ne postoji,
postoje grupe iji broj odgovara broju modaliteta (pobaaja)
Broj pobaaja
0
1
2
3
Ukupno

Broj pacijentica
///// ///// ///// /////
///// ///// ///// ///
///// ///
///
/
-------------

27

(f)
38
8
3
1
50

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ako su jedinice posmatranja nosioci atributivnih obiljeja razvrstavaju se u


grupe koje su u skladu sa kvlitativnom diferencijacijom obiljeja. Ove grupe
odgovaraju kategorijama odnosno vidovima atributivnog obiljeja (primjer
5).
Primjer 5.
Celularni imunitet kod 8 bolesnika od reumatiodnog artritisa ispitivan je
konim testovima sa antigenima PPD, SK-SD (streptokinaza,
streptodornaza) i DM-O (Dermatofitin-0). Prikazati broj pozitivnih reakcija
u zavisnosti od vrste testa. Pozitivna reakcija je infiltrat vei od 5/5 mm.
Rezultati testova su:
PPD: 100/100, 0, 12/15, 15/10, 10/10, 10/10, 20/20, 15/15 mm.
SK-SD: 100/120, 10/10, 10/10, 0, 0, 0, 0, 20/15 mm.
DM-0: 0, 0, 5/5, 0, 5/5, 30/25, 7/7, 10/10 mm.
Tabela 2.2.1.5: Grupisanje celularnog imuniteta prema vristi pozitivnih
reakcija na pojedine testove broj grupa odgovara broju testova
Vrsta tijela
PPD
SK SD
DM D
Ukupno

Broj pozitivnih
reakcija
///// //
////
/////

(f)
7
4
5
16

Razvrstavanje jedinica posmatranja u grupe ili grupne intervale izvreno je


pomou crtica po sistemu jedna horizontalna na etiri vertikalne.
Ovakav nain razvrstavanja jedinica posmatranja (prikazan kroz primjere 15) je najjednostavniji ali i najmanje pouzdan i pogodan nain sortiranja
podataka. Primjenjiv je samo u sluaju malog statistikog skupa.
Ukoliko je broj jedinica posmatranja veliki pogodniji su drugi naini runog
ili mainskog (raunarskog) sortiranja.
Broj jedinica posmatranja koje odgovaraju jednom kvalitetu, u vidu
atributivnog obeleja, zove se uestalost odnosno frekvencija i obiljeava
se simbolom f. Apsolutna frekvencija je rezultat objektivnog posmatranja,
brojenja ili mjerenja empiriskih podataka. Ona se izraava u mjernim
jedinicama empiriskih vrijednosti. Ako se apsolutna frekvencija jednog vida
atributivnog obiljeja ili jednog iznosa numerikog obiljeja stavi u odnos
prema ukupnom broju jedinica statistikog skupa dobija se relativna
frekvencija. Ona se izraava u vidu decimalnog broja ili ee procenta. I
apsolutna i relativna frekvencija mogu biti kumulativne. Kumulativne
28

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

frekvencije predstavljaju sukcesivne zbirove frekvencija pojedinih grupa


odnosno grupnih intervala. Ako je u pitanju numeriko obiljeje kumulisanje
moe poeti od grupe ili grupnog intervala sa najniim ili pak s najviim
vrijednostima obiljeja (rastua i opadajua kumulativna funkcija). Kod
atributivnog obiljeja kumulisanje se vri po logikom sistemu progresije tog
obiljeja. Bez obzira na poetak kumulisanja, frekvencija svake sukcesivne
grupe ili grupnog intervala dodaje se prethodnim tako da je posljednja
kumulativna frekvencija jednaka sumi svih frekvencija.
Primjer 6.
Distribucije frekvencija umiranja 17 bolesnika od aplastine anemije u
periodu od est mjeseci.
Tabela 2.2.1.6: Distribucija frekvencija (uestalosti) umiranja bolesnika od
aplastine anemije
Mjeseci
0,0 1,0
1,1 2,0
2,1 3,0
3,1 - 4,0
4,1 - 5,0
5,1 - 6,0
Ukupno:

Apsolutne frekvencije
Pojedinane
Kumulativne
4
4
6
10
3
13
2
15
1
16
1
17
17
/

Relativne frekvencije
Pojedinane
Kumulativne
0,235
0,235
0,353
0,588
0,176
0,764
0,118
0,882
0,059
0,941
0,059
1
1
/

Prikaz rasporeivanja jedinica posmatranja statistikog skupa po grupama ili


grupnim intervala obiljeja naziva se distribucija frekvencija odnosno
raspodjela uestalosti. Distribucija frekvencija omoguuje sagledavanje
strukture ispitivane pojave usporeivanjem frekvencija pojedinih grupa ili
grupnih intervala kao dijelova pojave sa cjelinom tj. ukupnim brojem
jedinica posmatranja statistikog skupa.
Nizovi jedinica posmatranja statistikog skupa sreeni u grupe ili grupne
intervale obiljeja nazivaju se statistikim serijama. S obzirom na vrstu
obiljeja razlikujemo atributivne i numerike statistike serije. Ako su
jedinice posmatranja ureene u odnosu na numeriko obiljeje u pitanju su
numerike variacione serije. Posebne vrste statistikih serija su vremenske i
prostorne statistike serije. Vremenske serije, koje su formirane po obiljeju
vremena bilo da je ono izraeno u numerikoj ili atributivnoj formi, bitne su
za ispitivanje dinamike pojave. Prostorne statistike serije, nastale kao
rezultat ureivanja jedinica posmatranja statistikog skupa po obiljeju
prostora, koriste u upoznavanju prostorne distribucije frekvencija.
29

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2.2.2. Tabelarno prikazivanje statistikih podataka


Svrha prikazivanja statistikih podataka je brz i lak uvid u rezultate
prikupljanja i grupisanja u cilju publikovanja ili dalje statistike obrade
(deskripcije i analize). Statistiki podaci prikazuju se u tabelarnoj i grafikoj
formi. Tabeliranje je pregledno prikazivanje, prethodno grupisanih podataka,
tabelom. Statistika tabela mora sadravati naslov, redni broj, emu i izvore
podataka. Naslov tabele sastoji se od tanog i detaljnog opisa predmeta,
mjesta i vremena ispitivanja (odnosno registrovanja podataka i izvora
podataka). Redni broj tabele obino se nalazi izmeu naslova i eme tabele.
ema tabele mora biti po obliku maksimalno prilagoena sadraju tabele.
Ona ima oblik pravougaonika ili kvadrata izdijeljenog horizontalnim ili
vertikalnim linijama na manja polja koja se nazivaju elije (cells). Vertikalni
nizovi elija ine kolone, a horizontalni redove. ematski dio tabele sastoji
se od pretkolone, zaglavlja, srca tabele i zbirnih elija. Predkolonu sainjava
prva kolona, a zaglavlje prvi dio elija. Predkolonom i zaglavljem dat je
taan opis obiljeja i njegovih grupa, odnosno one sainjavaju opisni dio
eme. Numerisani redovi i kolone rubrika, koji ine srce tabele i mogu se u
cilju isticanja odvojiti od ostalog dijela tabele debljom ili dvostrukom
linijom, sadre konkretne numerike podatke. Zbirne elije, odnosno elije u
kojima su rezultati sumiranja podataka iz srca tabele zauzimaju posljednji
red i posljednju kolonu tabele. One moraju biti oznaene razliitim izrazima
(npr. ukupno i svega). to se tie izvora podataka uobiajeno je da se oni
navode ispod eme tabele.
Na narednoj slici dat je izgled tabele koja se dobija iz Excela. Na njoj je
prikazan prostor za tabelu u uem smislu (veliki pravougaonik) i prostor za
opis tabele sa est malih pravougaonika.
Rezervisani prostor za opis tabele dijeli se na zaglavlje (header) i podnoje
(footer), a svaki od njih ima tri mogunosti za opis tabele (lijevi, centralni i
desni pravougaonik).

30

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
Zaglavlje: Lijevi dio

Zaglavlje: Centralni dio

Zaglavlje: Desni dio

Tabela: Radni dio

Podnoje: Lijevi dio

Podnoje: Centralni dio

Podnoje: Desni dio

Slika 2.2.2.1: Izgled tabele dobijene iz Excela


Na narednom prikazu daje se tradicionalni nain izrade tabele.
Tabela 2.2.2.1: Klasian izgled tabele moe se praviti runo ili pomou
raunara (uobiajen izgled do pojave sprerad sheet alata (Excel i sl.)
Naziv tabele

Predkolona

Tabela br.

Kolona

Redni broj reda

Naziv institucije
ZAGLAVLJE
Redni broj kolone
Red

Zbir po redovima

Rubrika

Zbir po kolonama

Ukupan zbir

Izvor podataka

Potpis

Primjer 1.
Kod dvadeset sluajno izabranih bolesnika hematolokog odjeljenja Interne
klinike pregledom krvi utvreno je sljedee pripadnitvo krvnim grupam
AB0 i Rh sistema: od 14 Rh pozitivnih 5 bolesnika imalo je 0, 3 A, 4 B i 2
AB grupu, a od 6 Rh negativnih krvnu grupu 0 imalo je 2, A 2, B 1 i AB 1
bolesnik. Dobijene rezultate prikazati tabelom.

31

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Tabela 2.2.2.2: Distribucija bolesnika hematolokog odeljenja Interne klinike


po krvnim grupama.
Redni
broj
0
1
2
3

Rh
1
Pozitivni
Negativni
Svega

0
2
5
2
7

Krvne grupe
A
B
3
4
3
4
2
1
5
5

AB
5
2
1
3

Ukupno
6
14
6
20

Kod klasinih tabela uobiajeno je da se formira drugi red odozgo (0, 1, 2, 3,


4, 5, 6) koji iznaava redni broj kolone, a slui(o je) kao skraeno zaglavlje
za prenos (nastavak) tabele na sljedeu stranu. Kod tabela uraenih pomou
softverskih alata, takva vrsta oznaavanja zaglavlja nije uobiajena.
Da bi ispunila svoj zadatak tabela mora da bude:
a) Pregledna, tj. ne smije da bude suvie opirna, odnosno mora da ima
ogranien broj redova i kolona;
b) Jasna i razumljiva, odnosno oznake u predkoloni i zaglavlju moraju biti
precizne i detaljne; Treba izbjegavati skraenice. Ako su skraenice
neizbjene potrebno je da budu tipine i meunarodno prihvaene. Kod
netipinih skraenica, neposredno ispod tabele, potrebno je napraviti legendu
u kojoj se objanjavaju skraenice;
v) Potpuna, to znai da svaka elija mora biti popunjena bilo brojem ili
odgovarajuim znakom u sluaju kada broj nedostaje iz bilo kojih razloga.
Ako se upotrebljavaju znakovi koji nisu standardizovani potrebno ih je u
legendi dodatno objasniti;
g) Tehniki dobra i pravilna, to znai da mora biti po obliku, veliini
rubrika i njihovom odnosu prilagoena sadraju tj. veliini brojeva, znakova
i opisa.
Tabele se prema sadraju dijele u dvije grupe. Prvu grupu ine prosta i
sloena tabela. Proste tabele su one koje sadre samo jednu statistiku seriju,
a sloene dvije ili vie statistikih serija. Prema tome prva podjela izvrena
je u odnosu na broj statistikih serija za razliku od druge gde je kao osnov za
klasifikovanje uzet broj i ralanjenost obiljeja. Drugu grupu tabela ine
elementarne i kombinovane tabele. Ukoliko je tabelom prikazano jedno
ralanjeno obiljeje, takvu tabelu nazivamo elementarnom. Kombinovane
tabele sadre podatke koje se odnose sa dva ili vie ralanjenih obiljeja.
S obzirom na ulogu koju imaju u statistikim istraivanjima tabele dijelimo
na obradne, analitike i publikacione. Svaka od njih je po obliku i sadraju
32

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

prilagoena svrsi. Za razliku od obradnih i velike veine publikacionih


tabela koje sadre uglavnom apsolutne brojeve, analitike tabele sadre
gotovo sve vrste statistikih parametara (relativne brojeve, srednje
vrijednosti, mjere varijabiliteta itd.).
Primjer 2.
Za date pojedinane podatke, prikazati distribuciju bolesnica sa primarnim
karcinomom grlia materice po stadijumima bolesti na poetku lijeenja.
Tabela 2.2.2.3: Distribucija bolesnica sa primarnim karcinomom grlia
materince po stadijumima bolesti na poetku lijeenja
Red. br.

Stadijum

0
1
2
3
4
5

1
Prvi
Drugi
Trei
etvrti
Ukupno

Broj
bolesnica
2
5
90
87
182

Tabela sadri jednu statistiku seriju pa prema tome pripada grupi prostih
tabela. Istovremeno ona je i elementarna tabela jer je obeleje (oboljenje)
ralanjeno u grupe (stadijumi).
Primjer 3.
Tabela 2.2.2.4: Distribucija oboljenja studenata registrovana u Zavodu za
mentalno zdravlje u Beogradu u periodima 1968/71. i 1972/75. godine.
Redni broj

Dijagnoza

0
1
2
3
4
5
6

1
Neuroze
Psihoze
Psihosomatski poremeaji
Epilepsija
Druge dijagnoze
Svega

Period
Prvi
Drugi
2
3
835
1243
61
54
252
283
1
28
716
938
1865
2546

Ukupno
4
2078
115
535
29
1654
4411

Tabela sadri vie statistikih serija (3) i pripada sloenim tabelama.


Meutim, kako sadri podatke koji se odnose na vie ralanjenih obiljeja
(2) ujedno je i kombinovana tabela.

33

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2.2.3. Grafiko prikazivanje statistikih podataka


Statistike tabele, ma kako precizno i pravilno sastvaljene ipak zahtjevaju
dosta vremena i panje za tumaenje odnosno uoavanje onoga to je bitno.
Mnogo lake i bre se uoavaju rezultati grupisanja pomou grafikog
prikazivanja. Grafiko prikazivanje je metod prikazivanja grupisanih i
tabelarnih podataka u vizuelnoj formi.
Znaaj upotrebe grafikih prikaza u statistikim istraivanjima objanjava se
injenicom da je usporeivanje veliina pomou slika jasnije nego pomou
brojki. Slika upadljivije istie razlike u veliinama i oblike raznih odnosa.
Meutim, mora se posebno naglasiti da se crteom ne moe zamijeniti tabela
ve da crte ilustruje tabelu. Grafiki prikaz samo je veoma korisna dopuna pomono sredstvo koje slui da se u cjelini sagleda posmatrana pojava dok
se njeni unutranji odnosi mogu vidjeti samo iz statistike tabele koja sadri
osnovne podatke.
Grafike prikaze dijelimo u dvije velike grupe prema tome da li se statistiki
podaci prikazuju oznakama i simbolima ili geometrijskim oblicima. U prvu
grupu spadaju kartogrami i simboliki crtei. U drugu grupu spadaju
dijagrami.
Ukoliko se statistiki podaci prikazuju u geometrijskim oblicima, takve
grafike prikaze nazivamo dijagramima. Dijagrami, kao geometrijski oblici
izraavanja statistikih veliina imaju ire i raznovrsnije mogunosti
prikazivanja. Veliine se mogu usporeivati pomou taki (kota), linija
(duina), povrina i tijela. U odnosu na nain prikazivanja razlikujemo
sljedee grupe dijagrama: takaste, linijske, povrinske i prostorne.
Takasti (korelacioni), odnosno dijagram rasturanja opisan je u poglavlju o
korelaciji.
Linijski dijagram ima samo jednu dimenziju i usporeivanje pomou duina
moe da obuhvati samo vrijednosti, odnosno frekvencije jednog obiljeja. U
grupu linijskih dijagrama ubrajamo sljedee:
- poligon frekvencija,
- kriva frekvencija,
- vremenski linijski dijagram,
- tapiasti dijagram,
- kumulativni (integralni) dijagram,
- polarni dijagram.
34

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Povrinski dijagrami pruaju ire mogunosti usporeivanja. Njima


usporeujemo dvije dimenzije. Veliina pojave izraena je srazmjerno
velikom povrinom (npr. dva puta brojnija pojava prikazana je dva puta
veom povrinom). U ovu grupu ubrajamo sljedee dijagrame:
- stubiasti dijagram,
- histogram frekvencija,
- kruni dijagram.
Najzad, stereogrami, odnosno prostorni dijagrami treba da prue najire
mogunosti usporeivanja jer su izraeni sa tri dimenzije. Meutim,
uoavanje odnosa prikazanih u tri dimenzije je komplikovano, odnosno
ispravan nain prikazivanja nije dovoljno impresivan. Na primjer, iako je
kocka B dva puta, po zapremini, vea od kocke A neostavlja taj utisak na
gledaoce.

Slika 2.2.3.1: Prikaz pomou stereorama: kocka B dva puta vea od kocke A
Ako je ipak, iz nekog razloga, potrebno trodimenzinalno prikazivanje, tada
se najbolji nain kojim se izbjegava pomenuti nedostatak sastoji u tome da se
razliite vrijednosti prikau sabiranjem jednakih zapreminskih jedinica.
Na primjer, ako je pojava A tri puta vea od pojave B prva e se prikazati
jednom kockom, a druga sa tri kocke jednake meu sobom i istovjetne sa
kockom koja prikazuje veliinu pojave A.

Slika 2.2.3.2: Prikaz pomou stereorama: stereoram B tri puta vea od


stereorma A prikladniji prikaz

35

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Zbog navedenih razloga stereogrami se manje upotrebljavaju u statistikim


istraivanjima.
Dijagrami, grafiki prikazi pomou geometrijskih oblika, konstruiu se u
sljedeim sistemima: pravouglom, polarnom i ugaonom.
Pravougli koordinatni sistem naziva se jo kartezijanski ili dekartov
po svom autoru, francuskom matematiaru i filozofu Rene Dekartu. Osnov
ovog sistema ine dvije prave koje se sijeku pod uglom od 90 stepeni i
postavljaju se tako da jedna bude horizontalna, a druga vertikalna.
Horizontalna prava zove se apcisna osa ili x osa, a vertikalna ordinatna osa
ili y osa. Kako su to brojne ose, one obavezno moraju biti oznaene
strelicama.
Presjek osa sainjava koordinatni poetak i on se oznaava 0. Na ove dvije
ose prenose se skale ispitivanih jedinica posmatranja i to tako da poevi od
0 pa desno na apcisnoj osi (horizontalna osa) imamo pozitivne, a lijevo
negativne vrijednosti, dok su na ordinatnoj osi (vertikalna osa) pozitivne
vrijednosti iznad, a negativne ispod nule (apscisne ose). Ravan dekartovog
koordinatnog sistema tako je podijeljena na etiri dijela koji se zovu
kvadranti i koji su poev od pozitivnog smjera x ose, suprotno kretanju
kazaljke na satu oznaeni redom kao I, II, III, IV kvadrant.

II (-,+)

I (+,+)

B (-3,5)

A (2,3)

IV (+,-)

III (-,-)
Slika 2.2.3.3: Pravougli koordinatni sistem

Poloaj take u ravni ovog sistema odreuje se rastojanjem take od apcisne


i ordinatne ose. Mjerni broj rastojanja neke take od ordinatne ose naziva se
apcisa te take i obiljeava se sa x, a mjerni broj rastojanja od apcisne ose
zove se ordinata te take i obiljeava se sa y. Apcisa i ordinata take zajedno
36

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

su njene koordinate. Na primjer koordinate take A na slici 2.2.3.3. su 2 i 3


to se biljei A (2,3). One imaju pozitivne vrijednosti jer se nalaze u prvom
kvadrantu. Taka B(-3,5) koja se nalazi u drugom kvadrantu ima negativnu
apcisu, dok je ordinata pozitivna.
Prikazivanje statistikih podataka u kartezijanskom sistemu dobija razliite
oblike (razbacane take, isprekidane linije, pojedinane duine ili povrine u
raznim odnosima).
U pravouglom koordinatnom sistemu konstruiu se sljedei dijagrami:
dijagram rasturanja, poligon, kriva i histogram frekvencija, vremenski
linijski dijagram, kumulativni dijagram i tapiasti dijagram.
Polarni koordinatni sistem dobio je ime po tome to prikazuje podatke po
polupravama koje idu iz jednog centra (pola) zrakasto u sve pravce.

R2

R1

POLARNA OSA

Slika 2.2.3.4: Polarni koordinatni sistem


Kako su ove poluprave brojne ose, one se obavezno obiljeavaju strelicama i
nazivaju se radijusi. Radijus na kome se nalazi mjerna skala obino polazi od
pola horizontalno na desno i zove se polarna osa. Rastojanje od pola (duina
radijusa) predstavlja prvu ordinatu neke take. Ona se obiljeava sa R. Druga
ordinata je ugao koji taj radijus zaklapa sa polarnom osom, odnosno ugao
izmeu dva radijusa. Ovaj ugao koji se naziva polarnim uglom obiljeava se
sa alfa. Ugao alfa jo se naziva i uglom azimuta po ugledu na geografski
polarni sistem. Poloaj take u polarnom koordinatnom sistemu prema tome
odreen je duinom radijusa i polarnim uglom. U polarnom koordinatnom
sistemu konstruie se polarni dijagram.

37

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ugaoni koordinatni sistem omoguuje da se vrijednosti obiljeja prikazuju


veliinom ugla alfa koji zaklapaju dva proizvoljna poluprenika (r). U ovom
sistem konstruie se kruni dijagram.

r
Slika 2.2.3.5: Kruni koordinatni sistem
Na brojne ose koordinatnog sistema mogu se nanositi razliite mjerne skale.
Najee su u upotrebi aritmetika i logaritamska skala. Aritmetika skala se
karakterie istovjetnim jedininim duinama na brojnoj osi koje odgovaraju
istim razlikama u veliini pojave. Na primer, razmak izmeu 3 i 4 isti je kao
i razmak izmeu 5 i 6 ili pak razmak izmeu 10 i 15 jednak je razmaku od
20 i 25 itd. Logaritamska skala za razliku od aritmetike nema iste razmake
na brojnoj osi, ve su one u nekom odnosu (u nekoj razmjeri, logaritamskoj)
pa prema tome ne odgovaraju istim razlikama u veliini pojave. Na primjer
razmak od 1 do 10 je isti kao i onaj od 10 do 100 i od 100 do 1000 ili je
odnos takav da je razmak od 2 do 4 isti kao od 4 do 8, od 8 do 16, itd.
U zavisnosti od vrste mjerne skale sa brojnim osama dobijaju se razliiti
koordinatni sistemi, ali i razliiti papiri za grafiko prikazivanje. Ako je na
obe brojne ose nanesena skala sa aritmetikom podjelom u milimetrima
dobija se milimetarski koordinatni sistem i papir. Logaritamski koordinatni
system i papir je onaj koji na obima osama ima logaritamsku skalu, a
semiliogaritmski koordinatni sistem i papir je onaj kod kojeg je jedna brojna
osa razmjerena po aritmetikoj, a druga po logaritamskoj skali. Pri izboru
mjerne skale brojnih osa treba voditi rauna o tome ta se prikazuje (tj.
kakve vrste i u kakvom odnosu su empirijski podaci) i kakva se analiza eli.
Bez obzira na vrstu sistema i dijagrama, pravilno odabranih i obiljeenih, pri
grafikom prikazivanju moraju se potovati neki osnovni zajedniki principi.
Treba izbjegavati da se na jednom grafikonu ucrtava vie linija ako se time
gubi osnovna funkcija grafikog prikazivanja, mogunost usporeivanja i
praenja kretanja prikazanih pojava. Pri konstrukciji grafikona mora se
38

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

voditi rauna o izboru razmjere, jer se moe stei razliit pa i pogrean


utisak. Zato se pri itanju grafikona zakljuak donosi tek kad se usporede
razmjere vrijednosti skala. Kada je rije o razmjerama moramo napomenuti
da razmjeru na y osi pravouglog koordinatnog sistema odreuje najvea
frekvencija i da ona po nepisanom pravilu iznosi 3/4 x ose (y=3/4 x). Da bi
ispunili pravilo da u koordinatnom sistemu mjerne jedinice idu od
koordinatnog poetka, tj. od nule, u sluaju kad imamo disproporciju
veliina, moramo prekinuti jednu ili obe ose (zavisno od podataka) nekim od
uobiajenih znakova (na primjer:
). Da bi grafikoni bili pregledni u
sluaju kada se unose vrijednosti na grafikon moraju se potovati pravila da
se one unose u prostor koji je pogodan.
2.2.4. Dijagrami
Izbor grafikona zavisi od vrste obiljeja, prirode pojave i cilja istraivanja.
Ovdje emo se usmjeriti na odreivanje grafikona kroz primjere.
Histogram frekvencija
Histogram frekvencija se koristi za prikazivanje stanja distribucije
frekvencija jednog numerikog kontinuiranog obeleja. Histogram pripada
grupi povrinskih dijagrama koji se konstruiu u pravouglom koordinatnom
sistemu tako to se na apcisnu osu nanose grupni intervali, a na ordinatnu
osu broj sluajeva u svakom intervalu, tj. frekvencija. S obzirom da se na y
osu nanosi frekvencija ona se moe oznaiti i simbolom za frekvenciju (f).
Histogram se dobija kada se nad grupnim intervalima konstruiu
pravougaonici koji se meusobno dodiruju, a ije povrine ili visine ako su
grupni intervali jednake irine predstavljaju njihove frekvencije.

39

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 1.
Data je distribucija frekvencija 29 zdravih osoba u odnosu na nivo
fibrinogena. Prikazati je grafiki.
Tabela 2.2.4.1: Distrubucija frekvencija zdravih osoba u odnosu na
fibrinogen
Broj
ispitanika
(f)
4
3
7
4
6
2
2
1
29

Fibrinogen
(g/l)
2,00 - 2,49
2,50 - 2,99
3,00 - 3,49
3,50 - 3,99
4,00 - 4,49
4,50 - 4,99
5,00 - 5,49
5,50 - 5,99
Ukupno

Slika 2.2.4.1: Distrubucija frekvencija zdravih osoba u odnosu na fibrinogen


Ako je potrebno naroito naglasiti frekvenciju, vrijednosti se upisuju iznad
svakog pravougaonika.

40

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Prikazati histogramom frekvencija podatke o distribuciji bolesnika od ulkusa
po godinama starosti.
Tabela 2.2.4.2: Distrubucija bolesnika od ulkusa u odnosu godine starosti
Godine ivota Broj bolesnika (f)
20 - 24
60
25 - 34
100
35 - 49
210
50 - 69
320
70 - 74
40
Ukupno
730

Slika 2.2.4.2: Distrubucija bolesnika od ulkusa u odnosu godine starosti


U prethodnom primjeru distribucija frekvencija data je sa jednakim
intervalima tako da konstrukcija histograma frekvencija nije predstavljala
problem. U ovom primjeru grupni intervali posmatranog obiljeja (godine
starosti nisu jednake irine). Da bi se konstruisao histogram frekvencija sa
nejednakom irinom intervala potrebno je da se prvo frekvencije svedu na
zajedniki interval pa se tek onda tako transformisane frekvencije nanose na
ordinatu.
Postupak je sljedei. Utvrde se irine grupnih intervala. U naem primjeru
one iznose 5, 10, 15, 20 i 5 godina. Izabere se zajedniki grupni interval. Za
nas je to 5 godina (jer su svi intervali djeljivi sa 5). Dijeljenjem grupnih
intervala sa jedininim utvruje se koliko su puta oni vei od jedininog
intervala. Mi smo dobili sljedee vrijednosti 1, 2, 3, 4 i 1. Nadalje,
empirijska frekvencija umanjuje se sada za onoliko koliko su puta jedinini
intervali manji od grupnih intervala (60:1 - 100:2 - 210:3 - 320:4 - 40:1).
41

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Konani rezultati su sljedei iznosi frekvencija: 60, 50, 70, 80 i 40. One
predstavljaju nove ordinate. Da bi konstrukcija ovog dijagrama do kraja bila
ispravna treba obratiti panju koliko se jedininih duina nanosi na apcisnu
osu za svaki grupni interval.
Histogram frekvencija je vrlo precizan u prikazivanju distribucije frekvencija
numerikih kontinuiranih obiljeja. Meutim, ovaj dijagram ima i jedan
nedostatak. Histogram frekvencija nije pogodan kada treba vriti grafika
poreenja. U ovom sluaju preglednost je smanjena.
Poligon frekvencija
Poligonom frekvencija se prikazuje stanje numerikih, prekidnih i
neprekidnih obiljeja. On pripada grupi linijskih dijagrama. Konstruie se u
pravouglom koordinatnom sistemu na taj nain da se grupni intervali,
odnosno grupe obiljeja nanose na apcisnu osu, a frekvencije, odnosno broj
sluajeva u klasnom intervalu ili grupi, na ordinatnu osu.
Poligon se dobija tako da se iz sredine grupnih intervala ili iz grupa diu
ordinate na koje se nanose odgovarajue frekvencije koje se oznaavaju
nekim znakom (taka, krui, zvjezdica). Spajajui oznake na ordinatama
pravom linijom dobija se izlomljena, poligonalna linija.
Primjer 1.
Ispitivan je nivo antihemofilnog globulina (AHG, VIII faktor koagulacije)
kod 9 bolesnika od prave hemofilije (hemofilija A). Dobijenu distribuciju
prikazati pomou poligona frekvencije.
Tabela 2.2.4.3: Distrubucija bolesnika od hemofilije A u odnosu na nivo
antihemofilnog globulina
AHG - A (%)
0,5 - 0,9
1,0 - 1,4
1,5 - 1,9
2,0 - 2,4
2,5 - 2,9
Ukupno

Broj bolesnika
3
2
2
1
1
9

42

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 2.2.4.3: Distrubucija bolesnika od ulkusa u odnosu godine starosti


Pri konstrukciji ovog dijagrama ordinate se nanose na vertikale dignute iz
sredine intervala jer na taj nain mogua greka najmanje dolazi do izraaja.
Poligonalna linija, nikada se ne spaja sa apcisnom osom.
Ukoliko se vrijednosti frekvencija upisuju u poligonalnu liniju to se ini
uvijek, radi preglednosti, u prostoru veeg ugla.
Pri konstrukciji poligona frekvencija za numerika kontinuirana obiljeja
ija je distribucija prikazana sa nejednakim grupnim intervalima vae pravila
kao i za konstrukciju histograma frekvencija pod istim uslovima.
Primjer 2.
Ispitivanjem hromozoma u kotanoj sri bolesnika koji se nalazi u fazi
blastne transformacije hronine mijeloidne leukemije (HML) naeno je da
od ukupno 240 ispitanih elija kotane sri ima 83 sa 2 klona, 73 sa 3 klona i
84 sa 4 klona. Prikazati naene rezultate poligonom frekvencija.
Tabela 2.2.4.4: Distrubucija elija bolesnika u odnosu na broj klona
Broj kolona

Broj elija

2
3
4

83
73
84

Ukupno

240

43

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 2.2.4.4: Distrubucija elija bolesnika u odnosu na broj klona


Ovdje se radi o numerikom prekidnom obiljeju (broj klona) pa ordinate
diemo direktno iz grupe.
Primjer 3.
Usporediti grafiki distribuciju frekvencija bolesnika sa peptikim ulkusom
(gastrinim i duodenalnim) u odnosu na nivo vrijednosti serumskog gastrina
(pg/ml).
Tabela 2.2.4.5: Distrubucija bolesnika sa ulkusom u odnosu na nivo
serumskog gastrina
Serumski gastrin
(pg/ml)
0 19
20 39
40 59
60 79
80 99
100 119
Ukupno

Ulkus
Ulkus
duodeni ventrikuli
3
9
3
2
3
1
3
5
1
15
15

44

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 2.2.4.5: Distrubucija bolesnika sa ulkusom u odnosu na nivo


serumskog gastrina
Kako je u pitanju numeriko kontinuirano obiljeje grafiki se moe
histogramom ili poligonom frekvencija. S obzirom da je potrebno vriti
poreenje pogodniji je poligon frekvencija jer daje pregledniju sliku. Ukupan
broj frekvencija je isti pa se uporeivanje moe izvriti sa apsolutnim
vrijednostima. Da ukupan broj jedinica posmatranja nije jednak morale bi se
najprije obe grupe svesti na zajedniku osnovu, odnosno izraunati procentni
iznos frekvencija, pa tek onda izvriti grafiko poreenje. Uz svaki dijagram
na kome se prikazuje poreenje neophodno je oformiti legendu koja
objanjava crte.
Primjer 4.
Prikazati grafiki distribuciju frekvencija elija (%) po stadijumima
sazrijevanja granulocitne loze u normalnim uslovima.
Tabela 2.2.4.6: Distrubucija elija u odnosu na stadijum sazrijevanja
granulocitne loze
Stepen sazrijevanja

elije (%)

Mijeloblasti
Promijelociti
Mijelociti
Metamijelociti

8
13
34
45

45

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 2.2.4.6: Distrubucija elija u odnosu na stadijum sazrijevanja


granulocitne loze
Iako je obiljeje (stepen sazrijevanja) atributivne prirode mi smo datu
distribuciju frekvencija prikazali poligonom frekvencija. Poligon frekvencija
moe se upotrebljavati za grafiko prikazivanje atributivnih obiljeja samo u
sluaju kada postoji usvojen, prirodni redosljed modaliteta toga obiljeja kao
u ovom primjeru.
Kriva frekvencija
Krivom frekvencija prikazuju se grafiki iskljuivo kontinuirana obiljeja.
Pripada grupi linijskih dijagrama i konstruie se u
pravouglom
koordinatnom sistemu na taj nain to se vrijednosti obiljeja u vidu grupnih
intervala nanose na apcisnu osu a frekvencija na ordinantnu osu. Za razliku
od histograma i poligona frekvencija kriva frekvencija je vrlo specifina,
kako po svom izgledu tako i po smislu odnosno znaenju.
Ako se pri crtanju histograma ili poligona frekvencija na apcisnu osu nanose
vrlo mali intervali obiljeja, a pri tome je broj sluajeva svakog intervala
vrlo veliki, umjesto izlomljene linije dobija se gusti niz taaka ijim
spajanjem se obrazuje pravilna i glatka kriva linija. Uz pretpostavku se da se
broj sluajeva poveava do beskonanosti, a obiljeje posmatranja dijeli u
sve manje grupne intervale do beskonano malih (infinitezimalnih), tada se
dobija kontinuirana, glatka, kriva linija koja se naziva se krivom frekvencija.

46

Y-Axis

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

X-Axis

Slika 2.2.4.7: Kriva frekvencija


Ovaj dijagram u stvari je jedna teoretska linija maksimalno prilagoena
empirijskim podacima. Matematike metode prilagoavanja veoma su
komplikovane, a osnove grafikog prilagoavanja su ve iznijete.
Znaaj krive frekvencija je dvostruk. Prvo, povrine izmeu bilo koje dvije
koordinate srazmjerne su teoretskoj frekvenciji odgovarajueg intervala
vrijednosti obiljeja. Drugo, za svaku vrijednost obiljeja, znai i za
vrijednosti koje nisu date empiriskim podacima, moemo utvrditi teoretsku
frekvenciju.
Nain prikazivanja distribucija frekvencija krivom frekvencija od velike je
vanosti za teoriju raspodjela.
Kumulativni dijagram
Kumulativnim dijagramom se prikazuju sukcesivni zbirovi vrijednosti
obiljeja. On pripada grupi linijskih dijagrama. Konstruie se u pravouglom
koordinatnom sistemu na taj nain to se vrijednosti obiljeja nanose na
apscisnu osu a frekvencija na ordinantu osu. Kumulativni dijagram se dobije
kada se ordinate iznad grupa (sredina grupnih intervala) poveu
isprekidanom pravim linijom.
Kod ovog dijagrama vrijednosti ordinata za svaki pojedini grupni interval ili
grupu ne unosi se od poetka, ve od vrijednosti frekvencije prethodnog
intervala. Na ovaj nain vrijednost ordinate jednog intervala ili grupe sa
frekvencijama prethodnog intervala odnosno grupe ini kumulativnu
frekvenciju.
47

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Spajanjem ovako dobijenih taaka formira se izlomljena linija koja


ravnomjerno raste ili opada prema frekvencijama sukcesivnih grupa ili
grupnih intervala u zavisnosti od toga kako smo vrili kumulaciju.
Primjer 5.
Prikazati kumulativnim dijagramom distribuciju frekvencija umiranja 284
bolesnika sa akutnim infarktom miokarda u petogodinjem periodu.
Tabela 2.2.4.8: Distrubucija frekvencija umiranja bolesnika sa akutnim
infoarktom miokarda u odnosu na godine
Godine
1
2
3
4
5
Ukupno

Broj
umrlih
185
33
22
22
22
284

Kumulativna
frekvencija
185
218
240
262
284
/

Slika 2.2.4.8: Distrubucija frekvencija umiranja bolesnika sa akutnim


infoarktom miokarda u odnosu na godine
Vremenski linijski dijagram
Vremenski linijski dijagram se upotrebljava za prikazivanje jedne ili vie
pojava u vremenu. Njime se prikazuju takozvane necikline pojave. To su
pojave ije se vrijednosti ne ponavljaju na isti nain iz jednog u drugi
vremenski period.
Ovaj dijagram je posebno znaajan zbog toga to omoguava prognoziranje
daljeg toka posmatrane pojave. Pripada grupi linijskih dijagrama. Konstruie
se u pravouglom koordinatnom sistemu na taj nain to se na apcisnu osu
48

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

nanosi jedinica vremena a na ordinatnu osu nanosi se frekvencija. Dijagram


sa dobije tako to se ordinate iznad vremnske ose poveu razlomljenom
pravom linijom.
Primjer 6.
Prosjene vrijednosti retikulocita, 5 bolesnika od perniciozne anemije
ljeenih heparonom ( 6 cm kubnih / 24 asa) iznosile su po danima terapije:
2, 5, 18, 30, 38, 47, 15, 8, 6, 3, 5, 4, 4, 4%.
Prikazati grafiki retikulocitnu krizu ovih bolesnika.
Tabela 2.2.4.9: Distrubucija prosjenih vrijednosti retikulocita % po danima
terapije
Dani
terapije
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
XIII
XIV
Ukupno

Prosjena vrijednost
retikulocita %
2
5
18
30
38
47
15
8
6
3
5
4
4
4
13,50

Slika 2.2.4.9: Distrubucija prosjenih vrijednosti retikulocita % po danima


terapije

49

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

tapiasti dijagram
tapiasti dijagram koristi se za prikazivanje stanja jednog prekidnog
numerikog obiljeja. Pripada grupi linijskih dijagrama i konsturie se u
pravouglom koordinatnom sistemu na taj nain to se grupe nanose na
apcisnu osu, a frekvencija na ordinatnu osu. Dobija se tako to se u visini
ordinate odgovarajue grupe nacrta pravougaonik najmanje mogue irine
(tapi).
Primjer 7.
Prikazati grafiki distribuciju frekvencija 60 bolesnika od ANL (akutne
nelifoblastne leukemije) po broju kura potrebnih za postizanje remisije.
Tabela 2.2.4.10: Distrubucija bolesnika od akutne nelimfoblastne leukemije
u odnosu na broj kura
Broj kura
1
2
3
4
5
6
Ukupno

Broj bolesnika
26
13
11
5
3
2
60

Slika 2.2.4.10: Distrubucija bolesnika od akutne nelimfoblastne leukemije u


odnosu na broj kura

50

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Stubiasti dijagram
Stubiasti dijagram se koristi za prikazivanje jednog ili vie atributivnih
obiljeja. Pripada grupi povrinskih dijagrama.
Za razliku od ostalih dijagrama on ima samo jednu brojnu osu i ona obino
odgovara ordinatnoj osi pravouglog koordinatnog sistema. Umjesto na
apscisnu osu obiljeje se nanosi na polupravu koja polazi od nule brojne ose
i nema mjernu skalu. Kao takva ona slui iskljuivo kao podloga za crtanje i
nije oznaena strelicom.
Primjer 8.
Prikazati grafiki Besissovu megakariocitnu diferencijalnu formulu zdravih
osoba.
Tabela 2.2.4.11: Distrubucija megakariocita (%) u odnosu na stadijum
sazrijevanja
Stadijum
sazrijevanja
I
II
III

Megakariociti
(%)
6
21
73

Slika 2.2.4.11: Distrubucija megakariocita (%) u odnosu na stadijum


sazrijevanja

51

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 9.
Aktivnost diaminooksidaze (DAO) u patolokim trudnoama uporediti na
istom dijagramu.
Tabela 2.2.4.12: Distrubucija trudnica
diaminooksidaze u patolokim trudnoama

odnosu

na

aktivnost

Procenat
trudnica kod
kojih je DAO

Normalna

Poviena

Ukupno

Smanjena

Normalna

Poviena

Broj trudnica kod


kojih je DAO
Smanjena

Dijagnoza

RH Senzibilizacija

12

91

111

44

56

40

Nefropatija gravidarum
Hipertenzija areterijalis
Ukupno

9
6
27

34
37
162

4
8
20

47
51
209

33
22
100

21
23
100

20
40
100

Slika 2.2.4.12.a: Distrubucija trudnica


diaminooksidaze u patolokim trudnoama

odnosu

na

aktivnost

Slika 2.2.4.12.b: Distrubucija trudnica


diaminooksidaze u patolokim trudnoama

odnosu

na

aktivnost

52

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Broj trudnica sa smanjenom, normalnom ili povienom aktivnou DAO iz


tri patoloke trudnoe nije jednak, zato smo morali svedsti broj trudnica na
zajedniku osnovu tj. izraunati frekvenciju u procentima pa tek onda vriti
grafiko poreenje stubiastim dijagramom.
Kruni dijagram
Kada treba grafiki prikazati strukturu jedne pojave (odnos dijelova prema
cjelini) upotrebljava se kruni dijagram. Kruni dijagram pripada grupi
povrinskih dijagrama. Povrina cijelog kruga predstavlja pojavu u cjelini, a
povrine pojedinih isjeaka dijelove te cjeline tj. pojave. Konstuie se u
ugaonom sistemu veliinom ugla alfa preko odnosa 100 % = 360o tj. 1 % =
3,6o.
Primjer 10.
Od opisa prvog abnormalnog hemoglobina HB-S (Pauling i dr. 1949. god.)
do danas otkriveno je 246 abnormalnih hemoglobina od kojih 72 alfa
varijante, 132 beta varijante, 8 delta varijante, 11 gama varijante, 9 s
delecijom jedne ili vie aminokiselina, 7 produkti fuzije, 7 produkti
elongacije.
Prikazati grafiki strukturu abnormalnih hemoglobina.
Tabela 2.2.4.13: Distrubucija abnormalnih hemoglobina u odnosu na
varijante
Abnormalni hemoglobini
Alfa
Beta
Delta
Gama
S delecijom
Produkti fuzije
Produkti elongacije
Ukupno

Apsolutna
frekvencija
72
132
8
11
9
7
7
246

53

Procenti

Stepeni

29,27
53,66
3,25
4,47
3,67
2,84
2,84
100,00

105,37
193,18
11,70
16,10
13,21
10,22
10,22
360,00

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 2.2.4.13: Distrubucija abnormalnih hemoglobina u odnosu na varijante


Primjer 11.
Prikazati grafiki strukturu elemenata ija se jedinjenja nalaze u ivim
organizmima ako se zna da plastinih ima 13, katalitikih 16 a rijetkih
nestalnih 7.
Tabela 2.2.4.14: Distrubucija elemenata u ivim organizmima po vrstama
Elementi
Plastini
Katalitiki
Rijetki nestalni
Ukupno

Broj
13
16
7
36

54

Procenti
36,11
44,45
19,44
100

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Polarni dijagram
Polarni dijagram se upotrebljava za prikazivanje kretanja jedne ili vie
pojava u vremenu. Za razliku od linijskog vremenskog dijagrama polarnim
dijagramom prikazuju se cikline pojave. On pripada grupi linijskih
dijagrama a konstruie se u polarnom koordinatnom sistemu na taj nain to
se na radijuse iji je broj odreen veliinom ugla alfa nanosi frekvencija ili
nivo pojava jednog vremenskog perioda.
Spajanjem taaka koje odgovaraju frekvenciji svakog radijusa dobija se
izlomljena linija koja predstavlja polarni dijagram.
Primjer 12.
Prikazati grafiki broj oboljelih od gripa po mjesecima jedne godine i
usporediti ih sa godinjim prosjekom koji iznosi 135 oboljelih po mjesecu.
Tabela 2.2.4.15: Distrubucija oboljelih od gripa po mjesecima
Mjeseci
Januar
Februar
Mart
April
Maj
Jun
Jul
Avgust
Septembar
Oktobar
Novembar
Decembar
Ukupno

Broj oboljelih
160
170
180
170
150
100
80
50
100
130
160
170
1620

Slika 2.2.4.15: Distrubucija oboljelih od gripa po mjesecima


55

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Dijagram se dobija na taj nain to se 360 stepeni podijeli sa 12 (brojem


mjeseci) i dobiju uglovi od 30 stepeni pomou kojih se ucrtavaju radijusi.
Karakteristino je za polarne dijagrame da se vrijednost prvog i posljednjeg
radijusa ne spajaju s obzirom na to da se ne zna kolika e frekvencija biti u
prvom intervalu sljedeeg vremenskog razdoblja koji se posmatra. Da bi se
usporedile pojedine mjesene frekvencije oboljelih sa prosjekom oboljelih za
itavu godinu, ucrtava se krug sa centrom u centru polarnog dijagrama i
poluprenikom koji odgovara godinjem prosjeku oboljelih.
Drugi grafiki prikazi
Kartogrami
Kartogram se upotrebljava za prikazivanje teritorijalne rasprostranjenosti
jedne ili vie pojava tj. za prikazivanje geografskih serija. Kao takav
kartogram ima relativno ogranienu upotrebu u statistikim istraivanjima.
Prikaz pismenosti/nepismenosti u bivoj SFRJ po republikama

LEGENDA

Pismeni
Nepismeni

Simboliki crtei
Simboliki crtei su grafiki prikazi koji slue prvenstveno u propagandne
svrhe. To su popularni prikazi pojava. To su popularni prikazi pojava.
Konstruiu se na taj nain to se slikom pojave prikazuje sama pojava
(veliinom kreveta - broj kreveta u bolnici, izgledom djeteta - njegovo
fiziko stanj itd.). Razlike u intenzitetu moraju se prikazivati razliito
velikim simbolima (po povrini odnosno opsegu) ali je bolje ako se to ini
veim ili manjim brojem simbola jer je takav prikaz kvantitativno lake
uoljiv i statistiki ispravniji. Vjetina je da se za pojavu koju prikazujemo
pronae prikladan simbol koji sam po sebi objanjava pojavu.

56

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prikaz porasta stanovnitva u svijetu.


2. 3. Deskriptivna statistika (statistiko opisivanje)
Za sticanje to boljeg uvida i sagladavanje meusobnih odnosa statistikog
skupa, nakon prikupljanja, sreivanja i prikazivanja, vri se statistika
deskripcija (opis) statistikog skupa. Postupkom statistike deskripcije
odreuju se relativni odnosi, mjere centralne tendencije, mjere varijabiliteta i
mjere oblika raspodjele frekvencija posmatranog statistikog skupa. Na ovaj
nain istraeni su i definisani svi relevantni parametri koji statistiki skup
(podatke) opisuju to se najee tretira kao jedna od faza rjeavanja
istraivakog problema.
Ovdje e se izloiti osnovni pojmovi i definicje i dati primjeri upotrebe:
Relativnih brojeva (Pokazatelja strukture, Indeksa, Koeficijenata); Mjera
centralne tendencije (Aritmetike sredine, Moda, Medijane); Mjera
varijabiliteta (Apsolutnih mjera varijaviliteta: Intervala varijacije;
Standardne devijacije; Relativnih mjera varijaviliteta: Koeficijenta varijacije;
Zed vrijednosti).
2. 3. 1. Relativni brojevi
Podaci o istraivanoj pojavi (istraivakom problemu) dobijaju se mjerenjem
ili prebrojavanjem jedinica posmatranja i daju se apsolutnim brojevima. Ovi
brojevi su osnovni (izvorni) podaci i omoguavaju uvid u stvarno stanje
posmatrane pojave i predstavljaju njenu elementarnu deskripciju. Meutim,
ovi podaci (apsolutini brojevi), iako nezamjenjivi, esto imaju ogranienu
upotrebnu vrijednost, posebno kad je potrebno vriti razne usporedbe.
Apsolutni brojevi su pogodni kod usporeivanja pojava koje su iskljuivo
istoimene, istovrsne i istovjetne uz uslov da su jednakih intenziteta (obima ili
nivoa).
Da bi se meusobno mogle usporeivati pojave koje ne ispunjavaju uslove
za upotrebu apsolutnih brojeva, kao dopuna koriste se relativni brojevi.

57

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Reletivni brojevi (definicija)


Relativni brojevi su statistiki parametri koji omoguavaju usporedbu
posmatranih pojava bez obzira na njihovu raznoimenost, raznovrsnost,
razliitost, nivo ili obim.
Relativni brojevi mogu se izraunavati samo ako su poznata dva apsolutna
broja koja su u bilo kom obliku u meusobnom odnosu, u nekoj vezi.
Relativni broj oznaava se sa Rb i dobija se kao kolinik dva apsolutna broja.
U broiocu ovog kolinika nalazi se raunska, vrijednost koja se usporeuje
Vr. U imeniocu razlomka nalazi se osnovna, bazna vrijednost, vrijednost s
kojom se usporeuje Vb.
Relativni broj se dobija preko izraza:
Rb = Vr / Vb
Iz izraza za relativni broj proizlaze sljedee relacije:
Vr = Vb * Rb i

Vb = Vr / Vb

Primjer 1.
Od 233 pacijenta kojima su raene laboratorijske pretrage u laboratoriji
Doma zdravlja kod 158 pacijenata raena je KKS (kompletna krvna slika) i
DKS (diferencijalna krvna slika) dok je kod ostalih pacijenata raena smo
KKS. U kakvom je odnosu broj pacijenata sa KKS i DKS prema ukupnom
broju pacijenata kojima je raen nalaz krvi.
Rb = Vr / Vb = 158/233 = 0,6781
Rezultat dijeljenja broioca imeniocem je decimalni broj. Da bi se olakalo
tumaenje poreenja na osnovu relativnih brojeva s obzirom da je decimalni
broj esto vrlo mali i sa mnogo decimala (to nije pogodno za donoenje
pravilnog zakljuka) on se mnoi sa 100 i izraava u procentima ili se mnoi
sa 1000 i izraava u promilima.
Izraen u procentima rezultat iz prethodnog primjera 0,6781 iznosi 67,81%.
Ukoliko se tako dobijen relativni broj koristi za dalja raunanja uzima se
njegova tana vrijednost, meutim ukoliko se koristi kao konani rezultat
tada se zaokruuje na prvi cijeli broj. Posebno se zaokruivanje radi kad je
rije o parametru kome po njegovoj prirodi ne odgovara decimalni broj (broj
ljudi i slino).

58

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Na osnovu podataka o broju vakcinisanih (200) i procenta izvrenja plana
vakcinacije (80%) izraunati broj predvienih za vakcinaciju.
Vb = Vr / Rb * 100 = 200 / 80 * 100 = 250
Primjer 3.
Koliki je ukupan procenat djece sa abnormalnim hemoglobinom otkriven u
periodu 6 godina na odreenoj teritoriji ako je u klinikom materijalu
otkriveno 25, odnosno 1%, a u populacionim istraivanjima 26, odnosno
0, 26% djece.

Vb1

Vr1 *100 25 *100

2500
Rb1
1

Vb 2

Vr 2 *100 26 *100

10000
Rb 2
0,26

Vr Vr1 Vr 2 25 26 51
Vb Vb1 Vbr2 2500 10000 12500
Da bi se izraunao zajedniki procenat mora se voditi rauna o veliini baze.
Ako su one jednake po veliini zajedniki procenat moe se lako izraunati
sabiranjem procenata i dijeljenjem toga zbira brojem sabiraka. Ukoliko
bazne vrijednosti nisu jednake (to je na sluaj) zajedniki procenat se
izraunava ili na prikazani nain ili pomou izraza za aritmetiku sredinu
procenta.
Kada se govori o procentima kao najeem nainu izraavanja relativnih
brojeva moe se njegova matematika definicija (procenat je decimalni
razlomak sa imeniocem 100) transformisati u statistiku. Tako se moe rei
da je procenat relativni broj ija baza vrijednosti iznosi 100.
Proporcije
Na isti nain, pomou relativnog broja moe se definisati jo jedan pojam
koji je est u statistici.
Proporcije su relativni brojevi ija je bazna vrijednost jednaka jedinici.
One su uvijek dijelovi neega i ne mogu nikada da prevaziu total koji iznosi
59

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

jedan. Odnos izmeu procenata i proporcija je takav da je procenat 100 puta


vei od proporcije, odnosno proporcija je 1/100 procenata.
Relativni brojevi se dijele na:
1. Pokazatelje strukture pojave
2. Pokazatelje nivoa pojave
3. Pokazatelji dinamike pojave

- Indeksi strukture
- Koeficjenti
- Indeksi dinamike

Meu koeficjentima inteziteta nalaze se i: stopa nataliteta, stopa mortaliteta,


stopa smrtnosti dojenadi, stopa prevalencije (mjera oboljelih na odreenom
podruju (na 1000; 10000; 100000 stanovnika), stopa incidencije (broj
novootkrivenih od iste bolesti u toku kalendarske godine itd.
2. 3. 2. Mjere centralne tendencije
esto se u svakodnevnom ivotu uju izrazi, prosjeno, tipino ili srednje.
Tako se govori o prosjenoj duini ivota, prosjenom kulturnom nivou,
prosjenoj inteligenciji, prosjenom obrazovanju, srednjem uspjehu,
srednjem standardu, tipinom izgledu, tipinoj klimi itd. Prosjek u ovom
smislu je najuoljivija i najee prisutna odreena specifinost,
karakteristika koja na neki nain reprezentuje pojavu o kojoj dajemo
miljenje. Meutim, odreivanje prosjeka neke pojave na osnovu utiska koje
pojedinac ili grupa stiu o toj pojavi, shodno svom znanju i iskustvu
subjektivno je i neprecizno. Objektivnu ocjenu prosjeka pojave dobijamo
tek statistikom obradom numerikih vrijednosti kojima je pojava izraena.
U statistikom smislu prosjek, srednja vrijednost, mjera koncentracije
odnosno mjera centralne tendencije je jedan broj, jedna vrijednost koja kao
reprezntativna zmjenjuje sve druge vrijednosti obiljeja. Pravo da se jedna
vrijednost obiljeja odredi za reprezentativnu nalazi se u injenici da
vrijednost i jedinica posmatranja pokazuju centralnu tendenciju, tj. pokazuju
manje ili vie izrazitu tenju da se u distribuciji frekvencija okupljaju oko
centralnih vrijednosti obiljeja. Srednja vrijednost sintetizuje i predstavlja
sve vrijednosti jedinica posmatranja u ispitivanom obiljeju. Ona uproava i
uoptava opis statistikog skupa omoguujui da se lake uoi tipino i
dominantno u varijabilnosti vrijednosti jedinica posmatranja.
Srednja vrijednost se moe odreivati razliitim metodama. Izbor metoda
odreivanja srednje vrijednosti zavisi od toga koja e metoda pruiti
najreprezentativniju srednju vrijednost obiljeja, s obzirom na prirodu pojave
i svrhu prouavanja.

60

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U odnosu na metod odreivanja, srednje vrijednosti dijelimo u dvije grupe.


Prvu grupu ine pozicione, lokacione srednje vrijednosti koje se odreuju
prema poloaju koji zauzimaju u distribuciji frekvencija. Ovoj grupi srednjih
vrednosti pripadaju medijana i mod.
Drugu grupu srednjih vrijednosti na koju se uglavnom odnosi naziv
"prosjek" ine raunske, matematike srednje vrijednosti od kojih u medicini
najee nalazi primjenu aritmetika sredina, harmoniska, kvadratna i kubna
sredina. One se dobijaju kao rezultat izvjesnih matematikih operacija koje
obuhvataju sve vrijednosti obiljeja statistikog skupa. Zbog toga na njih
utiu sve vrijednosti obiljeja, pa i one ekstremne dok na pozicione srednje
vrednosti one nemaju uticaja. S druge strane medijana i mod odgovaraju
datim individualnim vrijednostima dok prosjeci ne moraju da odgovaraju
konkretnim vrijednostima obiljeja.
No bez obzira na vrstu, srednje vrijednosti moraju da ispunjavaju opte
uslove. One se mogu odreivati razliitim metodama, tj. mjerilima ali se
moraju uvijek izraunavati na jedan jedini tano odreen nain.
Sve srednje vrijednosti vee su od najmanje, a manje od najvee pojedinane
vrijednosti obiljeja, odnosno njihova vrijednost nalazi se u intervalu izmeu
najvie i najnie vrijednosti obiljeja.
Kada su sve vrijednosti jedinica posmatranja jednog obiljeja jednake,
srednja vrijednost jednaka je toj vrijednosti obiljeja.
Sve srednje vrijednosti su apsolutne mjere centralne tendencije, tj. izraene
su istim mjernim jedinicama kao i jedinice posmatranja statistikog skupa.
2. 3.2.1. Aritmetika sredina
Aritmetika sredina se brzo shvata, jednostavno izraunava i lako kontrolie
pa se zbog toga najee primjenjuje u statistikim istraivanjima. Ona se

obiljeava simbolom x . Dobija se na taj nain to se saberu sve vrijednosti


jedinica posmatranja ispitivanog obiljeja pa se dobijeni zbir podijeli sa
ukupnim brojem jedinica posmatranja. Matematiki izrazi za izraunavanje
aritmetike sredine zavise od vrste i forme podataka.
Aritmetika sredina za individualne, negrupisane vrijednosti jedinica
posmatranja izraunava se preko sljedeeg izraza:
iN

x
i 1

N
61

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U ovom izrazu x (iks bar) oznaava aritmetiku sredinu, ( sigma) je


simbol za zbir odnosno sumu (sumiranje se vri od i=1 do i=N jedinica
posmatranja), x i predstavlja pojedinane vrijednosti (od prve do posljednje)
jedinica posmatranja ispitivanog obiljeja, a N ukupan broj jedinica
posmatranja.
Primjer 1.
Vrijeme krvarenja 5 bolesnika sa trombocitopenijom esencijalis iznosi 4' - 8'
- 6' - 10' - 4'. Izraunati aritmetiku sredinu vremena krvarenja ovih
bolesnika.
Rjeenje:

x 4 8 6 10 4 32

6,40'

5
5

Aritmetika sredina za grupisane vrijednosti jedinica posmatranja


izraunava se preko izraza:
s k

f
s 1
s k

f
s 1

xs'
s

gdje je sa fs oznaena frekvencija grupe ili grupnog intervala vrijednosti


obiljeja, sa xs' oznaena je sredina pojedinog grupnog interval, a sa

f s N suma frekvencija grupnih intervala koja je jednaka je ukupnom


broju jedinica posmatranja N. Sumiranje se vri po lanovima grupnog
intervala od s=1 do s=k). Prema tome aritmetika sredina grupisanih
podataka dobija se kao kolinik sume proizvoda vrijednosti obiljeja i
odgovarajuih frekvencija i sume frekvencija.
Aritmetika sredina izraunata po svom matinom izrazu naziva se esto
uravnoteena tj. ponderisana jer pokazuje da su pojedine vrijednosti obiljeja
uzete u raun prema njihovoj teini ili ponderu, tj. prema relativnoj vanosti
koju odreuju njihove frekvencije.

62

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Izraunati prosjenu vrijednost frekvencija radijalnog pulsa u minuti
prikazanog distribucijom frekvencija kod 15 zdravih osoba.
x

x'

fx'

60-64

62

124

65-69

67

268

70-74

72

360

75-79

77

231

80-84

82

82

Ukupno

15

1065

s k

f
s 1
s k

f
s 1

xs'
s

1065
71[o / min]
15

U sluaju kada je frekvencija jedinica posmatranja razvrstana u grupne


intervale obiljeja, kao to je to u ovom primjeru, kao vrijednost obiljeja se
uzima sredina grupnog intervala jer zamjenjivanjem svih vrijednosti grupnog
intervala njegovom sredinom ini se najmanja greka.
Sredina grupnog intervala
vrijednosti intervala sa dva.

xs'

se odreuje dijeljenjem zbira graninih

63

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 3.
Koliki je prosjean broj poroaja 12 vierotki. Broj poroaja dat je
distribucijom frekvencija.
X

fx

12

Ukupno

12

34

s k

f
s 1
s k

f
s 1

xs'
s

34
2,833 3
12

U datom primjeru frekvencije jedinica posmatranja razvrstane su u grupe


vrijednosti obiljeja pa se aritmetika sredina izraunava na ve pomenuti
nain.
U ovom sluaju panju treba obratiti na rezultat aritmetike sredine. Ako se
kao prosjena vrijednost numerikog diskontinuiranog obiljeja dobije
decimalni broj potrebno ga je zaokruiti na prvu cijelu vrijednost (osim u
sluaju ako se sa njim nastavlja statistika obrada odnnosno ako izraunata
aritmetika sredina slui za dobijanje drugih statistikih parametara).
Aritmetika sredina aritmetikih sredina
Aritmetika sredina aritmetikih sredina izraunava se preko sljedeeg
matematikog izraza:
i k

a x
i 1
i k

a
i 1

64

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U ovom izrazu X (iks dva bar) oznaava aritmetiku sredinu aritmetikih


i k

sredina, a

a
i 1

ukupan zbir jedinica posmatranja svih grupa iz kojih su

izraunate pojedinane aritmetike sredine.


Kao to vidimo iz ovog izraza, aritmetika sredina aritmetikih sredina
dobija se kada se zbir proizvoda pojedinanih aritmetikih sredina i broja
jedinica posmatranja iz kojih su one izraunate podijele sa ukupnim brojem
jedinica posmatranja.
Primjer 4.
U eksperimentu za utvrivanje najnie frekvencije vibracija zvunog talasa
koje ovjek moe da osjeti kao ton uestvovale su tri osobe. Prosjena
vrijednost prvog ispitanika dobijena iz etiri pokuaja iznosi 12,5 cikla u
sekundi. Prosjena vrijednost drugog ispitanika dobijena iz tri pokuaja
iznosi 15,67 cikla u sekundi. Kod treeg ispitanika prosjena vrijednost
dobijena iz dva pokuaja iznosi 11,5 cikla u sekundi. Kolika je prosjena
vrijedost frekvencija vibracija zvunog talasa dobijena u ovom
eksperimentu?

4 *12,5 3 *15,67 2 *11,5 120,01

13,33 13
43 2
9

Zato nije dobro raunati ovako?

12,5 15,67 11,5 39,67

13,22
3
3

Ovakav nain je dozvoljen samo ako u svakoj grupi ima isti broj jedinica
posmatranja. Pri izraunavanju ove aritmetike sredine moramo voditi
rauna o bazi, tj. o broju jedinica posmatranja na osnovu koga su izraunate
elementarne aritmetike sredine. Ukoliko grupe imaju razliit broj podataka
izraunavanje se vri preko datog matematikog izraza. Meutim, da je broj
jedinica posmatranja bio isti u svakoj grupi iz koje se izraunava prosta
aritmetika sredina bilo bi dozvoljeno da se aritmetika sredina izraunava
kao kolinik zbira elementarnih aritmetikih sredina i njihovog broja.
Aritmetika sredina relativnih brojeva
Na slian nain izraunava se aritmetika sredina relativnih brojeva. Ako
relativni broj obiljeimo sa P (s obzirom da se najee izraava u
procentima) matematiki izraz za izraunavanje aritmetike sredine
relativnih brojeva imae oblik:
65

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
ik

a P
i

i 1
ik

a
i 1

Kao i kod aritmetike sredine aritmetikih sredina i pri izraunavanju


aritmetike sredine relativnog broja mora se voditi rauna o veliini baze na
osnovu koje je on izraunat. O ovome je ve bilo rijei u poglavlju o
relativnim brojevima.
Ovdje samo moemo podvui da se aritmetika sredina relativnih brojeva ne
moe izraunati ako se ne poznaju apsolutni brojevi iz kojih su oni
izraunati.
Primjer 5.
Izraunati procenat petogodinjeg preivljavanja 200 bolesnika sa tumorom
bubrenog parenhima ako je data sljedea distribucija frekvencija po
stadijumu anatomskog razvoja tumora.
Stadijum razvoja
tumora
I
II
III
IV

Broj oboljelih

Procenat preivjelih

18
51
123
8

78%
61%
18%
0%

i k

a P
i 1
ik

a
i 1

18 * 78 51 * 61 123 *18 8 * 0
18 51 123 8

6729
P 200 33,64 34%

Ne smije se raunati ovako:

78 61 18 0 157

39,25
4
4

66

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ukupno petogodinje preivljavanje iznosi 34%, a ne 39% koliko bi se


dobilo da je izraunata prosta aritmetika sredina (78+61+18+0)/4=39,25%,
tj. da je zanemarena veliina grupe na osnovu koje je izraunat procenat.
Karakteristike aritmetike sredine:
Tanost izraunavanja aritmetike sredine lako se kontrolie zahvaljujui
specifinim osobinama ove mjere centralne tendencije. One se odnose na
odstupanje individualnih vrednosti jedinica posmatranja od aritmetike
sredine obiljeja.
a) Nulta suma razlike
Algebarski zbir odstupanja pojedinih vrijednosti jedinica posmatranja od

aritmetike sredine vrijednosti obiljeja jednak je nuli ( x x 0 ),

odnosno zbir pozitivnih odstupanja jednak je zbiru negativnih odstupanja od


aritmetike sredine. Odstupanja sa razliitim predznakom javljaju se zbog
toga to se aritmetika sredina nalazi u intervalu izmeu minimalne i
maksimalne vrijednosti jedinica posmatranja. Aritmetika sredina izravnava
odstupanja u apsolutnim iznosima tj. izravnava apsolutnu varijaciju serije.
Ona u nizu brojeva ima isto znaenje koje ima taka teita u mehanikom
sistemu pa se esto naziva i teite rezultata, tj. teite vrijednosti obiljeja.
Da je ovo tano moemo dokazati jednostavnim eksperimentom. Ako se
histogram frekvencija kojim je predstavljena neka distribucija frekvencija
kontrolie na tvrdom i tekom materijalu (npr. dasci) i izree, moe se
postaviti u ravnoteu ako mu je oslonac u taki koja odgovara aritmetikoj
sredini obiljeja.
"Teina" vrijednosti jedinica posmatranja jednog obiljeja (koje se ogleda u
odstupanju od aritmetike sredine obiljeja) iznad i ispod aritmetike sredine
uvijek je jednaka.
b) Metod najmanjih kvadrata
Zbir kvadrata odstupanja pojedinih vrijednosti jedinica posmatranja od
aritmetike sredine vrijednosti obiljeja jednak je minimum
2


( x x min ).

Drugim rijeima suma kvadrata odstupanja od aritmetike sredine manja je


od sume kvadrata odstupanja od bilo koje druge sredine tj. srednje
vrijednosti. Ona predstavlja minimum to se moe i matematiki dokazati.
67

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
N

(x
i 1

x ) 2 ( xi x 0 ) 2
i 1

Matematiki dokazana ova osobina aritmetike sredine zauzima jedno od


najvanijih mjesta u statistici. Tu osobinu formulisao je Gaus (Gauss) 1795.
godine pod imenom "Metod (princip) najmanjih kvadrata". Ona glasi: "Suma
kvadrata greaka mora biti minimalna (ako pod grekom podrazumijevamo
odstupanje vrijednosti od aritmetike sredine)". Na taj nain aritmetika
sredina se uzima kao najreprezentativnija i kao najverovatnija vrijednost
reprezentativnog obiljeja.
c) Princip homogenosti
Aritmetika vrijednost moe da reprezentuje samo homogeni statistiki skup
tj. skup u kome nema velikih odstupanja vrijednosti jedinica posmatranja.
Ovo ogranienje upotrebe aritmetike sredine proizlazi iz injenice da na
aritmetiku sredinu kao i na sve druge raunske srednje vrijednosti utie
svaka vrijednost jedinice posmatranja, a posebno ekstremne vrednosti.
One pomjeraju "vuku" aritmetiku sredinu ka sebi i na taj nain
onemoguavaju njenu reprezentativnost.
d) Princip linearnosti
Ako su dva obiljeja vezana linearnom funkcijom, tada su i njihove
aritmetike sredine vezane tom istom linearnom funkcijom, to jest:
ako je y b0 b1 x tada je i y b0 b1 x
Zbog naprijed navedenih karakteristika aritmetika sredina nije dobar
reprezentant prosjeka u sluaju kada je distribucija frekvencija asimetrina
ili ako je broj podataka mali, a varijabilitet veliki.
2. 3. 2. 2. Medijana
Medijana ili centralna vrijednost je srednja vrijednost po poloaju. To je ona
vrijednost obiljeja koja odgovara srednjem lanu niza jedinica posmatranja
poredanim po veliini obiljeja. Kao centralna vrijednost ona dijeli sumu
frekvencija na dva jednaka dijela. Polovina ukupnog broja jedinica
posmatranja nalazi se sa jedne strane tj. ispod, a polovina sa druge strane tj.
iznad medijane.
Medijana se obiljeava sa M ili ee sa Me. Dobija se na sljedei nain:
a)
jedinice posmatranja poredaju se po veliini;
b)
odredi se mjesto medijane, tj. utvrdi se srednji lan jedinice
68

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

c)

posmatranja;
proita se ili izrauna vrijednost obiljeja koja odgovara
pronaenom srednjem lanu niza jedinica posmatranja.

Odreivanje mjesta medijane tj. srednjeg lana niza jedinica posmatranja


zavisi od njihovog broja i forme u kojoj su prezentirane. Mjesto medijane
(MMe) za individualne negrupisane vrijednosti jedinica posmatranja
odreuje se preko izraza:
MMe = (N + 1) / 2
gdje je N broj lanova datog niza odnosno broj jedinica posmatranja. Ako je
broj lanova niza neparan sama medijana se dobija ako se proita vrijednost
obiljeja koju ima jedinica posmatranja odreena gornjim izarazom kao
srednji lan niza.
Primjer 1.
Koificjent inteligencije (IQ) 9 odraslih osoba iznose: 97, 101, 105, 110, 111,
113, 115,118, 120. Odrediti medijanu.
1 9 1
e

5
2
2
e 111

990
110
9

Medijana se nalazi na petom mjestu, a iznosi 111 jer je to vrijednost


obiljeja koja se u rastuem nizu jedinice posmatranja (97, 101, 105, 110,
111, 113, 115, 118, 120) nalazi na petom mjestu.
Ovo je bio primjer za neparan broj jedinica posmatranja.
Ako je broj lanova niza paran, medijana se mora izraunavati. U ovom
sluaju ona se dobija kao artimetika sredina onih vrijednosti obiljeja
posmatranja koje pripadaju jedinicama posmatranja koje granie sa
prethodno odreenim mjestom medijane MMe. Mjesto medijane u parnom
nizu se ne poklapa sa konkretno datim podacima ve se nalazi izmeu dvije
jedinice posmatranja.
Primjer 2.
Pri odreivanju koliine dvadesetoasovnog urina (l) dobijeni su sljedei
rezultati za osam zdravih osoba: 0,90; 1,100; 1,200; 1,250; 1,300; 1,350;
1,400; 1,550. Odrediti medijanu.
69

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1 8 1

4,5
2
2
1,250 1,300
e
1,275
2

Mjesto medijane je 4,5 a ona iznosi 1,275 jer je to aritmetika sredina


vrijednosti obiljeja koja se u rastuem nizu jedinica posmatranja 0,90;
1,100; 1,200; 1,250; 1,300; 1,350; 1,400; 1,550, nalaze na etvrtom i petom
mjestu.
Mjesto medijane za sreene, grupisane vrijednosti jedinica posmatranja
odreuje se preko izraza
e

f 1
2

gdje je f suma svih frekvencija tj. ukupan broj jedinica posmatranja


( f N ).
Da bi se dobila vrijednost medijane grupisanih podataka potrebno je poslije
utvrivanja mjesta medijane napraviti kumulativni niz frekvencija i pomou
njega procijeniti ili odrediti medijanu.
Primjer 3.
Kolika je medijana vremena miine reakcije (sec) 17 osoba.
Reakcija (sek)

Broj osoba

0,48
0,49
0,5
0,51
0,52
Ukupno

1
3
7
4
2
17

Kumulativna
frekvencija
1
4
11
15
17
/

f 1
2

17 1
9
2
e 0,50sek

Mjesto medijane je 9, a medijana iznosi 0,50 sekundi to je vrijednost tree


kumulisane grupe obiljeja u kojoj se nalazi deveta po redu jedinica
posmatranja.
70

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 4.
Odrediti medijanu vrijednosti triglicerida /mmol/l/ u plazmi 40 zdravih
osoba prikazanih distribucijom frekvencija
Trigliceridi
(mmol/l)
0,30-0,59
0,60-0,89
0,90-1,19
1,20-1,49
1,50-1,79
Ukupno

Kumulativna
frekvencija
3
10
29
39
40
/

Broj osoba
3
7
19
10
1
40

Sredina grupnog
intervala
0,45
0,75
1,05
1,35
1,65
/

f 1 40 1

20,5
2
2
e 1,05

Mjesto medijane iznosi 20,5 a sama medijana 1,05 mmol/l. Ova vrijednost je
procijenjena zamjenjivanjem svih vrijednosti treeg grupnog intervala
njegovom sredinom.
Za serije grupisanih podataka medijana se dobija interpolacijom izmeu
donje i gornje granice intervala grupe u kojoj se medijana nalazi, tj.:
N
f1
Me l1 2
i
f Me
gdje je:
l1 - donja granica medijalnog intervala,
N - broj lanova posmatrane serije,
f1 - zbir frekvencija predmedijalnog intervala
i - duina medijalnog intervala.
fMe - frekvencija medijalnog intervala
Medijana se ponekad naziva i drugim kvartilom s obzirom na mogunost
podjele jedne serije na etiri jednaka dijela. Ako se serija podataka
rangiranih po veliini podijeli na etiri jednaka dijela, vrijednosti obiljeja
koje ih dijele nazivaju se kvartilima: prvi kvartil Q1, drugi kvartil Q2, trei
kvartil Q3. Na isti nain, ako seriju podijelimo na 10 odnosno na 100
jednakih dijelova dobie se decili odnosno percentili. Svi ovi pokazatelji
odreuju se na slian nain kao i medijana. Tako se, na primjer, za grupisane
podatke prvi i trei kvartil odreuju na osnovu sljedeih izraza:
71

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

N
f1
Q1 l1 4
i
f Q1

3N
f1
Q3 l1 4
i
f Q3

gdje je:
l1 - donja granica medijalnog intervala,
N - broj lanova posmatrane serije,
f1 - zbir frekvencija do kvartilnog intervala
fQ - frekvencija kvartilnog intervala
i - duina kvartilnog intervala.
Prvi kvartil - Q1 je ona vrijednost obiljeja posmatranja od koje 25%
elemenata skupa ureenih po veliini ima manju ili jednaku vrijednost tog
obiljeja.
Trei kvartil - Q3 je ona vrijednost obiljeja posmatranja od koje 75%
elemenata skupa ureenih po veliini ima manju ili jednaku vrijednost tog
obiljeja.
2. 3. 2. 3. Mod (Modus)
Mod ili tipina, dominantna vrijednost je srednja vrijednost po poloaju. To
je ona vrijednost obiljeja koja se najee javlja. U distribuciji frekvencija
mod je vrijednost obiljeja kojoj odgovara najvea frekvencija, a na
dijagramu ona vrijednost na x osi kojoj odgovara najvea ordinata. Mod se
obiljeava sa Mo.
Kada su date individualne, negrupisane vrijednosti jedinica posmatranja mod
se odreuje jednostavno inspekcijom tj. uoavanjem najvee vrijednosti
obiljeja.
Primjer 1.
Sedam zdravih osoba ima sljedee vrijnosti glikoze u krvi: 5,0; 4,2; 5,4; 5,0;
5,1; 5,4; 5,0 mmol/l. Odrediti modalnu vrijednost.
Mo=5,0 mmol/l
S obzirom da je broj podataka mali vrlo lako se uoava da se vrijednost od
5,0 javlja tri puta, vrijednost od 5,4 dva puta, a po jedanput 4,2 i 5,1 mmol/l.
Prema tome je Mo= 5,0 mmol/l jer se ova vrijednost najee javlja.
Ako su jedinice posmatranja prikazane distribucijom frekvencija po
grupama, mod se takoer lako odreuje uoavanjem vrijednosti obiljeja
grupe kojoj odgovara najvea frekvencija jedinica posmatranja.
72

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Podaci o prekidu napada paroksizmalne superventrikularne tahikardije kod 9
bolesnika, intravenskom aplikacijom lijeka dati su distribucijom frekvencija.
Odrediti modalnu vrijednost.
Doza lijeka (x)
1/2
3/4
1
Ukupno

Broj bolesnika
1
1
7
9

Mo=1
Modalna vrijednost je jedna doza lijeka jer je kod 7 do 9 bolesnika napad
prekinut ovom dozom.
Ako su jedinice posmatranja prikazane distribucijom frekvencija po grupnim
intervalima aproksimativna modalna vrijednost je sredina onog intervala koji
ima najveu frekvenciju. Meutim, za preciznije odreivanje modalne
vrijednosti u ovom sluaju koristi se sljedei izraz:
f 2 f1
o i
f 2 f1 f 2 f 3
gdje je l donja granica modalnog intervala, i je irina grupnog intervala, f 2
je frekvencija modalnog intervala, f 1 frekvencija prethodnog intervala, a f 3
frekvencija sljedeeg intervala.
Primjer 3.
Odrediti modalnu vrijednost distribucije frekvencija bolesnika od akutnog
miokarda po godinama ivota.
Godine ivota

Broj bolesnika

30-39
40-49
50-59
60-69
70-79
Ukupno:

23
147
102
77
15
364

Mo = 45 godina

73

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Najvea frekvencija (147) odgovara drugom intervalu (40-49) pa prema


tome tipina vrijednost obiljeja kao sredina odgovarajueg intervala iznosi
45 godina.
Preciznija modalna vrijednost obiljeja moe se dobiti preko navedenog
izraza:
f 2 f1
o i
f 2 f1 f 2 f 3

o 40 10

147 23
47,34
147 23 147 102

Ako se na ovaj nain odredi mod u datom primjeru dobija se preciznija


vrednost tipinih godina javljanja infarkta kod ispitivanih 364 bolesnika koja
iznosi 47,34.
Grafiki se takoe moe dobiti priblina vrijednost moda preko histograma
frekvencija. Ovako odreena modalna vrijednost jednaka je onoj vrijednosti
apcisne ose koja se dobija sputanjem vertikale iz presjeka dijagonala koje
spajaju krajnju vrijednost prethodnog sa krajnjom vrijednou modalnog
intervala i poetnu vrijednost sljedeeg sa poetnom vrijednou modalnog
intervala.
Distribucije frekvencija u kojima se pojavljuje samo jedna maksimalna
vrijednost grupe ili grupnog intervala nazivaju se unimodalne raspodjele.
Nekada su jedinice posmatranja reprezentirane distribucijom frekvencija u
kojoj jedna ili vie grupa odnosno grupnih intervala ima maksimalnu
frekvenciju. Ako dvije susjedne grupe ili grupna intervala distribucije
frekvencija imaju iste maksimalne iznose mod je granina vrijednost tih
grupa, odnosno intervala (npr. 13-14, 15-16, Mo=14,5) unimodalne
distribucije frekvencija. U sluaju kada su intervali sa istim maksimalnim
frekvencijama razdvojeni samo jednom grupom odnosno intervalom
raspodjela je i dalje unimodalna ali vrijednost procjenjenog moda u ovom
sluaju ne moe nas zadovoljiti. Ukoliko su grupe ili grupni intervali sa istim
maksimalnim frekvencijama razdvojeni sa dvije grupe ili grupna intervala
takva raspodjela frekvencija nije vie unimodalna ve je bimodalna ili
multimodalna (polimodalna) u zavisnosti od toga da li ima dvije ili vie istih
maksimalnih frekvencija.
Mod kao tipina srednja vrijednost upotrebljava se u sluajevima kada
elimo neto naroito da istaknemo. Na nju ne utiu ni vrijednosti jedinica
posmatranja kao na aritmetiku sredinu ni broj jedinica posmatranja kao na
medijanu ve samo frekvencija jedinica posmatranja statistikog skupa.
74

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2. 3.2.4. Odnos mjera centralne tendencije


Kada su jedinice posmatranja pravilno i simetrino rasporeene po grupama
ili grupnim intervalima distribucija frekvencija osnovne srednje vrijednosti,
aritmetika sredina, medijana i mod se poklapaju, odnosno imaju iste
jednake iznose.

x =Me= Mo
sr

Slika 2.3.2.4.1: Grafiki prikaz odnosa osnovnih srednjih vrijednosti kod


simetrine krive frekvencija.
Kada su jedinice posmatranja asimetrino rasporeene po grupama ili
grupnim intervalima raspodjele frekvencija, srednje vrijednosti imaju
razliite iznose koji su u takvom odnosu da se medijana uvijek nalazi izmeu
moda i aritmetike sredine. Kod unimodalnih, asimetrinih ili umjereno
asimetrinih raspodjela uestalosti izmeu ove tri srednje vrijednosti postoji
prilino stabilan odnos. Medijana se u tom sluaju nalazi na treini puta od
aritmetike sredine ka modu. Prema tome, kada poznajemo dve od ovih
srednjih vrednosti moemo odrediti treu prema izrazu:

o 3e 2 x

75

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

MoMex

sr

Y-Axis

Slika 2.3.2.4.2: Grafiki prikaz odnosa osnovnih srednjih vrijednosti kod


krive frekvencije koja je asimetrina ulijevo (negativna asimetrija) a
iskoena u udesno (pozitivna iskoenost).

X-Axis
X MeMo

Slika 2.3.2.4.3: Grafiki prikaz odnosa srednjih vrijednosti kod krive


frekvencija koja je asimetrina udesno (pozitivna asimetrija) a iskoena
ulijevo (negativna iskoenost).
2. 3. 3. Mjere varijabitileta
Srednje vrijednosti predstavljaju, odnosno na neki nain zamjenjuju
statistiki skup. Ukoliko su jedinice posmatranja gusto grupisane oko
srednjih vrijednosti, ona dobro reprezentuje statistiki skup. Naprotiv, ako
koncentracija jedinica posmatranja oko srednje vrijednosti nije dovoljno
izraena srednja vrijednost nije dobar reprezentat statistikog skupa. U
izvjesnim sluajevima moe se desiti da jedinice posmatranja ne pokazuju
centralnu tendenciju pa tada srednja vrijednost koja se moe i u ovom
sluaju izraunati nita ne reprezentuje. Srednja vrijednost suvinim
76

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

uprotavanjem moe dovesti do pogrene i nejasne slike o statistikom


skupu. Tako dva ili vie statistikih skupova mogu imati istu srednju
vrijednost, a da se ipak meusobno znatno razlikuju bilo po tome to im je
raspon vrijednosti jedinica posmatranja razliit ili zbog toga to vrijednosti
jedinica posmatranja pokazuju razliitu disperziju (slika).
Ovo se moe najbolje sagledati na sljedeem primjeru: Dato je est serija sa
po sedam jedinica posmatranja prema tabeli 2.3.3.1.
Tabela 2.3.3.1: est serija sa istom aritmetikom sredinom
Jedinica
posmatranja
1
2
3
4
5
6
7
Srednja
vrijednost

Serija
(I)
10
8
7
6
7
8
10

Serija
(II)
6
7
10
10
10
7
6

Serija
(III)
16
10
2
0
2
10
16

Serija
(IV)
16
16
10
10
2
2
0

Serija
(V)
8
8
8
8
8
8
8

Serija
(VI)
0
2
8
8
32
0
0

Sve serije imaju istu srednju vrijednost x 8,00 , meutim kako se vidi sa
donjih grafikih prikaza serije se izmeu sebe znatno razlikuju jer nisu
jednako distribuirane.

77

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prema tome, same srednje vrijednosti nisu dovoljne da bi se dobro i pravilno


predstavio statistiki skup.
Da bi srednje vrijednosti dobile svoju pravu vanost treba odrediti kako i
koliko, odnosno da li se uopte jedinice posmatranja grupiu oko neke
srednje vrijednosti. Utvrivanje i mjerenje gustine grupisanja odnosno
odstupanja od srednje vrijednosti vri se statistikim parametrima koje
nazivamo mjere varijabilnosti odnosno mjere disperzije. Pod varijabilitetom
se kao to je ve reeno podrazumijeva promjenjivost obiljeja od jedinice
do jedinice posmatranja statistikog skupa.
Disperzija, tj. rasturenost vrijednosti jedinica posmatranja ima specifino
znaenje. Ona predstavlja odstupanje, devijaciju vrijednosti obiljeja od
izvjesne srednje vrijednosti. Poeljno je da vrijednosti pokazatelja disperzije
imaju neko konkretno znaenje sa prostim i oevidnim svojstvima, da zavise

78

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

od svih vrijednosti statistikog skupa, da se jednostavno izraunavaju i da su


pogodne za dalju obradu.
Mjere disperzije se prema nainu izraavanja dijele u dvije grupe.
Prvu grupu ine:
- raspon ili interval varijacije,
- interkvartilna razlika,
- srednje apsolutno odstupanje,
- prosjeno kvadratno odstupanje (varijansa), kovarijansa i standardna
devijacija.
To su apsolutne mjere varijabiliteta pa se izraavaju istim mjernim
jedinicama kojima su izraene i jedinice posmatranja.
Drugu grupu ine:
- koeficjent varijacije i
- standardizovana odnosno noramalizovana (z) vrijednost
Ovo su relativne mjere varijabiliteta i izraavaju se u procentima ili
decimalnim brojevima.
2. 3. 3. 1. Interval varijacije
Interval varijacije ili raspon je najjednostavnija, ali i najgrublja mjera
varijabiliteta. Interval varijacije pokazuje razmak od najmanje do najvee
vrijednosti obiljeja. Obiljeava se sa R ili I i dobija se preko izraza:
R= I = max min
Znai da se interval varijacije dobija kao razlika maksimalne i minimalne
vrijednosti obiljeja.
Primjer
Odrediti interval varijacija za sljedee vrijednosti aksilarne temperature: 38,2
- 37,0 - 36,8 - 37,5 - 39,1 - 36,5 - 37,8 - 38,6 - 39,4 - 40,1 - 37,6 - 40,0 - 39,6
- 37,9 - 38,5.
I = max - min = 40,1 - 36,5 = 3,60
Raspon kao mjera varijabilnosti daje uvid o ponaanju samo ekstremnih
vrijednosti obiljeja dok o varijabilitetu unutar intervala i o grupisanju
jedinica posmatranja oko srednje vrijednosti tj. aritmetike sredine ne daje
nikakve informacije. S obzirom da zavisi od krajnjih vrijednosti obiljeja
statistikog skupa interval varijacije ima jo jedan nedostatak. to je vei
broj jedinica posmatranja vjerovatnije je da e se meu njima pojaviti vei
raspon krajnjih vrijednosti.
79

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2. 3.3.2. Interkvartilna razlika


Da bi se eliminisao uticaj ekstremnih vrijednosti jedinica posmatranja
statistikog skupa na iznos ivervala varijacije, izraunava se kao dopunska
mjera interkvartilna razlika, odnosno razlika izmeu prvog i treeg kvartila:
iq Q3 Q1
Interkvartilna razlika iskljuuje 25% podataka sa najniim vrijednostima i
25% podataka sa najviim vrijednostima jedinica posmatranja statistikog
skupa.
Ako je interval varijacije veliki a interkvartilna razlika mala to znai da na
krajevima distribucije statistikog skupa postoje ekstremne vrijednosti ali da
ostali lanovi skupa ne pokazuju veliki varijabilitet. Kada je i interkvartilna
razlika velika, slika o varijabilitetu skupa nije dovoljno jasna, tim prije to se
i ova mjera zasniva na razlici samo dva lana skupa.
2. 3. 3. 3. Standardna devijacija
Standardna devijacija je mjera varijabiliteta koja se najee upotrebljava tj.
ima najiru primjenu u statistici. To je mjera varijabilnosti kojom se mjeri
odstupanje (disperzija, odnosno devijacija) vrijednosti obiljeja od
aritmetike sredine, tj. gustina grupisanja podataka oko aritmetike sredine.
to je vrijednost standardne devijacije manja, manje je i odstupanje (svake
jedinice posmatranja ili prosjeno odstupanje svih jedinicama posmatranja)
od aritmetike sredine, tj. manji je varijabilitet, a vea gustina grupisanja
vrijednosti jedinica posmatranja oko aritmetike sredine.
Standardna devijacija najee se obiljeava sa SD ili (sigma). Dobija se
na dva naina: preko razlike empirijskih vrijednosti jedinica posmatranja od
aritmetike sredine i direktno iz empirijskih jedinica posmatranja.
Bez obzira na nain raunanja, pri izraunavanju standardne devijacije kao i
pri izraunavanju drugih statistikih parametara mora se voditi rauna o
formi prezentiranja podataka. Ako se standardna devijacija izraunava preko
razlike vrijednosti jedinica posmatranja od aritmetike sredine koristi se
izraz SD SD 2 gde je SD oznaka za standardnu devijaciju, a SD 2 je
varijansa.
Prema tome standardna devijacija je pozitivna vrijednost drugog korjena
varijanse.

SD 2 var ijansa
80

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Varijansa, srednje kvadratno odstupanje je mjera varijabilnosti koja se dobija


kao kolinik sume kvadratnih odstupanja vrijednosti jedinica posmatranja od
aritmetike sredine i ukupnog broja jedinica posmatranja. Kao mjera
varijabiliteta ona nije pogodna za statistiku upotrebu jer se kvadriranjem
razlika dobijaju velike vrijednosti. Vaenjem kvadratnog korena iz varijanse
dobija se standardna devijacija koja je mnogo pogodnija mjera varijabiliteta
u statistikim istraivanjima. Kako se varijansa za negrupisane apsolutne
vrijednosti dobija preko izraza

SD 2

a za grupisane podatke preko izraza

i 1

f x
i k

SD 2

iN

i 1

i k

f
i 1

zamjenom u izraz za standardnu devijaciju dobija se da je standardna


devijacija za negrupisane podatke

SD

i 1

iN

iN

x
i 1

2
i

i za grupisane podatke

f x

SD

i 1

iN

i k

f
i 1

iN

fx
i 1
i k

f
i 1

2
i

Prva forma ovih izraza koristi se u sluaju kada je aritmetika sredina


decimalan broj to znai da je upotreba matematikog izraza zavisna od
podataka. Upotrebljava se ona forma odgovarajueg izraza koja olakava i
ubrzava dobijanje rezultata. Da bi se na ovaj nain izraunala vrijednost
standardne devijacije potrebno je prethodno izraunati aritmetiku sredinu.
Postupak izraunavanja preporuljivo je obavljati u formi radnih tabela jer se
time smanjuje mogunost radne greke pri raunskim operacijama.
Primjer 1.
Odrediti varijabilnost sljedeih vrijednosti holesterola u serumu:
4,5 - 4,1 - 5,3 - 4,4 - 4,7 - 4,0 - 5,5 - 5,1 - 6,0 - 6,4 mmol/l.

81

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

xi

xi x

1
2
3
4
5
6
7
8
9
10
Ukupno

4,5
4,1
5,3
4,4
4,7
4
5,5
5,1
6
6,4
50

-0,5
-0,9
0,3
-0,6
-0,3
-1
0,5
0,1
1
1,4
0

xi x

0,25
0,81
0,09
0,36
0,09
1
0,25
0,01
1
1,96
5,82

xi 50

5mmol / l
N
10

SD

xi x
N

5,82
0,76mmol / l
10

x SD 5 0,76mmol / l

Empirijski podaci nisu grupisani pa je primijenjen odgovarajui izraz i to u


formi koja odgovara cijelom broju aritmetike sredine.
Primjer 2.
Ocjene ivotne sposobnosti 22 novoroeneta prikazane su distribucijom
frekvencija. Odrediti varijabilitet.
n

Ocjena (x)

1
2
3
4
5
Ukupno

6
7
8
9
10
/

Broj
novoroenadi
3
4
8
5
2
22
x

fx

fx2

18
28
64
45
20
175

108
196
512
405
200
1421

f i xi 175

7,954
fi
22

SD

f i xi2 2
x
fi

SD

1421
7,954 2 1,325 1,151
22

x SD 7,954 1,151

82

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Empirijski podaci sreeni su u distribuciji frekvencija po grupama pa je u


skladu sa tim izvren izbor matematikog izraza, a njegova forma odgovara
decimalnom broju aritmetike sredine.
Primjer 3.
Odrediti varijabilnost vitalnog kapaciteta plua 20
prezentovani distribucijom frekvencija.
n
1
2
3
4
5
6
Ukupno

Vitalni kapacitet
1000-1999
2000-2999
3000-3999
4000-4999
5000-5999
6000-6999
/

Broj osoba (f)


2
4
5
6
2
1
20

x1
1499
2499
3499
4499
5499
6499
/

osoba. Podaci su

fixi
2998
9996
17495
26994
10998
6499
74980

fi(xi)2
4494002
24980004
61215005
121446006
60478002
42237001
314850020

f i xi 74980

3749
fi
20

SD

2
f i xi2
314850020
x
3749 2 1299,038
fi
20

x SD 3749 1299ml

Empirijski podaci prikazani su distribucijom frekvencija po grupnim


intervalima pa se kao i za izraunavanje aritmetike sredine i ovdje uzima
kao vrijednost obiljeja sredina intervala.
Standardnom devijacijom moe se vriti uporeivanje varijabiliteta istih
obiljeja ali pod uslovom da su aritmetike sredine iste ili se vrlo malo
razlikuju.
2. 3. 3. 4. Koeficijent varijacije (relativna mjera verijabiliteta)
Koeficjent varijacije (relativna standardna varijacija) je mjera varijebiliteta
koja omoguava poreenje varijabilnosti razliitih obiljeja kao i istih
obiljeja sa razliitom aritmetikom sredinom. Ovu funkciju koeficjent
varijacije ima zahvaljujui svom osnovnom svojstvu da je neosjetljiv na
promjenu veliine mjerila. Koeficjent varijacije obiljeava se simbolom CV
ili samo V. Dobija se kao kolinik standardne devijacije i aritmetike
sredine: CV V SD .
x
83

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Obino

se

izraunava

procentima

pa

gornji

izraz

glasi

CV SD / x*100 .
Dakle, koeficjent varijacije je standardna devijacija izraena u procentima
aritmetike sredine.Iz same formule se vidi da je koeficjent varijacije manji
to je standardna devijacija manja u odnosu na aritmetiku sredinu i
obrnuto. Prema tome varijabilitet pojave je utoliko manji ukoliko je manji
koeficjent varijacije.
Kako je varijabilitet pojave obrnuto proporcionalan sa homogenou jedinica
posmatranja to koeficjent varijacije koristimo istovremeno i kao mjeru
homogenosti. Homogenost neke pojave je vea ukoliko je koeficjent
varijacije manji. Pojava je homogena ako je koeficjent varijacije manji od
30% (CV<30%).
Koeficjent varijacije se upotrebljava u sluaju kada se eli utvrditi:
a) u kome obiljeju neka grupa varira vie, a u kome manje;
b) koja od grupa varira vie a koja manje u istom obiljeju.
Primjer 1.
Rezultati mjerenja tjelesne visine i mase 10 studentica su:

X tv 168cm , SD tv 1,1cm , X tm 62kg , SDtm 3,2kg ,


dok su 10 studenata imali ove rezultate:

X t 160cm , SD tv 1,2cm , X tm 78kg , SDtm 2,5kg .


Da li studenti vie variraju u visini ili masi i da li u masi vie variraju
studenti ili studentice.
Rjeenje:
Koeficijent varijacije visine (studenti)
SD
1,2
CVm tv *100
*100 0,67%
180
X
tv

Koeficijent varijacije teine (studenti)


SD
2,5
CVm tm *100
*100 3,2%
78
X
tm

Koeficijent varijacije teine (studentice)

84

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

CV z

SDtm

X tm

*100

3,2
*100 5,16%
62

Koeficijent varijacije visine (studentice)


SD
1,1
CV z tv *100
*100 0,65%
168
X
tv

Kako je koeficjent varijacije visine studenata (0,67%) manji od koeficjenta


varijacije mase studenata (3,2%) moe se zakljuiti da studenti vie variraju
u teini nego u visini. Poreenjem koeficjenta varijacije teine studentica
(5,16%) sa koeficjentom varijacije teine studenata (3,2%) dolazi se do
zakljuka da studentice vie variraju u masi od studenata. Isti zakljuak
vrijedi i u odnosu na polove (enski, muki).
2. 3. 3. 5. Zed vrijednost (poloaj pojedinanog rezultata u skupu)
Varijabilitet se moe ocjenjivati ne samo sa stanovita distribucije
frekvencija kao cjeline, nego i sa stanovita individualnih podataka. Mjera
ove varijacije je zed vrijednost. Zed vrijednost naziva se jo i
standardizovana, standardna ili normalizovana zed vrijednost.
Zed vrijednost je relativna mjera varijabiliteta. Oznaava se, zbog
razlikovanja od zed testa, samo malim latininim slovom zed - z. Izraava se
kao decimalni broj.
Zed vrijednost je proistekla iz karakteristika standardne normalne raspodjele.
Po definiciji, zed vrijednost je odstupanje jedne vrijednosti obiljeja
posmatranja od njegove aritmetike sredine izraeno u dijelovima standardne
devijacije. Prema tome, zed vrijednost se dobije kada se razlika jedne
vrijednosti obiljeja posmatranja i njegove aritmetike sredine podijeli sa
odgovarajuom standardnom devijacijom obiljeja posmatranja.
zX

X X
SDX

zx

xx
sd x

Prvi od gornjih izraza (sa velikim slovima i velikim slovom u indeksu)


koristi se odreivanje zed vrijednosti osnovnog skupa, a drugi (sa malim
slovima i malim slovom u indeksu) za odreivanje zed vriednosti uzorka.
Zed vrijednost ima velike i znaajne mogunosti primjene. Iz definicije i
formule se vidi da se pomou zed vrijednosti dobija informacija o odnosu
jedinice posmatranja prema skupu, bilo osnovnom bilo uzorku.
85

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Zed vrijednou se moe odreivati i porediti stanje i ponaanje jedinica


posmatranja i u onim empirijskim situacijama gdje su mjerenja vrena
razliitim mjernim sistemima ili mjernim jedinicama iste vrste ali razliite
teine tj. iznosa. Meutim, zed vrijednost se prije svega koristi za
odreivanje poloaja rezultata u grupi.
Primjer 1.
Stanje psihomotorike jedne grupe ispitanika procjenjivano je primjenom dva
testa (T1 i T2). Test T1 ima maksimum 15 bodova a test T2 ima maksimum
120 bodova. Aritmetika sredina i standardna devijacija iznosile su na prvom
testu 7,0 i 1,0 a na drugom 60,0 i 14,0 bodova. Usporediti stanje
psihomotorike ispitanika A (T1= 9; T2=74 boda) i B (T1= 6; T2=90 bodova).
Ukupno na oba testa ispitanik A je postigao 83 boda a ispitanik B 96 bodova.
Iz odnosa bodova moglo bi se zakljuiti da ispitanik B ima bolju
psihomotoriku od ispitanika A, jer vei broj bodova oznaava bolje stanje
psihomotorike. Ovaj zakljuak meutim nije ispravan jer teina bodova
koritenih testova nije ista. Prvi test ima interval variranja od 15 bodova (T1=
15-0 = 15 bodova) a drugi 120 bodova (T2= 120 - 0 =120). Jedan bod prvog
testa vrijedi osam bodova drugog testa (T2/ T1=120/15=8) odnosno jedan
bod drugog testa tei 0,125 bodova prvog testa (T1/ T2=15/120=0,125).
Znai, da bi se dolo do ispravnog zakljuka potrebno je ujednaiti teinu
bodova bilo mnoenjem bodova prvog testa sa osam bilo dijeljenjem bodova
drugog testa sa 0,125. Na taj nain dobijaju se novi skorovi. Ispitanik A ima
skor od 146 odnosno 18,125 a ispitanik B 138 odnosno 17,25.
Prema tome ispitanik A ima bolju psihomotoriku od ispitanika B.
Do ispravnog zakljuka moe se doi jednostavnije primjenom zed
vrijednosti.

z A z A1 z A2
z B z B1 z B 2

9 7 74 60

2 1 3
1
14

6 7 90 60

1 2,14 1,14
1
14

Ispitanik A ima skor od tri standardne devijacije a ispitanik B od 1,14


standardnih devijacija. Zed vrijednost ispitanika A vea je od zed vrijednosti
ispitanika B pa se moe zakljuiti da ispitanik A ima bolju psihomotoriku od
ispitanika B.

86

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Aritmetika sredina i standardna devijacija glikemije ispitanika grupe A
iznosile su 90,0 i 27 mg %, a grupe B 5,0 i 1,5 mmol/l.
Usporediti nivo glikemije ispitanika A3 (117 mg %) i B5 (6,5 mmol/l).
Glikemija ispitanika grupe A odreivana je u starim, a grupe B u novim
jedinicama mjera. Koritenjem zed vrijednosti moe se i bez konverzije
mjernih jedinica, na jednostavniji nain, dobiti odgovor na postavljeno
pitanje.
x x 117 90 27
z A3

1
sd x
27
27

z B5

x x 6,5 5,0 1,5

1
sd x
1,5
1,5

Na osnovu zed vrijednosti moe se zakljuiti da oba ispitanika imaju isto


poveanje glikemije u odnosu na prosjek svoje grupe. U ovom konkretnom
sluaju ispitanici ustvari imaju isti nivo glikemije, jer obe grupe ispitanika
imaju isti prosjeni nivo (90 mg % = 5,0 mmol/l) i varijabilitet (27/90 = 0,3;
1,5/5,0 = 0,3) vrijednosti glikemije.
Primjer 3.
U cilju procjene zdravstvenog stanja jedne grupe ispitanika odreivane su,
izmeu ostalog, vrijednosti etiri tipa lipida u krvi.
Dobijeni rezultati prikazani su tabelarno.
Lipidi
Ukupni holesterol
HDL - holesterol
Trigleceridi
LDH - holesterol

Statistiki parametri
Xsr
SD
4,5
0,9
55,5
11,1
1,4
0,3
90,0
18,0

Jedinica mjere
mmol/l
mg/dl
mmol/l
mg/dl

Usporediti nivo lipida u krvi ispitanika A (H=8 mmol/l; HDL-H=90 mg/dl;


T=2 mmol/l; LDH-H=115 mg/dl) i ispitanika B (H=7 mmol/l; HDL-H=50
mg/dl; T=1,8 mmol/l; LDH-H=100 mg/dl).

87

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Lipidi
Ukupni holesterol
HDL - holesterol
Trigleceridi
LDH - holesterol
Ukupno
Prosjeno

Zed vrijednost
A
B
(8-4,5)/0,9=3,89
(7-4,5)/0,9= 2,78
(90-55)/11=3,14
(50-55,5)/11=-0,50
(2-1,4)/0,28=2,14
(1,8-1,4)/0,28= 1,43
(115-90)/18=1,39
(100-90)/18= 0,56
3,89+3,14+2,14+1,39=10,56
4,77-0,5=4,47
10,56/4= +2,64
4,27/4= +1,07

Ispitanik A ima prosjeno poveanje lipida za 2,64 sd, a ispitanik B takoe


ima prosjeno poveanje lipida, ali za 1,07 sd. Ispitanik B ima manje
prosjeno poveanje lipida u krvi. Sudei po nivou lipida u krvi ispitanik B
ima bolje stanje zdravlja od ispitanika A.
2. 3. 3. 6. Usporeivanje varijabiliteta
Procjena varijabiliteta neke pojave se vri na osnovu odnosa aritmetike
sredine i standardne devijacije. Ako se uporeuje varijabilitet dvije pojave
razlikujemo sljedee mogunosti, odnosno situacije:

a)

ako je X Y , a SDx SD y varijabilitet je isti;

b) ako je X Y , a SDx SD y varijabilitet je manji tamo gde je manja


standardna devijacija i obrnuto;

c) ako je X Y , a SDx SD y varijabilitet je manji tamo gde je vea


aritmetika sredina i obrnuto;

d) ako je X Y , a SDx SD y mora se izraunati koeficjent varijacije i


tamo gde je on manji, manji je i varijabilitet odnosno vea je homogenost.
2.3.4. Mjere oblika distribucije
Pored mjera centralne tendencije i mjera varijabiliteta u pokazatelje
distribucije pojave ubrajaju se i mjere oblika distribucije i to: mjera
asimetrije i mjera spljotenosti distribucije frekvencija posmatranog
statistikog skupa.
Distribucija frekvencija statistikog skupa je simetrina kad frekvencije
vrijednosti obiljeja ravnomjerno opadaju ili rastu poevi od aritmetike

88

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

sredine, a asimetrina je kad elementi skupa pokazuju tendenciju grupisanja


oko vrijednosti obiljeja koja se nalazi ispod ili iznad srednje vrijednosti.
U zavisnosti od odnosa frekvencije srednjih vrijednosti i frekvencije ostalih
vrijednosti obiljeja distribucija je vie ili manje spljotena.
Za odreena mjerenja u statistici koriste se odstupanja vrijednosti obiljeja
od aritmetike sredine skupa na odreeni stepen, tzv. centralni momenti
distribucije (M).
Nulti moment (M0) jednak je jedinici, prvi moment (M1) jednak je nuli, drugi
moment (M2) jednak je varijansi a trei (M3) i etvrti moment (M4) koriste
se za izraunavanje relativnih mjera asimetrije i spljotenosti.
Za mjerenje asimetrije koristi se trei moment, a za mjerenje spljotenosti
etvrti moment distribucije frekvencija koji su za grupisane podatke dati sa
izrazima:
1 k
1 k
M 3 f i ( xi x ) 3
M 4 f i ( xi x) 4
N i 1
N i1
Kako su i trei i etvrti moment izraeni u istim jedinicama mjere kao i
empirijski podaci na osnovu kojih se raunaju oni nisu pogodni kao mjere
koje slue za usporedbu sa drugim rezultatima. Zbog toga se izraunavaju
relativni pokazatelji oblika distribucija frekvencija statistikog skupa.
Koeficijent asimetrije
Odnos treeg momenta i standardne devijacije na trei stepen odreuje
koeficijent asimetrije koji se oznaava sa i iznosi:

a3

M3
SD 3

Za simetrine distribucije frekvencija koeficijent asimetrije jednak je nuli, a


u sluaju postojanja asimetrije koeficijent 3 razliit je od nule. Od smjera
asimetrije zavisi da li e koeficijent biti pozitivan ili negativan. Kod
pozitivne asimetrije (asimetrija"udesno") koeficijent 3 je vei od nule
(pozitivan) dok je kod negativne asimetrije (asimetrija "ulijevo") manji od
nule (negativan).
to je koeficijent 3 vei od nule (bez obzira na smjer) to je asimetrija
distribucije frekvencija vea. Za distribuciju frekvencija se kae da je
umjereno asimetrina ako se vrijednost 3 kree u intervalu od -0,5 do +0,5
(uz uslov da je razliit od nule), a van tog intervala distribucija frekvencija je
znatno asimetrina.

89

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

x Me Mo
Slika a) Simetri~na distribucija frekvencija

x Me Mo
Slika b) Negativno asimetri~na distribucija frekvencija

Mo Me x
Slika c) Pozitivno asimetri~na distribucija frekvencija

90

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Kod simetrine distribucije frekvencija vrijednosti aritmetike stedine,


medijane i moda meusobno su jednake ( x M e M o ). Kod pozitivne
asimetrije (asimetrije "udesno") pomjera se aritmetika sredina u odnosu na
mod ka veim vrijednostima jedinica posmatranja, odnosno vrijedi:

x M e M o . Kod negativne asimetrije (asimetrije "ulijevo") pomjera se


aritmetika sredina u odnosu na mod ka manjim vrijednostima jedinica
posmatranja, odnosno vrijedi: x M e M o .
Kad je distribucija simetrina ovaj koeficijent jednak je nuli. Za asimetrine
distribucije vrijednost ovog koeficijenta kree se u intervalu 1 .
Ova svojstva Pirson (Pearson) je iskoristio za definiciju koeficijenta
asimetrije, koji predstavlja odnos razlike aritmetike sredine i moda prema
standardnoj devijaciji, tj.:
x Mo
S K1
SD
Zbog nedostataka moda kao mjere centralne tendencije, a imajui u vidu da
je M o x 3( x M e ) u sluaju kad asimetrija nije velika, moe se Pirsonov
koeficijent asimetrije iskazati i u obliku:

S K2

3( x M e )
SD

Kad je ovaj koeficijent jednak nuli to je znak da je distribucija simetrina, a


kad se njegove vrijednosti pribliavaju 3 to, zavisno od predznaka,
oznaava naglaenu pozitivnu ili negativnu asimetriju distribucije
frekvencija.
Jo se koristi, kao mjera asimetrije, i mjera zasnovana na vrijednostima
prvog i treeg kvartila i medijane, poznata pod nazivom Bovlijev (Bowley)
koeficijent asimetrije. Ova mjera asimetrije polazi od injenice da je kod
asimetrinih distribucija frekvencija razlika izmeu treeg kvartila i
medijane jednaka razlici medijane i prvog kvartila, tj. Q3 - Me = Me Q1 .
Odatle izraz za ovaj koeficijent glasi:
Sa

(Q1 Q3 ) 2M e
Q3 Q1

91

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Vrijednost Bovlijevog koeficijenta asimetrije jednaka je nuli za simetrinu


distribuciju, dok mu se u sluaju asimetrine distribucije vrijednost kree u
interval 1.

Koficijent spljotenosti
Odnos etvrtog momenta i standardne devijacije na etvrti stepen predstavlja
relativnu mjeru spljotenosti, koja se oznaava sa 4:

M4
SD 4

Ako je 4 = 3, smatra se da distriducija ima normalnu spljotenost. Ako je


4 > 3 distriducija je vie izduena, odnosno spljotenost je manja od
normalne. Ako je 4 < 3 distriducija je vie spljotena, odnosno spljptenost
je vea od normalne (Slike a, b, c).

Slika a) Oblici spqo{tenosti:


spqo{tenost mawa od normalne

Slika b) Oblici spqo{tenosti:


normalna spqo{tenost

Slika c) Oblici spqo{tenosti:


spqo{tenost ve}a od normalne
92

>3

=3

<3

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

3.

Analitika statistika

Statistika analiza
Statistika analiza predstavlja posljednju i istovremeno krunsku fazu kako
statistike obrade tako i kompletnog istraivanja. Statistika analiza je
matematiko logiki postupak donoenja zakljuaka o problemu istraivanja,
na osnovu rezultata adekvatno odabranih i pravilno primjenjenih specifinih
statistikih metoda, analitikih metoda. Primjena svakog analitikog metoda
rezultira donoenjem statistikog zakljuka. Statistiki zakljuci donose se
na osnovu egzaktnih matematiko-statistikih pravila odluivanja specifinih
za primjenjeni tip analitikog metoda. Na osnovu statistikog zakljuka
donose se struni zakljuak, u oblasti u kojoj se istrauje, na primjer,
zakljuak u oblasti prirodnih, tehnikih, agronomskih, medicinskih,
drustvenih, humanistikih nauka.
Logiko transponovanje statistikog u struni zakljuak veoma je osjetljiv
tranutak statistike analiza jer interpretacija statistikog zakljuka nije vie
stvar egzaktnih statistikih pravila nego opteg i strunog iskustva i
sposobnosti analitikog rezonovanja istraivaa. Objedinjavanjem znaenja
svih strunih zakljuaka formira se opti, generalizovani zakljuak o
problemu istraivanja. Ukoliko generalizovani zakljuak sadri nove
zakonomjernosti o ispitivanom problemu on postaje teorija bazine nauke u
kojoj je primjenjeno statistiko istraivanje.
Statistiki zakljuci o problemu istraivanja donose se najee na osnovu
ispitivanja reprezentativnog dijela osnovnog skupa tj. na osnovu rezultata
dobijenih obradom podataka iz uzorka. Apsolutna vjerodostojnost (tanost)
ovako dobijenih zakljuaka, odnosno apsolutna podudarnost zakljuka
dobijenog na osnovu uzorka sa zakljukom koji bi se dobio ispitivanjem
osnovnog skupa, moe se slobodno smatrati nevjerovatnim dogaajem.
Zakljuci izvedeni na osnovu ispitivanja uzorka uvijek, manje ili vie,
odstupaju od zakljuaka dobijenih na osnovu ispitivanja osnovnog skupa.
Oni prema tome predstavljaju procjenu pravog stanja ispitivanog problema u
osnovnom skupu. Zbog toga, zakljuci izvedeni na osnovu ispitivanja uzorka
uvijek sa sobom nose mogunost manje ili vee greke. Naunu vrijednost
obezbjeuje im mogunost utvrivanja stepena njihove izvjesnosti tj.
sigurnosti.
93

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sigurnost statistikog zakljuivanja garantuje, unaprijed izraunata


maksimalno dozvoljena greka u zakljuivanju. Odreivanje nivoa greke, a
preko nje i nivoa sigurnosti, statistikog zakljuka omoguava teorija
vjerovatnoe.
Osnovni pojmovi bitni za razumijevanje statistikog naina zakljuivanja su:
- vjerovatnoa sigurnosti,
- vjerovatnoa greke i
- nivo znaajnosti.
Vjerovatnoa sigurnosti: Vjerovatnoa sigurnosti (izvjesnosti) je minimalna
vjerovatnoa koja govori u prilog donesenog zakljuka. Ona garantuje
ispravnost zakljuka.
Vjerovatnoa greke: Vjerovatnoa greke (rizika) je maksimalna
vjerovatnoa dopustive greke u zakljuivanju.
Vjerovatnoa sigurnosti i vjerovatnoa greke su parcijalne komplementarne
vjerovatnoe pa se dopunjuju do vrijednosti ukupne vjerovatnoe, do
jedinice ili do sto procenata.
Nivo znaajnosti: Komplementarni odnos vjerovatnoe sigurnosti i
vjerovatnoe greke tj. rizika definie nivo znaajnosti zakljuka.
Konvencijom su utvrena dva granina nivoa znaajnosti.
"Minimalni nivo znaajnosti": Minimalni nivo znaajnosti u medicinskim
istraivanjima, uslovljen je maksimalno dozvoljenom grekom od pet
procenata. Minimalni nivo znaajnosti definisan je, prema tome, odnosom
vjerovatnoe sigurnosti od 0,95 (95%) i vjerovatnoe greke tj. rizika od
0,05 (5%).
Minimalni nivo znaajnosti obezbjeuje znaajnost statistikog zakljuka.
"Maksimalni nivo znaajnosti": Drugi, konvencijom utvren granini nivo
znaajnosti definisan je odnosom vjerovatnoe sigurnosti od 0,99 (99%) i
vjerovatnoe greke odnosno rizika od 0,01 (1%). Ovaj granini nivo
znaajnosti obezbjeuje visoku znaajnost statistikog zakljuka.
Statistiki zakljuak odnosi se na uzorke osnovnog skupa, jednake veliine,
ispitivane pod istim uslovima i na isti nain. Ako se neki statistiki zakljuak
donese sa vjerovatnoom sigurnosti od 0,95 to znai da e se ispitivana
karakteristika ili pojava sigurno ostvariti u 95 od 100 takvih uzoraka, a da u
5 od 100 uzoraka ovaj zakljuak, moe ali ne mora vaiti.
94

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Stepen slobode: Pored navedenih pojmova jo se definie i stepen slobode


kao statistiki parametar od opteg znaaja.
DF = r - s
gdje je DF - stepen slobode (Degree of Fredom), r - broj lanova
posmatranog niza (broj podataka), s - broj statistikih parametara potrebnih
za izvoenje konkretnog analitikog metoda.
U odnosu na cilj i nain odluivanja (zakljuivanja) razlikuju se dvije vrste
statistike analize:
- ocjenjivanje karakteristika (parametara) osnovnog skupa i
- ispitivanje statistikih hipoteza.
U prvom sluaju procjenjuju (ocjenjuju) se kvantitativne karakteristike
odnosno vrijednosti parametara osnovnog skupa. Nepoznata vrijednost
parametara osnovnog skupa procjenjuje se metodom intervala povjerenja
(pouzdanosti), a na osnovu ocjene tog parametra izraunatog iz uzorka. U
drugom sluaju ispituje se neka nauna pretpostavka (hipoteza) o uoenoj
pojavi.
Pod ispitivanjem postavljene hipoteze podrazumijeva se postupak provjere
njene istinitosti (ispravnosti), odnosno postupak procjene znaajnosti
ispitivane pojave.
Postupkom provjere ispravnosti hipoteze moe se procjenjivati:
- znaajnost slinosti oblika raspodjela,
- znaajnost razlike i
- znaajnost paralelizma (povezanosti, zavisnosti).
Znaajnost slinosti oblika raspodjela
Znaajnost slinosti oblika raspodjela izvodi se sloenim postupkom od vie
faza koji u sebe, izmeu ostalog ukljuuje i testiranje hipoteze.
Analitiki statistiki metodi dijele se na parametarske, ako se pretpostavlja
poznavanje oblika raspodjele i neparametraske koji ne trae da se poznaje
oblik raspodjele.
Znaajnost razlike
Znaajnost razlike procjenjuje se metodima testiranja hipoteza.
Znaajnost paralelizma
Znaajnost paralelizma ispituje se metodima regresije i korelacije.
3.1.1. Ispitivanje hipoteze
Ispitivanje hipoteze predstvalja postupak provjere istinotosti naune
pretpostavke o pojavi koja se ispitje. Ispitivanje hipoteze, odnosno procjena
95

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

znaajnosti sve tri ispitivane pojave (slinosti oblika raspodjele, razlike i


paralelizma tj. povezanosti) ima istovjetnu logiku proceduru odnosno faze
postupka.
Postoji est faza ispitivnja hipoteze:
formulisanje statistikih hipoteza;
izbor nivoa znaajnosti;
izbor analitikog metoda;
izraunavanje empirijske vrijednosti metoda;
odreivanje teorijske vrijednosti metoda;
podeenje empiriske i teorijske vrijednosti metoda - donoenje
statistikog zakljuka;
_______________________________________________________
donoenje medicinskog zakljuka
Formulacija statistikih hipoteza: Ispitivanje statistikih hipoteza
podrazumijeva obavezno postojanje dvije, jasno definisane, po zvom
znaenju suprotne hipoteze. Statistike hipoteze obiljeavaju se velikim
latininim slovom ha (H). Prva tzv. radna hipoteza, koja se obiljeava sa H1,
postavlja se sa ciljem da bude prihvaena, jer sadri pretpostavku koja je po
miljenju istraivaa tana. Druga tzv. nulta hipoteza, koja se obiljeava sa
H0, postavlja se sa ciljem da bude odbaena jer sadri pretpostavku koja je
po miljenju istraivaa pogrena.
Postupkom ispitivanja hipoteza provjerava se ispravnost (istinitost) nulte
hipoteze a indirektno, preko ispravnosti nulte, ispravnost radne hipoteze.
Dakle, nulta hipoteza je pretpostavka koja se u toku analize smatra tanom i
cjelokupno ispitivanje hipoteza poiva na pretpostavci da je H0 istinita.
Prihvatanjem nulte odbacuje se radna hipoteza i donosi statistiki zakljuak
koji je uslovljen znaenjem nulte hipoteze. Obrnuto, odbacivanjem nulte
automatski se prihvata radna hipoteza i donosi zakljuak uslovljen radnom
hipotezom.
Radna (alternativna) hipoteza: Nauna pretpostavka pomou koje se dovodi
u vezu ispitivana pojava i cilj istraivanja naziva se radna ili alternativna
hipoteza H1. Ova hipoteza objanjava nastanak ispitivane pojave pod
uticajem konkretnog organizavanog faktora djelovanja pa se on smatra
uzrokom njenog nastanka.
S obzirom na mnogobrojnost i raznovrsnost radnih hipoteza, njihova
objektivna prihvatljivost, najjednostavnije se verifikuje njenom
konfrontacijom sa, njoj suprotnom, nultom hipotezom.

96

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Nulta hipoteza: Indirektna provjera validnosti radne preko nulte hipoteze


mogua je zahvaljujui specifinom znaenju nulte hipoteze. Za razliku od
radne, nulta hipoteza ne ispoljava ni brojnost ni raznovrsnost, ve naprotiv,
istovjetnost odnosno uniformnost tvrenja.
Nulta hipoteza tvrdi da je prouavana pojava rezultat sluajnih zbivanja pa
se zbog toga ne moe smatrati znaajnom. Prema tome, nulta hipoteza je
teorijska hipoteza, odnosno standard za procjenu validnosti radne hipoteze.
Zavisno od ispitivane pojave i cilja istraivanja statistike hipoteze mogu se
formulisati na dva naina odnosno mogu imati dvije forme, dva oblika:
jednosmjerni i
dvosmjerni.
Hipoteza je dvosmjerna ako se formulie tako da zanemaruje mogui smjer
variranja pojave. Na primjer: pojava A se razlikuje od pojave B ili pojava A
je povezana sa pojavom D.
Ako se statistike hipoteze formuliu tako da uzimaju u obzir i mogui smjer
variranja pojave radi se o jednosmjernom tipu hipoteze. Na primjer: pojava
A je ea, vea od pojave B, pojava C je rijea, manja od pojave D; pojava
A je povezana sa pojavom D u pozitivnom smislu; pojava B povezana je sa
pojavom C u negativnom smislu; itd.
Hipoteze se obavezno formuliu prije poetka istraivanja, jer se time
izbjegava subjektivnost istraivaa.
Izbor nivoa znaajnosti: Izbor nivoa znaajnosti donoenja statistikih
zakljuaka vri se prije poetka istraivanja. Nivoom znaajnosti direktno se
bira i kontrolie vjerovatnoa odbacivanja istinite (tane) nulte hipoteze. Na
izbor nivoa znaajnosti utie vie faktora a najbitniji je svakako znaaj
problema koji se razmatra, odnosno mogue posljedice odluke zasnovane na
zakljuku ispitivanja statistikih hipoteza.
Izbor analitikog metoda: U okviru izbora odgovarajueg analitikog
metoda vri se izbor vrste, tipa i konkretne formule metoda. Izbor vrste
metoda direktno je uslovljen ciljem ispitivanja hipoteze. Tako se za procjenu
znaajnosti razlike koristi odgovarajui statistiki test a za procjenu
povezanosti odgovarajui metodi regresije i korelacije. Izbor tipa
(parametarski i neparametarski metod) te formule metoda zavisi od uslova
primjene i konkretne situacije.
Izraunavanje empirijske vrijednosti metoda: Empirijska vrijednost metoda
uslovljena je informacijom (podacima) iz uzorka.
97

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Rauna se tako da se raspoloivi podaci dobijeni istraivanjem uvrste u


formulu analitikog metoda. Od iznosa empirijske vrijednosti metoda
direktno zavisi zakljuak ispitivanja hipoteza.
Odreivanje teorijske vrijednosti metoda: Teorijska vrijednost metoda
bazirana je na tzv. nultoj (hipotetikoj) raspodjeli. Nulta raspodjela
predstavlja raspodjelu vjerovatnoa analitikog metoda pod uslovom da je
nulta hipoteza istinita. Nulta (hipotetika)
raspodjela obuhvata one
vrijednosti analitikog metoda koje se mogu izraunati na osnovu svih
uzoraka koji potiu iz osnovnog skupa kada je stvarna vrijednost parametara
skupa jednaka njegovoj hipotetikoj vrijednosti.
Postoje dvije grupe vrijednosti analitikog metoda, one koje su vjerovatne i
one koje su malo vjerovatne. Skup malo vjerovatnih vrijednosti izabranog
analitikog metoda naziva se oblast odbacivanja nulte hipoteze. Skup svih
preostalih vrijednosti analitikog metoda naziva se oblast prihvatanja nulte
hipoteze.
Da bi se razgraniila oblast prihvatanja od oblasti odbacivanja nulte hipoteze
potrebno je precizirati vrijednost male vjerovatnoe javljanja vrijednosti
primjenjenog analitikog metoda odnosno, treba odrediti koliko treba biti
mala vjerovatnoa javljanja vrijednosti analitikog metoda da bi se odbacila
nulta hipoteza. Izborom nivoa znaajnosti upravo se odreuje prihvatljivo
mali nivo vjerovatnoe odbacivanja istinite nulte hipoteze. Poloaj
odbacivanja nulte hipoteze odreen je formulacijom radne hipoteze. Ako se
radi o ispitivanju pojave koja varira u oba smjera, tj. ukoliko se radi o
dvosmjernom nainu ispitivanja hipoteza, oblast odbacivanja simetrino je
rasporeena na oba kraja teorijske (hipotetike distribucije); vidi slike
3.1.1.1.-3.1.1.6!
f(z)

0,025

0,025

0,475

0,475
0,95

-z

- Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1

0
H0
Oblast
prihvatanja H0

+z

+ Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1

Slika 3.1.1.1: Koncept dvosmjernog testiranja: p=0,05

98

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
f(z)

0,005

0,005
0,495

0,495
0,99

-z

- Zp
H1

H0

Oblast odbacivanja H0 i
prihvatanja H1

+z

+ Zp

H1

Oblast
prihvatanja H0

Oblast odbacivanja H0 i
prihvatanja H1

Slika 3.1.1.2: Koncept dvosmjernog testiranja: p=0,01


Ako se radi o jednosmjernom nainu ispitivanja hipoteza, oblast odbacivanja
nulte hipoteze (vjerovatnoa greke) nalazi se samo na jednoj strani nulte
distribucije. Ako pojava varira ulijevo oblast odbacivanja nulte hipoteze
nalazi se na lijevoj strani distribucije (slike 3.2.3.-3.2.4.), a ako pojava varira
udesno oblast odbacivanja nulte hipoteze nalazi se na desnoj strani nulte
distribucije.
f(z)

0,05

0,45

0,5
0,95

-z

- Zp

+ Zp

H1

+z

H0

Oblast odbacivanja H0 i
prihvatanja H1

Oblast
prihvatanja H0

Slika 3.1.1.3: Koncept jednosmjernog testiranja ulijevo: p=0,05


f(z)

0,001
0,49

0,495
0,99

-z

- Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1

+ Zp

+z

H0
Oblast
prihvatanja H0

Slika 3.1.1.4: Koncept jednosmjernog testiranja ulijevo: p=0,01

99

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
f(z)

0,05

0,5

0,45
0,95

-z

+z

+ Zp

0
H0

H1
Oblast odbacivanja H0 i
prihvatanja H1

Oblast prihvatanja H0

Slika 3.1.1.5: Koncept jednosmjernog testiranja udesno: p=0,05


f(z)

0,001
0,5

0,49
0,99

-z
0
H0

Oblast prihvatanja H0

+z

+ Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1

Slika 3.1.1.6: Koncept jednosmjernog testiranja udesno: p=0,01


Vrijednosti primjenjenog analitikog metoda koje razdvajaju oblast
prihvatanja od oblasti odbacivanja nulte hipoteze nazivaju se granine
odnosno teorijske vrijednosti i odreuju se primjenom odabranog nivoa
vjerovatnoe greke prve vrste () (nivo znaajnosti) na formiranu
hipotetiku raspodjelu vjerovatnoa vrijednosti analitikog metoda.
Za svaki analitiki metod izraunati su i svrstani u tablice svi numeriki
iznosi teorijskih vrijednosti.

Poreenje empiriske i teorijske vrijednosti metoda - donoenje statistikog


zakljuka: Statistiki zakljuak donosi se poreenjem izraunate
(empirijske) i odreene (teorijske) tj. granine vrijednosti izabranog
analitikog metoda. Ukoliko empirijska vrijednot ima veliku vjerovatnou
javljanja kada je nulta hipoteza istinita ona potvruje (podrava) istinitost
nulte hipoteze. I obrnuto, ako je empirijska vrijednost malo vjerovatna kad je
nulta hipoteza istinita ona diskvalifikuje nultu a potvruje radnu hipotezu.
Imajui u vidu znaenje teorijskih vrijednosti analitikog metoda razlikuju se
dva principa donoenja statistikog zakljuka.
100

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prvi princip Kada je teorijska vrijednost metoda maksimalna vrijednost


analitikog metoda za koju jo uvijek vai nulta hipoteza:
a) ako je empirijska vrijednost metoda manja od teorijske odreene za
vjerovatnou rizika od 0,05 prihvata se nulta a odbacuje radna hipoteza i
donosi se zakljuak da ispitivana pojava nije statistiki znaajna (p> 0.05);
b) ako je empirijska vrijednost metoda vea od teorijske odbacuje se nulta
a prihvata radna hipoteza i zakljuuje da je ispitivana pojava statistiki
znaajna (p < 0,05) odnosno visoko znaajna (p < 0,01) u zavisnosti od
nivoa znaajnosti odabranog za procjenu hipoteza.
Drugi princip Kada je teorijska vrijednost metoda maksimalna vrijednost
za koju je pojava (u ovom sluaju razlika) jo uvijek znaajna:
a) ako je empirijska vrijednost manja od granine odbacuje se nulta a
prihvata radna hipoteza i zakljuuje se da je razlika jo uvijek znaajna
(p<0,05) odnosno, visoko znaajna (p<0,01) u zavisnosti od izabranog nivoa
znaajnosti;
b) ako je empirijska vrijednost vea od granine prihvata se nulta a
odbacuje radna hipoteza i zakljuuje da razlika vie nije statistiki visoko
znaajna (p > 0,01) odnosno znaajna (p > 0,05).
Ovdje emo prihvatiti i koristiti prvi princip, odnosno, kada je teorijska
vrijednost metoda maksimalna vrijednost analitikog metoda za koju jo
uvijek vai nulta hipoteza:
a) ako je empirijska vrijednost metoda manja od teorijske odreene za
vjerovatnou rizika od 0,05 prihvata se nulta a odbacuje radna hipoteza i
donosi se zakljuak da ispitivana pojava nije statistiki znaajna (p>
0.05);
b) ako je empirijska vrijednost metoda vea od teorijske odbacuje se nulta a
prihvata radna hipoteza i zakljuuje da je ispitivana pojava statistiki
znaajna (p < 0,05) odnosno visoko znaajna (p < 0,01) u zavisnosti od
nivoa znaajnosti odabranog za procjenu hipoteza.
3.1.2. Greke u zakljuivanju
Kako se statistiki zakljuci baziraju na informaciji dobijenoj iz uzorka pri
ispitivanju statistikih hipoteza uvijek je prisutan izvjesan stepen rizika tj.
mogunost greke. Postupak procjene ispravnosti hipoteze ima, zbog toga,
etiri mogua ishoda.

101

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Stvarnost
Nulta hipoteza
tana
Nulta hipoteza
pogrena

Testiranje nulte hipoteze


Odluka
Nulta hipoteza se prihvata Nulta hipoteza se odbacuje
Pravilna odluka (1-)

Greka I vrste ()

Greka II vrste ()

Pravilna odluka (1-)

Ispravan zakljuak donosi se u sluaju da se prihvati tana ili da se odbaci


pogrena nulta hipoteza. Pogrean zakljuak donosi se u sluaju da se odbaci
tana ili da se prihvati pogrena hipoteza. Odbacivanjem tane nulte hipoteze
ini se greka prve vrste. Prihvatanjem pogrene nulte hipoteze ini se greka
druge vrste. (Napomena: Pri zakljuivanju moe se nainiti samo jedna
greka, a nikako obe istovremeno). anse javljanja greaka (vjerovatnoe
njihovog pojavljivanja) u zakljuivanju mogue je odreivati i kontrolisati.
Greka I vrste ():Vjerovatnoa odbacivanja tane nulte hipoteze tj.
vjerovatnoa javljanja greke I vrste obiljeava se sa alfa (). Vjerovatnoa
greke prve vrste, koja se jo naziva i rizik , predstavlja uslovnu
vjerovatnou
= P (greka I vrste)
= P (H0 odbaena/ H0 je tana)
S obzirom da je vjerovatnoa greke I vrste (), maksimalna vjerovatnoa
dopustive greke koju istraiva unaprijed zadaje imajui u vidu problem
istraivanja, ona uslovljava nivo znaajnosti donoenja zakljuka.
Komplementarna greki I vrste je vjerovatnoa nivoa znaajnosti, odnosno
vjerovatnoa sigurnosti donesenog zakljuka koja iznosi 1 - To znai, ako
je zadana greka =0,05 (5%), da e vjerovatnoa sigurnosti iznositi 0,95
(95%). Smanjenje rizika poveava granine vrijednosti metoda a time
proiruje oblast prihvatanja nulte hipoteze koji iznosi 1 - .
Greka II vrste ( )
Vjerovatnoa prihvatanja pogrene nulte hipoteze tj. vjerovatnoa javljanja
greke II vrste obiljeava se sa Rizik predstavlja uslovnu vjerovatnou
= P (greka II vrste)
= P (H0 prihvaena / H0 je pogrena)
Vjerovatnoa koja je komplementarna vjerovatnoi greke druge vrste
(1 predstavlja vjerovatnou da e se primjenom konkretnog metoda
odbaciti pogrena nulta hipoteza.

102

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Dok je vjerovatnoa greke prve vrste (rizik pod direktnom kontrolom


istraivaa, vjerovatnoa greke druge vrste (rizik indirektno je pod
njegovom kontrolom.
Nivo vjerovatnoe greke druge vrste uslovljavaju etiri faktora:
stvarna vrijednost parametra ispitivanog problema,
nivo vjerovatnoe greke prve vrste
veliina uzorka i
smjer procjene ispravnosti hipoteza.
to je stvarna vrijednost ispitivanog parametra blia njegovoj hipotetikoj
vrijednosti to je rizik prihvatanja pogrene nulte hipoteze vei. I obrnuto, to
je ova razlika vea rizik je manji. Razlika stvarne i hipotetike vrijednosti
nominirana je odgovorajuom standardnom grekom SE (Standard Error).
Jedini nain da se vjerovatnoa jedne greke smanji, a da se pri tome
automatski ne povea rizik javljanja druge greke je obezbjeivanje bolje
informacione osnove za procjenu ispravnosti hipoteza tj. poveanje veliine
uzorka (n). Porast veliine uzorka smanjuje vjerovatnou javljanja greke
sd
druge vrste tako to smanjuje standardnu greku ocjene SE
od koje
n
proporcionalno zavisi vjerovatnoa rizika.
3.1.3. Jaina, efikasnost i osjetljivost metoda
Jaina metoda: Jaina, snaga, odnosno mo metoda je maksimalna
mogunost metoda da garantuje ispravnost (tanost) zakljuka, odnosno
sposobnost metoda da otkrije pogrenu hipotezu. Jaina metoda najee se
oznaava sa . Mjeri se nivoom vjerovatnoe odbacivanja neistinite
(pogrene) nulte hipoteze. Prema tome ona predstavlja komplementarnu
vjerovatnou vjerovantnoe greke II vrste pa je njihov zbir jednak jedinici.
Jaina metoda takoe je uslovna vjerovatnoa.
= 1

= P (H0 odbaena / H0 je pogrena)


Nivo vjerovatnoe odbacivanja pogrene nulte hipoteze odreuju isti faktori
kao i rizik II vrste ali dejstvo ovih faktora ima suprotno djelovanje na njih.
Jaina metoda je obrnuto proporcionalna riziku druge vrste. Jaina metoda
utoliko je vea ukoliko je hipotetika vrijednost parametra ispitivanog
problema blia njegovoj stvarnoj vrijednosti. Promjene rizika prve vrste i
jaine metoda odvijaju se u istom smislu, odnosno sa porastom vjerovatnoe
greke I vrste raste i jaina metoda i obrnuto. Porast veliine uzorka
103

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

utie na porast jaine metoda, odnosno vei uzorak obezbjeuje veu


vjerovatnou odbacivanja pogrene nulte hipoteze.
Efikasnost metoda: Efikasnost metoda je relativna jaina metoda. Dobija se
poreenjem jaine jednog metoda sa jainom drugog metoda, tj. standardnog
metoda. Standardni metod je, obino, najjai metod za uslove pod kojima se
poreenje moe vriti.
Postizanje eljenog nivoa efikasnosti zasniva se na odreivanju veliine
uzorka neophodnog za obezbjeivanje odreene jaine metoda. Relativna
efikasnost metoda koja se najee obiljeava sa e(A,B) procjenjuje se na
osnovu recipronog odnosa veliina uzoraka bilo koja dva uporeena metoda
(nA/nB). Sa nA oznaava se broj opservacija koje zahtijeva metod A da bi
postigao istu jainu koa i metod B zasnovan na broju opservacija nB.
Podrazumijeva se da oba metoda ispituju istu nultu hipotezu (H0) u odnosu
na istu radnu hipotezu (H1) i na istom nivou znaajnosti, tj. sa istom
vjerovatnoom greke prve vrst ().
Na osnovu definicije slijedi da je metod A efikasniji od metoda B ako je
efikasnost vea od jedinice (e(A,B) > 1) jer mu je potrebno manje
opservacija da bi postigao istu jainu kao i metod sa kojim je uporeivan. I
obratno, ako je efikasnost manja od jedan znai da je metodu A, da bi imao
istu jainu kao i metod sa kojim se uporeuje, potrebno onoliko vie
opservacija koliko je vrijednost efikasnosti manja od jedinice. (Primjer:
e(A,B) = 0,90; 1 - 0,9 = 0,1 = 10%). Kada je vrijednost efikasnosti bliska
jedinici u najveem broju sluajeva oba metoda davae iste zakljuke. U
praktinoj primjeni relativne efikasnosti metoda dolazi do tekoa jer ona
zavisi od radne hipoteze (a broj radnih hipoteza moe biti beskonaan),
oblika raspodjele osnovnog skupa kome pripada uzorak i veliine uzorka.
Osjetljivost metoda: Osjetljivost ili robusnost metoda pokazuje ponaanje
metoda u uslovima razliitog stepena naruenosti pretpostavki (npr.
normalnosti, homogenosti, simetrinosti itd.) o osnovnom skupu iz koga
potiu uzorci.
3.1.4. Analitiki metodi
Prema cilju primjene, analitiki metodi razvrstavaju se u etiri grupe:
analitiki metodi za procjenu parametara osnovnog skupa;
analitiki metodi za procjenu slinosti oblika raspodjela;
analitiki metodi za procjenu razlike i
analitiki metodi za procjenu paralelizma (povezanosti, zavisnosti).
104

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prema uslovima primjene razlikuju se dvije osnovne grupe analitikih


metoda:
parametarski analitiki metodi i
neparametarski analitiki metodi.
Parametarski analitiki metodi: Primjena parametarskih metoda uslovljena
je poznavanjem raspodjele frekvencija statistikog skupa (osnovnog ili
uzorka) i mogunou izraunavanja deskriptivnih statistikih parametara.
Ako je normalnost raspodjele osnovnog skupa samo pretpostavka, a
normalnost uzorka nije mogue provjeriti (zbog malog broja jedinica
posmatranja) za primjenu parametaraskog metoda mora se obezbjediti makar
minimum zahtjeva, a to znai homogenost vrijednosti obiljeja posmatranja.
Neparametarski analitiki metodi: Za razliku od parametarskih metoda koji
zahtijevaju cijeli niz striktnih preduslova primjene, neparametarski metodi
najee zahtijevaju samo neprekidnost (kontinuiranost) raspodjele
osnovnog skupa. ak i kada je pretpostavka o neprekinutosti naruena
ststistiki zakljuak u velikoj mjeri ostaje na snazi. Neparametarski metodi
mogu se primjenjivati uvijek, tj. u svim empirijskim situacijama. Njihova
primjena je obavezna u onim empirijskim situacijama koje iskljuuju
primjenu parametarskih analitikih metoda. Dakle, moraju se upotrebljavati
ako su empirijski podaci:
atributivnog karaktera ili ako su nejasno mjerno-numeriki definisani i
parametarskog ali heterogenog karaktera (CV > 30%).
Ovim analitikim metodima, za razliku od parametarskih, procjenjuje se
znaajnost ispitivanja pojave na osnovu medijane, empirijskih (apsolutnih)
frekvencija ili na osnovu rangiranih vrijednosti empirijskih podataka. U
idealnim uslovima primjene (ispunjeni svi uslovi za primjenu) parametarski
metodi jai su od neparametarskih.
Od analitikih metoda na raspolaganju je:
metod intervala povjerenja;
deskriptivni parametri teorijskih modela raspodjela - parametarski;
Hi kvadrat () test kao neparametarski metodi za procjenu oblika
raspodjela;
za procjenu znaajnosti razlike: zed (Z) i te (t) test kao parametarski, a
, Fierov, Mek Nemarov test, test predznaka, test ekvivalentnih parova
i test sume rangova kao neparametarski;
za procjenu oblika paralelizma (povezanosti i zavisnosti): metod linearne
regresije
za procjenu jaine paralelizma: metod jednostruke korelacije
(parametarski) i Spirmanova korelacija ranga (neparametarski)

105

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

3.2. Teorijska statistika


3.2.1. Vjerovatnoa
Nastanak i razvoj vjerovatnoe
Teorija vjerovatnoe je matematika disciplina koja daje okvir za ispitivanje
sluajnih pojava, tj. takvih empirijskih fenomena i situacija iji ishodi nisu
uvijek definisani, ali za njih postoji neka statistika regularnost.
Razjasniemo ovo na jednostavnom primjeru bacanja novia. Pravilan
(ispravan u fizikom smislu) novi bacamo u vis iznad ravne povrine i pri
njegovom padu na tu povrinu mogua su dva ishoda: na gornjoj strani je
pismo ili glava. Iz iskustva nam je poznato da je mogunost da novi ostane
uspravan praktino nemogu dogaaj. Takoe, ne moemo unaprijed znati
da li e pasti pismo ili glava, to znai ishod nije definisan. Ako novi
bacamo mnogo puta, glava e pasti u priblino polovini sluajeva i to je
statistika regularnost koja odlikuje ovu sluajnu pojavu. U svakodvnevnom
govoru opisujemo ovu pojavu reenicom: "Vjerovatnoa da e pasti glava je
50%" i svima nam je intuitivno jasno ta ta reenica znai.
Poetak razvoja teorije vjerovatnoe vezuje se za 17. vijek i za imena
francuskih matematiara Paskala i Fermaa (Blaise Pascal, 1623-1662, Pierre
de Fermat, 1601-1665). Godine 1654. Paskalu je jedan prijatelj kockar
postavio sljedei problem: Dva igraa se dogovore da ulog u igri dobije onaj
koji prvi odnese tri pobjede. Poslije dvije pobjede prvog i jedne pobjede
drugog igraa, igra je sticajem okolnosti morala biti prekinuta. Na koji nain
treba poteno podijeliti ulog a da to odraava realne anse za pobjedu koje
ima svaki od igraa? Paskal je naao da su anse za pobjedu 3:1 u korist
prvog igraa i predloio je podjelu uloga u tom odnosu. esto se uzima da je
tada poeo teorijski razvoj vjerovatnoe. Ona je dugo bila usko povezana sa
problemima hazardnih igara.
Razvoju teorije vjerovatnoe znaajno su doprinijeli: Abraham de Moavr
(Abraham de Moivre, 1667-1754), ak Bernuli (Jacques Bernoulli, 16651705) Pjer Laplas (Pierre Laplace, 1749-1827), Simeon Poason (Simeon
Poisson, 1781-1840), Karl Fridrih Gaus (Carl Friedrich Gauss, 1777-1855),
Pafnutij Ljvovi ebijev (1821-1894), Andrej Andrejevi Markov (18561922). Poseban doprinos dao je A.N. Kolmogorov, ruski matematiar koji je
najvie zasluan za aksiomatizaciju vjerovatnoe (1933. godine) i njen dalji
razvoj kao moderne matematike discipline.

106

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Elementi teorije vjerovatnoe


Kako je ve reeno vjerovatnoa se bavi sluajnim dogaajima. Sluajni
dogaaj se definie kao dogaaj koji se u datim uslovima i u datom momentu
moe oekivati ali se ne mora nuno i ostvariti. Nasuprot sluajnim
dogaajima postoje nuni, odnosno sigurni dogaaji. Primjer nunog
dogaaja je posljedica bacanja metalnog novia u vazduh, koji zbog sile
tee mora pasti na tlo. Dakle, padanje novia na tlo je siguran dogaaj.
Meutim, novi moe pasti tako da je na gornjoj strani grb a na donjoj
pismo ili obratno. Pojava pisma ili grba je sluajna.
Mjera oekivanja dogaaja, odnosno mjera sluajnosti dogaaja naziva se
vjerovatnoa. Vjerovatnoa dogaaja moe se izraunati na vie naina.
Osnovna su dva naina odnosno koncepta vjerovatnoe: objektivna (teorijska
i statistika) i subjektivna vjerovatnoa.
Teorijska vjerovatnoa: Teorijska vjerovatnoa naziva se jo matematika
ili a priori vjerovatnoa. Ona se rauna unaprijed i nije zavisna od
eksperimenta. Klasinu definiciju matematike vjerovatnoe dao je Laplas
(1812), a savremenu definiciju dao je Kolmogorov (1933).
Definicija (Laplas): Vjerovatnoa a priori jednog dogaaja je odnos broja
za njega oekivanih ishoda prema broju svih jednako moguih ishoda.
Definicija (Kolmogorov): Vjerovatnoa nekog dogaaja je samo broj
pridruen tom dogaaju.
Statistika vjerovatnoa: Statistika (frekvencijska, empirijska) ili
vjerovatnoa a posteriori odreuje se nakon ostvarivanja posmatranog
dogaaja a na osnovu rezultata istraivanja.
Definicija: Vjerovatnoa a posteriori je odnos broja ostvarenih (oekivanih)
ishoda prema ukupnom broju moguih ishoda.
Iznosi vjerovatnoa a priori i a posteriori esto se meusobno razlikuju,
meutim vjerovatnoa a posteriori sve vie se pribliava vjerovatnoi a priori
to je vei broj eksperimenata. Ovaj odnos izmeu vjerovatnoa a priori i a
posteriori naziva se zakon velikih brojeva. Definisao ga je Bernuli, a
pooptio Poason. Ovo je osnovni zakon u teoriji vjerovatnoe i statistici i on
glasi: Kada broj eksperimenata raste, apsolutna razlika izmeu relativne
frekvencije i vjerovatnoe se smanjuje.
To znai da ono to pojedinano moramo smatrati sluajnim, u velikoj masi
gubi karakter sluajnosti i ponaa se zakonomjerno. Ako na primjer,
procjenimo vjerovatnou povoljnog ishoda lijeenja neke bolesti na malom
broju bolesnika, ne znai da je to ujedno i stvarna vjerovatnoa izljeenja od
107

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

te bolesti. Meutim, kada se radi o iskustvu na velikom broju ispitanika tada


je takva procjena vjerovatnoe daleko blia stvarnoj vjerovatnoi izljeenja.
m( D)
P( D) lim
n
n
Subjektivna vjerovatnoa: Subjektivna vjerovatnoa predstavlja stepen
uvjerenja o realizaciji oekivanog dogaaja koji ima logiki dosljedna osoba,
odnosno ekspert ili strunjak. Pridruivanjem nekog broja izmeu 1 i 0
ekspert time izraava svoje uvjerenje u mogunost ostvarenja datog
dogaaja. Najee se subjektivna vjerovatnoa formira za dogaaje koji se
javljaju samo jedanput, ili se ponavljaju ali u tako razliitim uslovima da se
mogu posmatrati kao jedinstveni dogaaj.
Nain raunanja vjerovatnoe: Bez obzira na definiciju sve vjerovatnoe
izraunavaju se kao odnos dijela prema cjelini tj.:
m f
p
n n
gdje je:
p - vjerovatnoa
m - broj oekivanih (poeljnih) ishoda
n - ukupan broj sluajeva
f - broj opserviranih sluajeva
Karakteristike vjerovatnoe
Nenegativnost: Vjerovatnoa svakog dogaaja je nenegativan broj
PD 0 . Kada je vjerovatnoa jednaka nuli dogaaj se ne moe realizovati
kao ishod odreenog eksperimenta - nemogu dogaaj.
Normiranost: Normiranost pokazuje da je vjerovatnoa ukupnog broja
moguih dogaaja jednaka jedinici, odnosno da maksimalna vjerovatnoa
sluajnog dogaaja iznosi jedan PD 1 . Vjerovatnoa sigurnog dogaaja
uvijek je jednaka jedinici.
Aditivnost: Aditivnost pokazuje da je ukupna vjerovatnoa dogaaja jednaka
sumi vjerovatnoa moguih odnosno ostvarenih dogaaja tj.:
P D PD

108

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Osnovni pojmovi
Za razumjevanje i laki rad sa vjerovatnoama potrebno je definisati neke
osnovne pojmove u radu sa njima.
Vjerovatnoa dogaaja koji je predmet istraivanja naziva se vjerovatnoom
oekivanog dogaaja i oznaava se sa p.
p - vjerovatnoa dogaaja koji je predmet istraivanja
Vjerovatnoa dogaaja koji nije predmet istraivanja naziva se suprotnom
vjerovatnoom i obiljeava se sa q.
q - vjerovatnoa dogaaja koji nije predmet istraivanja (vjerovatnoa
suprotnog dogaaja)
Obe vjerovatnoe, oekivanog i suprotnog dogaaja jesu tzv.
komplementarne parcijalne vjerovatnoe, odnosno komplementarni dijelovi
ukupne, totalne vjerovatnoe i za njih vai da je:
p + q = 1 =100%
Parcijalna vjerovatnoa predstavlja vjerovatnou svakog pojedinanog
ishoda. Ukupna vjerovatnoa koja predstavlja zbir svih parcijalnih
vjerovatnoa istovremeno je i vjerovatnoa sigurnog dogaaja i iznosi 1 ili
100%. Vjerovatnoa nemogueg dogaaja jednaka je nuli.
Dakle, vjerovatnoa se kree u intervalu od 0, kada je oekivani dogaaj
nemogu do 1, odnosno do 100% kada je oekivani dogaaj siguran
(0 p 1).
Prema broju i nainu nastupanja dogaaja razlikuju se vjerovatnoe prostih i
sloenih dogaaja. Vjerovatnoom prostog dogaaja naziva se vjerovatnoa
samo jednog oekivanog dogaaja, tj. elementarnog dogaaja. Prema odnosu
dogaaja razlikuju se vjerovatnoe nezavisnih i zavisnih dogaaja, odnosno
iskljuivih i neiskljuivih dogaaja.
Ako se vjerovatnoa izraunava za dogaaj ije nastajenje ne zavisi od
nastupanja ili nenastupanja nekog drugog dogaaja, radi se o vjerovatnoi
nezavisnog dogaaja. Vjerovatnoe nezavisnih dogaaja esto se nazivaju i
apsolutne vjerovatnoe. Ako se vjerovatnoa izraunava za dogaaj ije
nastupanje zavisi od prethodnog nastupanja ili nenastupanja nekog drugog
dogaaja, radi se o vjerovatnoi zavisnog dogaaja.
U odnosu na iskljuivost dogaaja razlikuju se vjerovatnoe iskljuivih i
neiskljuivih dogaaja. Ako se izraunava vjerovatnoa dogaaja koji se ne
109

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

mogu desiti istovremeno radi se o vjerovatnoi iskljuivih dogaaja. Ako se


izraunava vjerovatnoa dogaaja koji se mogu desiti istovremeno radi se o
vjerovatnoi neiskljuivih dogaaja.
Pojam sluajnog dogaaja
Sluajni dogaaj se smatra osnovnim pojmom i moe se opisno shvatiti kao
dogaaj koji se pod odreenim uslovima moe a ne mora realizovati. Za
sluajni dogaaj bitno je da li se on pod odreenim uslovima realizovao ili
ne. Svaka pojava, prirodna ili drutvena, je skup dogaaja. Tako shvaena,
svaka pojava se sastoji od dva skupa. Jedan je skup uslova pod kojima se
odreena pojava odvija, a drugi je skup rezultata - ishoda posmatrane pojave.
Razumjeti neku pojavu znai shvatiti kako pojedini dogaaji koji
predstavljaju uslove djeluju na rezultate.
Dogaaje koje nazivamo uslovima dijelimo na dvije grupe. Prvu grupu ine
dogaaji za koje znamo kako djeluju na rezultete. To su faktori odreene
pojave, faktori prve vrste. Drugu grupu predstavljaju faktori za koje ne
znamo kako djeluju na rezultate. To su statistiki faktori ili faktori druge
vrste. Njih ispituje matematika statistika sa teorijom vjerovatnoe.
Ako je mogue fiksiranjem (zamrzavanjem) faktora prve vrste otkloniti
djelovanje, tada fluktuacije u djelovanju, ukoliko postoje, potiu od faktora
druge vrste. Na ovaj nain (fiksiranjem faktora) dolo se do vanih rezultata
u prirodnim naukama, meutim u nekim naunim oblastima nije mogue
razdvojiti faktore.
Razvojem odreene nauke broj faktora obe vrste se poveava. Pojedini
faktori druge vrste prelaze u faktore prve vrste kada se dovoljno upozna
njihovo djelovanje na rezultate, a broj faktora druge vrste se poveava jer se
zapaaju i ono faktori koji se nisu mogli zapaziti na niem stepenu razvoja
nauke.
Osnovni model (koncept) u teoriji vjerovatnoe je eksperiment kod koga
ostvarivanje odreenih uslova ne dovodi do jednoznanog rezultata, odnosno
ishod eksperimenta nije mogue predvidjeti na osnovu poznavanja uslova
pod kojima se on izvodi. Ovo je najbitnija razlika izmeu deterministikog
(klasinog) eksperimenta i eksperimenta u teoriji vjerovatnoe i statistici.
Kod klasinog eksperimenta odreeni uslovi eksperimenta jednoznano
odreuju njegov ishod.
Nasuprot klasinom, bacanje homogene kocke je jednostavan eksperiment u
teoriji vjerovatnoe kod koga se vidi da se radi o drugoj vrsti eksperimenta.
110

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

To je eksperiment u teoriji vjerovatnoe ili stohastiki eksperiment. Kod


bacanja kocke realizovae se jedan od est moguih ishoda. Uslovi
eksperimenta su: baca se kocka, a rezultat ili ishod eksperimenta je: broj
koji se nalazi na gornjoj strani kocke kada je kocka pala. Za eksperiment se
kae da je dobro definisan ako su navedeni uslovi eksperimenta i ako je
navedeno ta se registruje kao njegov ishod.
Zamislimo eksperiment koji se zavrava sa jednim od n ishoda. Svaki ishod
se naziva elementarni dogaaj (elementarni rezultat). Elementarni dogaaj
moe se realizovati na samo jedan nain. Skup svih elementarnih dogaaja,
svih logiki moguih ishoda nekog eksperimenta naziva se prostor
elementarnih dogaaja (prostor ishoda) i obiljeava se sa
Za svaki eksperiment vezuje se skup elementarnih dogaaja, ali i razliiti
dogaaji koji su od interesa u datom eksperimentu. Njih nazivamo sloenim
dogaajima, a oznaavaju se velikim latininim slovima A, B, ... . Sloeni
dogaaj A se u datom opitu realizuje ako se realizuje jedan elementarni
dogaaj to znai da se sloeni dogaaj moe realizovati na vie
naina. Na primjer, posmatrajmo eksperiment bacanja kocke. Neka je sloeni
dogaaj A - realizacija parnog broja, odnosno A=2,4.6. Ako pri bacanju
kocke padne broj 2 A, tada se realizovao sloeni dogaaj A. Zato se
dogaaj A moe opisati pomou elementarnih dogaaja koji su za njega
vezani.
Pojam elementarnog i sloenog dogaaja omoguuje da se uspostavi veza
izmeu teorije skupova i teorije vjerovatnoe, tako da mnogi pojmovi iz
teorije vjerovatnoe postaju oigledniji. Mnoge realacije meu dogaajima
tumae se u terminima poznatim iz teorije skupova.
Vjerovatnoa prostog dogaaja
Vjerovatnoa prostog dogaaja, da se desi bilo koji (ili ovaj ili onaj) od
prostih nezavisnih dogaaja koji se meusobno iskljuuju (ne mogu se desiti
istovjetno), jednaka je zbiru konkretnih parcijalnih vjerovatnoa.

p PiliAiliB P A; B P A PB

Vjerovatnoa sloenog dogaaja (nezavisnost)


Vjerovatnoa sloenog dogaaja, da se istovremeno ili sukcesivno dese dva
(ili vie) nezavisnih prostih dogaaja, jednaka je produktu vjerovatnoa (i
ovog i onog) dogaaja.

p PiAiB P A, B P A PB
111

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Vjerovatnoa prostog dogaaja (dogaaji se ne iskljuuju)


Vjerovatnoa prostog dogaaja, da se desi bilo koji (ili ovaj ili onaj) od
prostih dogaaja koji se meusobno ne iskljuuju (mogu se desiti
istovremeno), jednaka je razlici zbira parcijalnih vjerovatnoa dogaaja i
produkta vjerovatnoa dogaaja (zbir vjerovatnoa umanjen za vjerovatnou
da se dese istovremeno).

p PiliAiliBbe ziAiB P A; B; A, B

odnosno
p P( A) P( B) P( A) P( B)
Vjerovatnoa sloenog dogaaja (zavisni dogaaji)
Vjerovatnoa sloenog dogaaja da se istovremeno ili sukcesivno dese dva
(ili vie) meusobno zavisna dogaaja jednaka je produktu vjerovatnoa
svakog (i ovog i onog) dogaaja. Vjerovatnoa zavisnog dogaaja P(AB)
dobija se kao produkt apsolutne vjerovatnoe hronoloki prvog dogaaja
(P(A); P(B)) i relativne vjerovatnoe hronoloki drugog dogaaja (P(B/A);
PA/B)).
B
p PiAiBposlij eA P AB P AP
A
A
p PiBiAposlij eB PBA PB P
B

Relativna vjerovatnoa (uslovna)


Relativna vjerovatnoa P(A/B) ili P(B/A) naziva se jo i uslovna ili
kondicionalna vjerovatnoa. Uslovna vjerovatnoa je vjerovatnoa
stohastiki zavisnog dogaaja jer je P(B/A) P(A), za razliku od nezavisnih
dogaaja kod kojih je P(B/A)=P(B). Ona ustvari predstavlja vjerovatnou
uslovljenog dogaaja, dogaaja koji je uslovljen prethodnom pojavom nekog
drugog dogaaja. Uslovna vjerovatnoa dobija se kao kao kolinik zavisne
vjerovatnoe i apsolutne vjerovatnoe uzronog dogaaja.

B P AB
P
A P A

A PBA
P
B P B
Uslovna vjerovatnoa je osnovni tip vjerovatnoe u prirodnim naukama, jer
se dogaaji karakteriu uzrono posljedinim odnosima.

ili

112

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Totalna (ukupna) vjerovatnoa


Na osnovu zavisne, odnosno uslovne vjerovatnoe moe se izraunati totalna
(ukupna) vjerovatnoa dva ili vie prostih dogaaja koji nisu nezavisni. Ona
se dobija kao razlika zbira parcijalnih vjerovatnoa i zavisne vjerovatnoe tih
dogaaja. Tako je za dva zavisna dogaaja A i B, od kojih dogaaj A
prethodi dogaaju B, totalna vjerovatnoa:
p = P(ili A ili B ili B poslije A) = P(A;B;AB)
odnosno
B
p P( A) P( B) P( A) P
A
I obrnuto, za iste dogaaje, kad dogaaj B prethodi dogaaju A slijedi:
p = P(ili A ili B ili A poslije B) = P(A;B;AB)
A
p P( A) P( B) P( B) P
B
Na osnovu vjerovatnoe zavisnih dogaaja moe se izraunati i takozvana
potpuna (totalna) vjerovatnoa dogaaja. To je vjerovatnoa dogaaja koji
moe nastati samo pod uslovom prethodne pojave potpunog sistema nekog
drugog dogaaja (ukupan broj dogaaja pod uslovom da se meusobno
iskljuuju). Ona se dobija kao suma produkata vjerovatnoa svakog
uzronog dogaaja i uslovnog dogaaja.

p PB P A1 B P A2 B P A3 B .... P An B
B
p PB P Ai P
Ai

Na osnovu uslovne vjerovatnoe dogaaja Tomas Bajes (Thomas Bayes) je


1764. godine formulisao teorem po kojem se moe odrediti uzrona
vjerovatnoa nekog dogaaja. Polazei od pretpostavke da neki dogaaj, kao
posljedica jednog ili vie drugih dogaaja, moe biti istovremeno i uzrok
nastanka tog ili nekog drugog dogaaja, vjerovatnoa uzroka oekivanog
dogaaja izraunava se obradom bazinih i novih informacija pomou
Bajesovog izraza:
P Ak P B
PBAk
Ak
P Ak / B

, k = 1,2,...,n
P B
B

P
A
P
i Ai
113

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 1.
Patronana sestra brine o 25 porodica. Distribucija frekvencija ovih porodica
(f) po broju djece (x) prikazana je tabelarno.
Tabela 3.2.1.1: Distribucija frekvencija porodica po broju djece
r

P X x

P X x

1
2
3
4
5
Ukupno

0
1
2
3
4
/

2
8
10
4
1
25

2/25
8/25
10/25
4/25
1/25
25/25

2/25
10/25
20/25
24/25
25/25
/

a) Kolika je vjerovatnoa da e porodica koju treba posjetiti patronana


sestra imati jedno dijete?
p1 P X 1 8 0,32 32%
25
Sluajan dogaaj koji je predmet posmatranja je broj djece u porodici.
Oekivani dogaaj, tj. poeljan ishod je da sestra posjeti porodicu sa jednim
djetetom, pa vjerovatnoa od 0,32, odnosno 32% predstavlja vjerovatnou
oekivanog dogaaja. Istovremeno izraunata vjerovatnoa je parcijalna
vjerovatnoa jer predstavlja mjeru ostvarivanja samo jednog ishoda, tj.
jedne vrijednosti varijable.
b) Koliko iznosi zbir parcijalnih vjerovatnoa svih moguih oekivanih
dogaaja?
Broj moguih oekivanih dogaaja je pet (da patronana sestra posjeti
porodicu: bez djece, sa jednim, sa dva, sa tri, sa etiri djeteta) a odgovarajue
parcijalne vjerovatnoe iznose:
p1 P X 0 2 0,08 8%
25

p2 P X 1 8

25

0,32 32%

p3 P X 2 10

25

p4 P X 3 4

25

114

0,40 40%
0,16 16%

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

p 5 P X 4 1

25

0,04 4%

Sabiranjem parcijalnih vjerovatnoa dobija se ukupna vjerovatnoa od 1


odnosno 100%
P X x p1 p2 p3 p4 p5 0,08 0,32 0,40 0,16 0,04 1,00
c)

Kolika je vjerovatnoa da sestra posjeti bilo koju od 25 porodica?


P0 X 4 25 1
25

U pitanju je vjerovatnoa sigurnog dogaaja (jer je m=n) pa traena


vjerovatnoa u ovom sluaju iznosi 1 ili 100%.
d) Kolika je vjerovatnoa da e porodica koju posjeti patronana sestra
imati petoro djece?
P X 5 0 0
25
Oekivani dogaaj da sestra posjeti porodicu sa petoro djece nije mogu jer
ni jedna porodica u primjeru nema petoro djece. Vjerovatnoa nemogueg
dogaaja jednaka je nuli.
e)

Kolika je vjerovatnoa da sestra nee posjetiti porodicu sa troje djece?

Vjerovatnoa da se jedan dogaaj nee ostvariti moe se izraunati iz


vjerovatnoe suprotnog dogaaja koja je u ovom sluaju 16%. Izraunava se
na jedan od ova dva naina:

q4

25

0,16

p X 3 1 p X 3 1 0,16 0,84
ili

p X 3 p X 1 p X 2 p X 4 0,84

f) Kolika je vjerovatnoa da e porodica koju posjeti patronana sestra


imati ili dvoje ili etvoro djece?
Ovdje se primjenjuje zakon adicije (sabiranja) na odbovarajue parcijalne
vjerovatnoe iskljuivih dogaaja.
p p X 2 P X 4 10

25

25

0,40 0,04 0,44

g) Ako patronana sestra treba posjetiti dvije porodice, kolika je


vjerovatnoa da e posjetiti porodicu sa jednim i sa tri djeteta?
115

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ovdje se primjenjuje zakon multiplikacije (mnoenja) na odgovarajue


parcijalne vjerovatnoe.

254 25 0,32 0,16 0,05

p p X 1P X 3 8

h) Ako patronana sestra treba posjetiti jednu porodicu, kolika je


vjerovatnoa da e porodica imati: 1) manje od etvoro djece, 2) dvoje i vie
djece, 3) izmeu jednog i tri djeteta?
Odgovor na ovo pitanje moe se dobiti na osnovu kumulativnih vjerovatnoa
koje se dobijaju sukcesivnim sabiranjem parcijalnih vjerovatnoa.
p X x 0,08 0,32 0,40 0,40 0,80 0,16 0,96 0,04 1,00
Prema tome traene vjerovatnoe iznosie 96%, 60% i 88%.
p1 p X 4

2
8 10 4 24

0,96
25
25 25 25 25

p 2 p X 2

10 4
1 15

0,60
25 25 25 25

p3 p1 X 3

8 10 4 22

0,88
25
25 25 25

i) Kolika je vjerovatnoa da e patronana sestra istog dana tri puta


posjetiti porodicu za etvoro djece?
Kako je u pitanju sloeni dogaaj, rjeenje se dobija primjenom zakona
multiplikacije.
p P X 4P X 4P X 4 p 3

25 0,043

p 1

0,000064

j) Kolika je vjerovatnoa da patronana sestra posjeti porodicu sa parnim


brojem djece ili porodicu sa troje i vie djece?
Rjeenje se dobija primjenom zakona adicije na proste nezavisne dogaaje
koji se meusobno ne iskljuuju.
p P A P X 2 P X 4 0,4 0,04 0,44
p PB P X 3 P X 4 016 0,04 0,2

A 1125 125 0,04

p P A, B P AP B

p P A; B; A, B P A PB P APB
p 0,44 0,20 0,04 0,60
116

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Utvreno je da 500 od 10000 mukaraca i 25 od 10000 ena ima daltonizam,
sljepilo za boje (frekvencija daltonizma prema polu je razliita, jer se radi o
X hromozomskoj nasljednoj anomaliji). Kolika je vjerovatnoa da e neka
osoba sa daltonizmom biti mukog pola u ovom osnovnom skupu?
Rjeenje
Ispituje se vjerovatnoa istovremenog javljanja dvije karakteristike kod iste
osobe. Rjeenje se dobije primjenom zakona multiplikacije na zavisne
dogaaje jer se ispituje istovremena pojava dva dogaaja, sljepila za boje i
mukog pola. Apsolutna vjerovatnoa pojave daltonizma:
p P A 500 25
525
0,026
10000 10000
20000

Relativna vjerovatnoa uslovnog dogaaja pojave osobe mukog pola meu


daltonistima
p P A 500
0,952
525
Vjerovatnoa zavisnih dogaaja, odnosno vjerovatnoa pojave daltonizma
kod osobe mukog pola iznosi:

A 0,026 0,952 0,025

p P AB P AP B

Dakle, vjerovatnoa da e osoba sa daltonizmom biti mukog pola iznosi


2,5%, a na slian nain dobije se vjerovatnoa da e osoba sa daltonizmom
biti enskog pola (0,124%).
Do ovog rezultata moglo se doi i direktno iz empirijskih podataka:
p P AB 500

20000

0,025

Primjer 3.
Istraivanja pokazuju da 6% trudnica koje dolaze u savjetovalite za trudnice
ima bakteriuriju (infekciju urinarnog trakta). Kod 30% trudnica sa
bakteriurijom i kod 1% trudnica bez bakteriurije dolazi do razvoja
pijelonefritisa (akutna infekcija gornjeg dijela urinarnog trakta).
Analiziranjem ove empirijske situacije uoava se vmogunost pojave dva
dogaaja. Osnovni dogaaj je pojava bakteriurije (dogaaj A). On ima dva
mogua ishoda: trudnica ima (A1) ili nema (A2) bakteriuriju. Ishodi ovih
dogaaja su iskljuivi i komplementarni pa je:
P A2 1 P A1 1 0,06 0,94

117

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Drugi dogaaj (B) je pojava pijelonefritisa. On se kod trudnica sa


bakteriurijom javlja sa vjerovatnoom od 0,3 (P(B/A1)=0,3), a kod trudnica
bez bakteriurije sa vjerovatnoom od 0,01 (P(B/A2)=0,01). Kakve se
informacije mogu dobiti analiziranjem empirijske situacije?
a) Kolika je vjerovatnoa da trudnica ima i bakteriuriju i pijelonefritis i
kolika je vjerovatnoa da trudnica nema bakteriuriju a ima pijelonefritis?
Radi se o istovremenoj pojavi dva dogaaja koji nisu nezavisni, pa e se
odgovor na postavljena pitanja dobiti primjenom zakona multiplikacije,
odnosno izraunavanjem vjerovatnoa zavisnih dogaaja
p1 PiA1iBposlijeA 1 P A1 B P A1 P B 0,06 0,3 0,018
A1
p 2 PiA2 iBposlijeA 2 P A2 B P A2 P B 0,94 0,01 0,0094
A2

Vjerovatnoa javljanja oba dogaaja istovremeno (p=1,8%) je skoro dva


puta vea od vjerovatnoe javljanja samo pijelonefritisa (p=0,94%)
b) Kolika je vjerovatnoa da trudnica dobije pijelonefritis?
Rauna se totalna (potpuna) vejrovatnoa dogaaja B primjenom zakona
adicije na dva vezana dogaaja.
p PB PiA1iBposlijeA1 PiA2 iBposlijeA 2
p PB 0,018 0,0094 0,0274

Vjerovatnoa da se kod trudnice razvije pijelonefritis iznosi 2,74%


c) Kolika je vjerovatnoa da kod trudnica kod kojih se razvio pijelonefritis
ve postoji bakteriurija?
Primjenjuje se Bajesov teorem. Poznavanje vjerovatnoe za nastanak
pijelonefritisa i zavisnih vjerovatnoa prisustva bakteriurije dozvoljava
izraunavanje uslovne vjerovatnoe novog dogaaja: da kod trudnica sa
pijelonefritisom postoji i bakteriurija.
P A1B 0,0180
p P A1

0,6569
B

PB
0,0274

118

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 4.
Date su tri kutije. U prvoj su dvije bijele i dvije crne kuglice, u drugoj je
jedna bijela i etiri crne kuglice i u treoj kutiji su tri bijele i dvije crne
kuglice. Nai vjerovatnou da se izvue bijela kuglica iz sluajno odabrane
kutije. Dakle trai se vjerovatnoa dogaaja A (izvuena bijela kuglica), da
je izvuena bijela kuglica ili iz prve ili iz druge ili iz tree kutije.
Rjeenje:
Dogaaji: A - izvuena bijela kuglica; A1 - izvlaenje iz prve kutije;
A2 - izvlaenje iz druge kutije; A3 - izvlaenje iz tree kutije.
1. Vjerovatnoa dogaaja Ai - izvlaenje iz jedna od razpoloivih kutija
P(A1) = P(A2) = P(A3) = 1/3
2. Vjerovatnoa uslovnog dogaaja da je bijela kuglica izvuena iz neke od
kutija
- P(A/A1) = 2/4
- P(A/A2) = 1/5
- P(A/A3) = 3/5
3. Ukupna vjerovatnoa da se desi izvlaenje bijele kuglice ili iz prve ili iz
druge ili iz tree kutije
(P(A) = P(A1)P(A/A1) + P(A2)P(A/A2) + P(A3)P(A/A3) =
= 1/3*2/3 + 1/3*1/5 + 1/3*3/5 = 13/30 = 0,217
Vjerovatnoa da se bijela kuglica izvue iz sluajno odabrane kutije iznosi
P(A) = 0,217
3.2.2. Sluajna varijabla i distribucija vjerovatnoe
3.2.2.1. Sluajna varijabla
Posmatra se statistiki eksperiment koji se sastoji u bacanju dva novia.
Prostor uzorka - skup svih elementarnih dogaaja S sastoji se od 4
elementarna ishoda:
S = [(P,P), (P,G), (G,P), (G,G)]
gdje je: P - pad pisma, G - pad grba.
Posmatrajmo sluaj pojavljivanja grba. Vidi se da se u etiri podjednako
mogua sluaja u jednom sluaju ne pojavljuje nijedanput grb, u dva sluaja
jedanput i u jednom sluaju dva puta.
119

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ukoliko nas zanima pojavljivanje grba, moemo uvesti promjenjivu veliinu


(varijablu) X koja e pokazivati koliko puta se grb pojavio u eksperimentu.
U tabeli 3.2.1. dat je prikaz odnosa varijable X i bacanja novia.
Tabela 3.2.1.1.: Varijabla X = broj grbova pri bacanju dva novia
Prostor uzorka
eksperimenta

Broj grbova X

P,P

P,G

G,P

G,G

Ako smo u eksperimentu koristili pravilne novie rezultat bacanja ne moe


se predvidjeti, jer zavisi od niza faktora koje ne moemo kontrolisati poetni poloaj novia u ruci, brzina bacanja, ravnina podloge, itd.
Zbog toga se nikad unaprijed ne mogu predvidjeti vrijednosti koje e
poprimiti varijabla X. Ona te vrijednosti uzima na sluaj pa se zbog toga
naziva sluajna varijabla i definie se na sljedei nain:
Sluajna varijabla je numerika funkcija koja svakom ishodu statistikog
eksperimenta pridruuje jedan realan broj. Vano je napomenuti da
elementarni ishodi koji sainjavaju prostor uzorka ne moraju imati
numerike vrijednosti. Da bi se jasnije sagledalo znaenje sluajne varijable
i potreba njenog uvoenja na slici 3.2.1.1. predstavie se eksperiment sa
bacanjem dva novia.

GG
PG
PP
GP

Prostor uzorka

Slika 3.2.1.1. Sluajna varijabla kao funkcija definisana na prostoru uzorka


Sa slike se vidi da sluajna varijabla svaki od ishoda eksperimenta
transformie u jedna realan broj. Istovremeno se vidi da jedna vrijednost
sluajne varijable moe biti povezana sa vie elementarinh ishoda, ali da
120

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

svakom elementarnom ishodu odgovara samo jedna vrijednost sluajne


varijable. Uobiajeno je da se sluajna varijabla oznaava sa velikim
latininim slovima (npr. X, Y, Z, ...).
Jedan ishod sluajne varijable, odnosno realizovana vrijednost sluajne
varijable, oznaava se sa malim slovima x,y,z, ... ili sa x1, x2, x3...
Uzmimo dalje za eksperiment primjer bacanja homogene kocke ije su
strane oznaene sa brojevima od jedan do est. Ako broj koji se pojavi na
gornjoj strani kocke nakon bacanja predstavlja sluajnu varijablu X, tada se
kao njena realizovana vrijednost moe pojaviti bilo koji broj od 1 do 6, nrp.
x=4. Ako se strane kocke obiljee sa brojevima od 2 do 7 umjesto od 1 do 6,
opet bi svaka strana kocke imala jednaku vjerovatnou javljanja, a broj koji
bi se realizovao ne bi se mogao unaprijed predvidjeti. To znai da bi i u
ovom eksperimentu (kocka 2-7) broj koji se pojavljuje kao ishod
eksperimenta ponovo bio sluajna varijabla. Oznaimo novu sluajnu
varijablu sa Y i uoimo da je nastala transformacijom sluajne varijable X,
tj. Y=X+1.
Za opti sluaj moe se zakljuiti da svaka transformacija sluajne varijable,
tj. funkcija sluajne varijable i sama predstavlja sluajnu varijablu.
Sluajne varijable se mogu podijeliti na osnovu toga da li uzimaju sve
mogue vrijednosti u nekom intervalu ili uzimaju samo izolovane
vrijednosti.
Za sluajnu varijablu se kae da je prekidna (diskretna) ako moe uzeti
konaan broja izolovanih vrijednosti ili prebrojivo mnogo vrijednosti
(vrijednosti koje se mogu prebrojati skupom cijelih nenegativnih brojeva: 0,
1, 2, 3, ...itd). Broj poziva na nekoj telefonskoj centrali u odreenom
vremenskom intervalu, broj saobraajnih nezgoda u mjesecu junu, broj
pacijenata koji ekaju na pregled, broj televizora prodatih u nekoj robnoj
kui, broj defektnih proizvoda u toku jednog radnog dana, jesu prekidne
sluajne varijable.
Za potpunije razumijevanje smisla prekidne sluajne varijable i broja koga
ona moe uzeti u tabeli 3.2.1.1. daju se primjeri nekoliko sluajnih varijabli
Tabela 3.2.1.2.: Primjeri prekidne sluajne varijable
Rd.br.

Oznaka
sluajne
varijable

Definicija sluajne varijable


Broj tanih odgovora koje je
student dao na testu od 10
pitanja
Broj neispravnih raunara u
uzorku od 23 elementa
Broj zastoja u proizvodnji
artikla A

121

Vrijednosti sluajne
varijable

Broj vrijednosti
sluajne varijable

0, 1, 2, 3, ..., 10

Konaan

0, 1, 2, 3, ..., 23

Konaan

0, 1, 2, 3, ...

Prebrojivo mnogo

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sluajna varijabla je neprekidna (kontinuirana) ako moe uzeti bilo koju


vrijednost na nekom intervalu. Naime, izmeu bilo koje dvije vrijednosti x1 i
x2 sluajne varijable postoji slijedea mogua vrijednost x3 koja je razliita
od x1 i x2. Broj vrijednosti koje moe uzeti sluajna varijabla je beskonaan.
Primjeri neprekidnih sluajnih varijabli su: visina i teina studenata, vrijeme
potrebno da se obavi neka proizvodna operacija, prenik kuglinog leaja,
itd.
Po istom kriterijumu izvrena je podjela numerikih obiljeja na prekidna i
neprekidna.
U vezi sa prirodom sluajne varijable javlja se jo jedan problem, problem
mjerenja zbog nepreciznosti mjernih ureaja. U stvarnosti se nikada nee
moi tano izmjeriti npr. visina i teina neke osobe, jer e se uvijek uzimati
pribline vrijednosti zbog nepostojanja savrenog mjernog instrumenta.
3.2.2.2. Distribucija vjerovatnoe prekidne sluajne varijable
Kad se analizira neka sluajna varijabla najee je od interesa koje
vrijednosti ona moe uzeti i sa kojim vjerovatnoama. Svakom
elementarnom dogaaju (ishodu) u prostoru uzorka moe se pripisati
odgovarajua vjerovatnoa u uidu numerike vrijednosti. Kako prekidna
sluajna varijabla svakom elementu iz prostora uzorka pridruuje jedan broj,
slijedi da se svakoj vrijednosti sluajne varijeble moe pripisati
odgovarajua vjerovatnoa. Dakle, prekidna sluajna varijabla moe se
opisati kao varijabla koja uzima odreene izolovane vrijednosti sa
odgovarajuim vjerovatnoama.
U primjeru eksperimenta sa dva novia svaki od 4 elementau prostoru
uzorka ima podjednaku vjerovatnou javljanja -1/4, ako su novii ispravni.
Na osnovu tabele 3.2.1.1. vidi se da sluajna varijabla X moe uzeti
vrijednosti 0, 1, 2. Vjerovatnou da sluajna varijabla X uzme neku od
navedenih vrijednosti oznaimo sa P(X=xi)=pi. Dakle,
P( X x1 ) P( X 0) p1

P( X x2 ) P( X 1) p2

1
4

1 1 1

4 4 2

P( X x3 ) P( X 2) p3

1
4

Vjerovatnoa da sluajna varijabla X uzme vrijednosti 1 iznosi 1/2 jer se


odnosi na dva elementarna ishoda (P,G) i (G,P), od kojih svaki ima
vjerovatnou javljanja 1/4. Skup parova vrijednosti koje moe uzeti sluajna
varijabla X i odgovarajuih vjerovatnoa naziva se distribucija vjerovatnoe

122

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

(raspored vjerovatnoe, raspodjela vjerovatnoe, fujkcija vjerovatnoe ili


zakon vjerovatnoe) prekidne sluajne varijable.
Distribucija vjerovatnoe u eksperimentu sa dva novia data je tabelom
3.2.2.1.
Tabela 3.2.2.1.: Distribucija vjerovatnoa za broj grbova u eksperimentu sa
dva novia
Broj grbova
x
0
1
2
Ukupno

Vjerovatnoa
p
1/4
1/2
1/4
1

Ova tabela omoguava da se formuliu dva zakljuka o optim


karakteristikama svih prekidnih sluajnih varijabli:
1. Niti jedna vjerovatnoa u distribuciji vjerovatnoa ne moe biti negativna,
tj. P( X xi ) 0
za svako i;
2. Suma vjerovatnoa koje odgovaraju svim vrijednostima sluajne varijable
X mora biti jednaka jedan, tj. pi 1
i

Prva osobina distribucije vjerovatnoe proistie iz aksioma I (aksiom


nenegativnosti vjerovatnoe), a druga slijedi iz aksioma II (aksiom unije
vjerovatnoe) budui da sluajna varijabla transformie sve elementarne
ishode koji formiraju prostor uzorka u brojeve. Dakle, jedna od vrijednosti
sluajne varijable u konkretnom eksperimentu mora se realizovati ali je
nikada ne moemo unaprijed predvidjeti zbog mnogostrukog uticaja
sluajnih faktora.
Distribucija vjerovatnoe daje najpotpuniju informaciju o karakteristikama
sluajne varijable. Zahvaljujui njoj mogu se donositi razni probabilistiki
stavovi o bilo kojoj vrijednosti sluajne varijable. Tako se na osnovu 3.2.2.1.
mogu odrediti vjerovatnoe
1 1 3
P( X 1) P( X 1) P( X 2)
2 4 4

P(0 X 1) P( X 0) P( X 1)
P(0 X 1) P( X 0)

3
4

1
4

Primjetimo da se kod prekidne sluajne varijable razlikuje vjerovatnoa


P(x1Xx2) od vjerovatnoe P(x1X<x2) jer prva ukljuuje u sebe i
vjerovatnou da je X jednako x2.
123

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U optem sluaju distribucija vjerovatnoe prekidne sluajne varijable moe


se prikazati tabelom 3.2.2.2. koja sadri dva niza informacija: vrijednosti
sluajne varijable i njihove vjerovatnoe, uz uslov da suma vjerovatnoa
bude jadanaka 1.
Tabela 3.2.2.2.: Distribucija vjerovatnoe sliajne varijable X
Razliite vrijednosti x
x1 x2 ....xi ... xn
Vjerovatnoa p
p1 p2 ... pi ...pn
Distribucija vjerovatnoe ne smije se poistovjeivati sa distribucijom
frekvencija. Distrubucija vjerovatnoe je teorijski model koji pridruuje
vjerovatnoe pojedinim vrijednostima sluajne varijable; distribucija
frekvencija moe se formirati tek nakon prikupljanja podataka na osnovu
viestrukog ponavljanja opita u okviru statistikog eksperimenta. U principu,
eksperiment e od sluaja do sluaja davati razliite distribucije frekvencija.
Tako, na primjer, ako se posmatra eksperiment u kome se baca pravilna
homogena kocka i broj koji se pojavljuje na kocki tretiramo kao sluajnu
varijablu X, njena se distribucija frekvencija moe predstaviti kao u tabeli
3.2.2.3.
Tabela 3.2.2.3.: Distribucija vjerovatnoe za pravilnu kocku
x
p = P (X = xi)

1
1/6

2
1/6

3
1/6

4
1/6

5
1/6

6
1/6

Meutim, ako u konkretnom eksperimentu kocku bacimo 300 puta dobie se


distribucija frekvencija kao u tabeli 3.2.2.4.

Tabela 3.2.2.4.: Distribucija frekvencija dobijena na snovu 300 bacanja


kocke
x
Apsolutne frekvenvije
Relativne frekvencije

1
2
3
4
5
6
Ukupno
60
36
30
63
51
60
300
0,20 0,12 0,10 0,21 0,17 0,20
1,00

Iz tabela 3.2.2.3. i 3.2.2.4. primjeuje se razlika izmeu distribucije


vjerovatnoe kao teorijskog koncepta i distribucije relativne frekvencije kao
empirijske vjerovatnoe. Na osnovu koncepta relativne frekvencije poznato
nam je da se one stabilizuju sa poveavanjem broja opita i da se granina
vrijednost relativne frekvencije (vrijednost pri beskonanom broju opita)
izjednaava sa vjerovatnoom. Zbog toga e i distribucija relativne
frekvencije sa poveanjem broja opita teiti da se izjednai sa distribucijom
vjerovatnoe.

124

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ove dvije tabele slue za jo jedno objanjenje, razlike izmeu osnovnog


skupa - populacije i uzorka - reprezentativnog dijela osnovnog skupa.
Statistika populacija ili osnovni skup sastoji se od svih elemenata koje
moe uzeti sluavja varijabla a distribucija populacije odreena je
vjerovatnoama koje se javljaju u distribuciji vjerovatnoe. Na alost, u
praksi nam te teorijske vjerovatnoe najee nisu poznate. Kao njihove
najbolje ocjene mogu posluiti realtivne frekcencije, odnosno empirijsske
vjerovatnoe dobijena na osnovu uzorka.
Usporeivanjem gornje dvije tabele zakljuuje se da vrijednosti obiljeja u
distriduciji frekvencija ustvari predstavljaju vrijednosti sluajne varijable u
distribuciji vjerovatnoa. Tako na primjer, ako posmatramo skup svih
studenata jednog univerziteta i interesuju nas njihove karakteristike obiljeja, kao visina, prosjena ocjena, visina stipendije itd., tada sva ta
obiljeja moemo analizirati (modelirati) kao sluajne varijable, od kojih
svaka ima svoju distribuciju vjerovatnoe. Ako bi nam te distribucije bile
dostupne, tada bi sve karakteristike populacije (osnovnog skupa) mogli
jednostavno ispitati i ne bi postojala potreba za statistikom analizom i
zakljuivanjem. S obzirom na to da su u praksi najee dostupni samo
podaci o dijelu statistikog skupa, odnosno uzorka, koristimo teoriju
vjerovatnoe i na osnovu uzorka, odnosno empirijskog rasporeda
frekvencija, donosimo zakljuke o distribuciji vjerovatnoe osnovnog skupa.
Na osnovu ovog rezonovanja moe se grafiki prikazati postupak statistike
analize i zakljuivanja. Takav grafiki oblikovan algoritam dat je na slici
3.2.2.1.
f(X)

UZIMAWE
UZORKA

OBIQE@JE

ODRE]IVAWE
FREKVENCIJA ZA
SVAKU VRIJEDNOST

UZORAK

PLANIRAWE UZORKA

X
X
DISTRIBUCIJA
FREKVENCIJA

ZAKQU^IVAWE

FORMIRAWE
PROSTORA UZORKA

PRIDRU@IVAWE
BROJA SVAKOM
ISHODU

ODRE]IVAWE
VJEROVATNO]E
ZA SVAKU
FORMIRAWE
PROSTORA UZORKA

VRIJEDNOST

P(X=x)

X
X

POPULACIJA

PLANIRAWE
EKSPERIMENTA

ODRE\IVAWE
SVIH ISHODA

DISTRIBUCIJA
VJEROVATNO]E

Slika 3.2.2.1.: Veza izmeu distribucije frekvencija (empirija), distribucije


vjerovatnoe (teorija) i statistikog zakljuivanja

125

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Kao i neprekidne distribucije frekvencija, tako i distribucije frekvencija


prekidnih sluajnih varijabli moemo predstaviti pomou dijagrama
vjerovatnoe kao na slici 3.2.2.2.
P (X = x(i))

0,5
0,25
X
0

Slika 3.2.2.2. Grafiki prikaz distribucije vjerovatnoe iz tabele 3.2.2.1.


Na apscisu se nanose mogue vrijednosti sluajne varijable a na ordinatu
odgovarajue vjerovatnoe.
3.2.2.3. Funkcija distribucije prekidne sluajne varijable
Kao to smo vidjeli distribucija vjerovatnoe prekidne sluajne varijable
koja ima konaan broj vrijednosti moe se predstaviti kao lista pojedinih
vrijednosti sluajne varijable sa odgovarajuim vjerovatnoama. Meutim,
postavlja se pitanje kako opisati prekidnu sluajnu varijablu koja ima
prebrojivo mnogo, tj. beskonano mnogo vrijednosti. Trebalo bi formirati
listu, odnosno skup od beskonano mnogo parova vrijednosti sluajne
varijable i njihovih vjerovatnoa, to bi bilo praktino neizvodljivo.
Isti problem se javlja i prilikom predstavljanja neprekidne sluajne varijable
koja tekoer moe uzeti jednu od beskonano mnogo vrijednosti. Zbog ovih
ogranienja potrebno je pronai takav nain predstavljanja koji bi vaio za
bilo koju sluajnu varijablu. To se postie funkcijom distribucije; svaka
sluajna varijabla ima svoju funkciju distribucije.
Funkcija distribucije (naziva se jo i kumulativna funkcija distribucije)
prekidne sluajne varijable pokazuje vjerovatnou da sluajna varijabla X
uzme vrijednost koja je manja ili jednaka bilo kojoj proizvoljnoj vrijednosti
x. Funkcija distribucije sluajne varijable X oznaava se sa F(x) i data je
vjerovatnoom.

F ( x) P( X x)
126

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

gdje x moe biti bilo koji realan broj.


Neka je X prekidna sluajna varijabla koja moe uzeti vrijednosti x1, x2, ....,
xr,...,xn, gdje su x1< x2 < ... < xn. Neka P(X=xi) oznaava vjerovatnou da X
uzme vrijednost xi. Tada F(xr) predstavlja vjerovatnou da sluajna varijabla
X uzme vrijednost koja e biti manja ili jednaka xr i dobija se sabiranjem
(kumuliranjem) vjerovatnoa za sve vrijednosti sluajne varijable koje su
manje ili jednake xr, tj.
r

F ( xr ) P( X xr ) P( X x1 ) P( X x2 ) .... P( X xr )
i 1

Svaka funkcija distribucije mora zadovoljiti sljedee


karakteristike:
a) Za bilo koju vrijednost a vrijedi: 0 F (a) 1 ,
to je i razumljivo jer je funkcija distribucije vjerovatnoa;
b) F(-)=0 i F(+)=1,

matematike

jer se F(-)=F(X-) odnosi na nemogu dogaaj, a F(+)=F(X+) na


siguran dogaaj;
c) ako je a<b, tada je F(a) F(b), odnosno funkcija distribucije bilo koje
sluajne varijable je neopadajua funkcija.
Funkcija distribucije za prekidnu sluajnu varijablu dobija se kumuliranjem
vjerovatnoa na slian nain kao ro se dobija i kumulativna frekvencija.
Pogledajmo vrijednosti funkcije distribucije vjerovatnoa kod eksperimenta
sa dva novia.
Vjerovatnoa realizacije nula grbova ili manje jednaka je
1
F (0) P( X ) ;
4
vjerovatnoa da u eksperimentu bude jedan grb ili manje jednaka je
1 1 3
F (1) P( X 1) P( X 0) P( X 1) ;
4 2 4
i vjerovatnoa dobijanja dva grba ili manje je
F (1) P( X 1) P( X 0) P( X 1) P( X 2)

1 1 1
1
4 2 4

Dobijene vrijednosti omoguuju da se funkcija distribucije vjerovatnoe za


eksperiment bacanja dva novia, zajedno sa distribucijom vjerovatnoe
prikae u obliku tabele 3.2.3.1.

127

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Tabela 3.2.3.1.: Distribucija vjerovatnoe i funkcija distribucije u primjeru


dva novia
xi
pi =P(X=xi)
F(x)=P(X x)
0
1/4
1/4
1
1/2
3/4
2
1/4
1
Funkcija distribucije moe se prikazati i grafiki pomou stepenaste funkcije
kao na slici 3.2.3.1.
F(x)

1
3/4
2/4
1/4
0

Slika 3.2.3.1. Funkcija distribucije za broj grbova u eksperimentu sa


bacanjem dva novia
Grafikon funkcije distribucije sastoji se samo od horizontalnih linija.
Vertikalne linije nisu dio funkcije distribucije, ali se obino ukljuuju da bi
grafikon bio pregledniji.
Sa slike je vidljivo da funkcija distribucije za sve vrijednosti X manje
od nula ima vrijednost nula, a da za sve vrijednosti X koje su vee od dva
ima vrijednost 1.
Funkcija distribucije skokovito se mijenja za cjelobrojne vrijednosti sluajne
varijable pa se na osnovu samog izgleda grafikona lako moe uoiti
diskretna priroda sluajne varijable.
(Kolika je vjerovatnoa da X uzme vrijednost manju ili jednaku 0,5?).
3.2.2.4. Oekivana vrijednost i varijansa prekidne sluajne varijable
Raspored vjerovatnoe i funkcija distribucije sadre sve relevantne
informacije o statistikim karakteristikama neke prekidne sluajne varijable.
Meutim, u velikom broju sluajeva nije mogue (ni potrebne) obezbjediti
kompletnu informaciju o distribuciji, nego je dovoljno odrediti samo neke
128

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

osnovne karakteristire (parametre) distribucije. One slue da se na sintetiki


nain sagledaju razliiti aspekti distribucije.
U deskriptivnoj statistici aritmetika sredina i standardna devijacija bili su
sumarni pokazatelji lokacije i varijabiliteta distribucije frekvencija.
Analogno, e se formulisati mjere lokacije i varijabiliteta prekidne sluajne
varijable. To se moe uraditi pomou:
1. oekivane vrijednosti sluajne varijable i
2. varijanse sluajne varijable.
a) Oekivana vrijednost sluajne varijable
Vratimo se eksperimentu sa bacanjem homogene kocke gdje je dobijena
distribucija frekvencija prikazana tabelom 3.2.2.4. Aritmetika sredina ove
distribucije dobija se koritenjem formule za ponderisanu aritmetiku
sredinu, gdje ulogu pondera igraju apsolutne frekvencije:
k

x
i 1

fi

1
1089
[1 * 600 2 * 36 3 * 30 4 * 63 5 * 51 6 * 60
3,63
300
300

Do istog rezultata dolo bi se koritenjem relativnih frekvencija kao pondera:


6

x
i 1

fi

6
6
x1 f1 x2 f 2 ... x6 f 6
f
f
f
f
x1 1 x2 2 ... x6 6 xi i xi pi 3,63
n
n
n
n
n i 1
i 1

gdje su sa pi oznaene relativne frekvencije.


Dakle, aritmetika sredina moe se odrediti i kao ponderisani prosjek
vrijednosti obiljeja, sa relativnim frekvencijama kao ponderima.
Posmatrajmo sada prekidnu sluajnu varijablu X sa slijedeom distribucijom
vjerovatnoa:
xi
x1
x2
.
.
.
xn

pi=P(X=xi)
p1=P(X=x1)
p2=P(X=x2)

pn=P(X=xn)

Oekivana vrijednost sluajne varijable X oznaava se sa E(X) i jednaka je


zbiru proizvoda sluajne varijable i odgovarajuih vjerovatnoa.
n

E ( X ) x1 p1 x2 p 2 ... xn p n xi pi
i 1

129

(3.2.4.1)

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Oekivana vrijednost naziva se jo matematiko oekivanje ili jednostavno


oekivanje od X. Vidimo da E(X) predstavlja ponderisanu sredinu svih
moguih vrijednosti sluajne varijable X, pri emu su ponderi odgovarajue
vjerovatnoe koje figuriu u rasporedu vjerovatnoe sluajne varijable X.
Ako se vratimo na eksperiment sa bacanjem homogene kocke i na
distribuciju vjerovatnoe koja je data u tabeli 3.2.2.3. , oekivanu vrijednost
sluajne varijable X moemo izraunati primjenom izraza 3.2.4.1.:
6
1
1
1
1
1
1
E ( X ) xi pi 1 * 2 * 3 * 4 * 5 * 6 * 3,5
6
6
6
6
6
6
i 1
Na isti nain moe se odrediti oekivana vrijednost u primjeru sa bacanjem
dva novia ija je distribucija vjerovatnoe data sa tabelom 3.2.2.1.:
3
1
1
1
E ( X ) xi p i 0 * 1 * 2 * 1
4
2
4
i 1
Oekivana vrijednost moe se intuitivno shvatiti i kao teite (centar
gravitacije) distribucije vjerovatnoe, odnosno svih vrijednosti koje uzima
sluajna varijabla. Grafiki to izgleda kao na slici 3.2.4.1.:
P

2/4

1/4

X
0

E(x)

Slika 3.2.4.1. Oekivana vrijednost kao centar gravitacije distribucije


vjerovatnoe
Da bi se jasnije sagledao smisao oekivane vrijednosti usporedimo
izraunatu vrijednost aritmetike sredine i oekivanu vrinednost u primjeru
sa bacanjem kocke.
Vidimo da se dobijene vrijednosti razlikuju jer je x 3,63 a E(X)=3,5.
Razlika priistie zbog toga to u izrazu za aritmetiku sredinu ulogu pondera
imaju relativne frekvencije, dok u formuli za oekivanu vrijednost ulogu
pondera imaju vjerovatnoe.
130

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U prvom sluaju radili smo sa uzorkom od 300 elemenata, odnosno sa 300


opita. Po teoriji relativne frekcencije, ako bi izvrili beskonano mnogo
opita, relativne frekvencije bi postale vjerovatnoe (sve bi bile jednake 1/6) i
u tom sluaju dobili bi ustvari oekivanu vrijednost 3,5.
Zakljuujemo da:
a) aritmetika sredina predstavlja pokazatelj centralne tendencije vrijednosti
obiljeja u uzorku;
b) oekivana vrijednost predstavlja pokazatelj centralne tendencije
vrijednosti sluajne varijable, odnosno vrijednosti elemenata u osnovnom
skupu.
Meutim, u praktinim istraivanjima pojam oekivana vrijednost sluajne
varijable X najee se poistovvjeuje sa aritmetikom sredinom osnovnog
skupa. Zbog toga se moe napisati slijedea jednakost:
E( X ) x
odnosno oekivana vrijednost sluajne varijable jednaka je aritmetikoj
sredini populacije.
Dok se pojam oekivana vrijednost u poetku vezivao za hazardne igre,
danas predstavlja osnovno sredstvo u analizi sluajeih varijabli. Na osnovu
navedenih primjera moe se sagledati da se:
- oekivana vrijednost E(X) nalazi izmeu minimalne i maksimalne
vrijednosti sluajne varijable, i
- oekivana vrijednost E(X) ne mora se poklapati sa nekom vrijednosti
sluajne varijable.
Oekivana vrijednost se ne moe tumaiti kao vrijednost koja se oekuje u
statistikom eksperimentu, nego kao prosjean oekivani ishod svih moguih
opita u eksperimentu.
b) Kakteristike oekivane vrijednosti sluajne varijable
Posmatrajmo neku sluajnu varijablu X. Ako se definie naka funkcija od X,
Y = g(X) , npr. Y = 3 X + 2 , ili Y = (X-4)2 itd., na osnovu dosadanjih
izlaganja moe se zakljuiti da e i Y biti sluajna varijabla. Najprije se
postavlja pitanje da li znajui distribuciju vjerovatnoe sluajne varijable
moemo odrediti distribuciju nove sluajne varijable Y?
Ako poemo od primjera bacanja novia i distribucije vjerovatnoe date
tabelom 3.2.2.1., odredimo distribuciju vjerovatnoe nove varijable Y = 3 X
+ 2. Potrebno je formirati listu vrijednosti transformisane sluajne varijable i
njenih vjerovatnoa. Do vrijednosti sluajne varijable dolazi se jednostavno
zamjenom odgovarajuih vrijednosti originalne sluajne varijable X koje
iznose 0, 1 i 2, odnosno Y moe sluajno uzeti vrijednosti 2, 5 i 8. Potrebno
je jo odrediti sa kojom vjerovatnoom Y moe uzeti ove vrijednosti:
131

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

P(Y 2) P(3 X 2 2) P(3 X 0) P( X 0)

1
4

P(Y 5) P(3 X 2 5) P(3 X 3) P( X 1)

1
2

P(Y 8) P(3 X 2 8) P(3 X 6) P( X 2)

1
4

Distribucija vjerovatnoe sluajne varijable Y kao i distribucija originalne


sluajne varijable X prikazane su tabelom 3.2.4.1.
Tabela 3.2.4.1.: Distribucija vjerovatnoe sluajne varijable X i Y=3X+2 u
eksperimentu sa dva novia
X
p

0
1/4

1
1/2

2
1/4

Y
p

2
1/4

5
1/2

8
1/4

Iz tabele se vidi da su vjerovatnoe u distribuciji vjerovatnoe nove sluajne


varijable Y jednake vjerovatnoama u distribuciji vjerovatnoe sluajne
varijable X.
Ovaj rezultat vai i u optem sluaju, odnosno ako izvrimo bilo kakvu
transformaciju sluajne varijable X, distribucija vjerovatnoe nove skuajne
varijable Y=g(X) imae idnetine vjerovatnoe kao i distribucija X. Zbog
toga se oekivana vrijednost bilo koje funkcije sluajne varijable X date sa
Y=g(X) moe izraunati kao:
(3.2.4.2)
E (Y ) E[ g ( X )] g ( xi ) pi yi pi
i

gdje yi predstavlja vrijednosti nove sluajne varijable Y, a pi vjerovatnoe


koje se nalaze u distribuciji vjerovatnoe prvobitne sluajne varijable X (ili
vjerovatnoe u distribuciji sluajne varijable Y, to je isto).
Ako se ovo primjeni na distribuciju sluajne varijable Y u tabeli 3.2.4.1.
oekivana vrijednost iznosie:
3
1
1
1
E (Y ) yi pi 2 * 5 * 8 * 5
4
2
4
i 1
Kod raunanja oekivane vrijednosti bilo koje sluajne varijable mogu se
koristiti odreene osobine koje znatno olakavaju analizu. Ako se sa a, b, c
oznae konstante a sa X i Y sluajne varijable tada su osnovne karakteristike
oekivane vrijednosti:
a) E(c)=c
Oekivana vrijednost konstante jednaka je konstanti samoj.
b) E(aX)=aE(X)

132

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Oekivana vrijednost produkta konstante i sluajne varijable jednaka je


produktu konstante i oekivane vrijednosti sluajne varijable.
Na osnovu ove osobine konstanta se moe izvui ispred oekivane
vrijednosti, to direktno slijedi iz poznatog pravila vazanog za operator , da
se konstanta moe izvui ispred znaka .
c) E(X+b)=E(X)+b
Oekivanje zbira sluajne varijable i konstante jednako je zbiru oekivanja
sluajne varijable i oekivanja konstante. Kako je oekivanje konstante
jednako konstanti tada je oekivanje zbira sluajne varijable i konstante
jednako zbiru: oekivanje sluajne varijable i konstanta.
d) E(a+bX)=E(a)+E(bX)=a+bE(X)
Oekivanje zbira konstante i produkta konstante i sluajne varijable jednako
je zbiru oekivanja konstante i oekivanju produkta konstante i sluajne
varijable.
Kako je oekivanje konstante jednako konstanti a oekivanje produkta
konstante i sluajne varijable jednako produktu oekivanja konstanne i
sluuajne varijable, tada je oekivanje zbira konstante i produkta konstante i
sluajne varijable jednako zbiru: konstanta i produkt konstante i oekivanja
sluajne varijable.
e) E(XY)=E(X)E(Y)
Oekivanje zbira (ili razlike) dvije sluajne varijable jednako je zbiru
(razlici) oekivanja svake pojedinano uzete sluajne varijable.
f) E(aX+bY+c)=E(aX)+E(bY)+E(c)=aE(X)+bE(Y)+c
Oekivanje zbira produkata dvije sluajne varijable i konstante jednako je
zbiru: produkt konstanta i oekivanje prve sluajne varijable, produkt
konstanta i oekivanje druge sluajne varijable i konstante.
Koritenjem ovih osobina moe se jednostavnije izraunati oekivana
vrijednost sluajne varijable Y sa distribucijom vjerovatnoe datoj u tabeli
3.2.4.1.
E(Y)=E(2X+3)=E(2X)+E(3)=2E(X)+3=2*1+3=5
jer je E(X)=1.
c) Varijansa prekidne sluajne varijable
Oekivana vrijednost predstavlja centar ili sredinu distribucije vjerovatnoe
neke sluajne varijable. Postavlja se pitanje u kojoj su mjeri ostale
vrijednosti sluajne varijable disperzirane u odnosu na oekivanu vrijednost,
tj. kolika su njihova odstupanja od oekivane vrijednosti. Kao mjeru
disperzije ne moemo uzeti oekivanu vrijednost odstupanja jer je ona
jednaka nuli

E[ X E ( X )] 0
133

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ovo se lako provjerava na primjeru sluajne varijable X koja pokazuje broj


grbova u eksperimentu sa dva novia:
3
1
1
1
E[ X E ( X )] E[ g ( X )] g ( X ) pi [ xi E ( X )] pi (0 1) * (1 1) * (2 1) 0
4
2
4
i 1

Podsjetimo se da smo analogan rezultat imali i kod aritmetike sredine, jer je


suma odstupanja obiljeja od aritmetike sredine jednaka nuli. Pratei istu
logiku kao i kod formulacije varijanse distribucija frekvencija, potrebno je
kvadrirati odstupanja pojedinih vrijednosti sluajne varijable od njene
oekivane vrijednosti.
Naime, kad je neka vrijednost sluajne varijable vea od oekivane
vrijednosti odstupanje je pozitivno, i suprotno, za manje vrijednosti
sluajnve varijable od oekivane vrrijednosti odstupanja su negativna, pa je
zuma odstupanja jednaka nuli. Kvadriranjem odstupanja eliminiu se
negativni predznaci i dobija se mjera odstupanja koja se razlikuje od nule.
Tako se dolazi do mjere disperzije distribucije vjerovatnoe sluajne
varijable koja se naziva varijansa sluajne varijable. Varijansa se oznaava
sa Var X, ili x2 ili 2 i dobija se na osnovu:
VarX x2 E[ X E ( X )]2 [ xi E ( X )]2 pi

(3.2.4.3)

Uoljivo je da varijansa predstavlja oekivanu vrijednost kvadrata


odstupanja sluajne varijable od njene oekivane vrijednosti.
Ako oekivanu vrijednost sluajne varijable E(X) oznaimo sa x i shvatimo
je kao aritmetiku sredinu osnovnog skupa (odnosno populacije),
zakljuujemo da se formula za varijansu moe napisati u obliku
x2 ( xi x) 2 pi .
i

Usporedbom ovog izraza i izraza za varijansu (standardnu devijaciju)


distribucije frekvencija vidi se da je razlika u ponderu, odnosno kod
distribucije frekvencija ponderi su frekvencije dok su kod varijanse sluajne
varijable ponderi vjerovatnoe.
Varijansa sluajne varijable moe se jednostavnije izraunati pomou
akternativna formule, na analogan nain kao i varijansa (standardna
devijacija) distribucije frekvencija

VarX x2 E[ X E ( X )]2 E ( X 2 ) [ E ( X )]2 xi2 pi x

(3.2.4.4)

odnosno kao oekivanje kvadrata sluajne varijable minus kvadrat njenog


oekivanja.
134

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Posmatrajmo ponovo distribuciju vjerovatnoe sluajne varijable X u


primjeru sa dva novia. Da se izrauna varijansa na osnovu formule
(3.2.4.4) potrebno je izraunati produkte xipi i xi2pi to je i dato u tabeli
3.2.4.2. Primjetimo da se E(X2) = xi2pi razlikuje od [E(X)]2=(xipi)2.
Tabela 3.2.4.2.: Izraunavanje varijanse sluajne varijable - primjer sa dva
novia
x
0
1
2

p
1/4
1/2
1/4
1

xp
0
1/2
1/2

xp
0
1/2
1
3/2=E(X2)

1=E(X)= x

E ( X ) xi p i 1

E ( X 2 ) xi2 pi
2

x2 E ( X 2 ) x

3
2

3
1
(1) 2
2
2

Do istog rezultata bi se dolo direktnom primjenom definicione formule


3.2.4.4.:
3

1
4

1
2

1
4

x2 [ xi E ( X )]2 pi (0 1) 2 * (1 1) 2 * (2 1) 2 *
i 1

1
2

S obzirom na to da je [xi-E(X)]2 uvijek nenegativno, ni varijansa sluajne


varijable ne moe biti negativna, tj. Var X 0. Ukoliko je VarX = 0, odnosno
ne postoje nikakva odstupanja, X nije sluajna varijable nego konstanta.
Vai i obratno, varijansa konstante jednaka je nuli. Varijansa sluajne
varijable ima isto ogranienje kao i varijansa distribucije frekcancija iskazana je kvadratnim mjernim jedinicama.
Da bi se disperzija mjerila u istim mjernim jedinicama kao i X potrebno je
uzeti pozitivnu vrijednost kvadratnog korjena varijanse. Na taj nain dobija
se standardna devijacija sluajne varijable X koja se oznaava sa SD, ili x.
Osnovne karakteristike varijanse su:
a) Var X > 0
b) Var a = 0
v) Var (X+a)=VarX
g) Var bX = b2 Var X
d) Var (a+bX) = b2 Var X

135

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Jedna od vanih primjena navedenih karakteristika je u transformaciji


sluajne varijable X sa oekivanom vrijednosti E(X) i standardnom
devijacijom SD u sluajnu varijablu Z sa oekivanom vrijednosti 0 i
standardnom devijacijom 1. Ova nova sluajna varijabla Z naziva se
standardizovana sluajna varijabla.
Bilo koja sluajna varijabla moe se standardizovati ako se od nje oduzme
njena oekivana vrijednost a zatim se podijeli sa standardnom devijacijom
(ime se eliminie jedinica mjere).
Standardizovana sluajna varijabla rauna se kao:
X E( X )
;
(3.2.4.5)
VarZ 1
Z
E(Z ) 0 ;

3.2.2.5. Modeli prekidnih distribucija vjerovatnoe


Vidjeli smo da je kod izraunavanja oekivane vrijednosti i varijanse
sluajne varijable X potrebna informacija o svim vrijednostima koje figuriu
u distribuciji vjerovatnoe, bilo da je ona dostupna u obliku liste
X:
x1, x2,...,xn
p:
p1, p2,...,pn
ili u obliku dijagrama vjerovatnoe.
Do potrebne informacije moe se doi ako se distribucija vjerovatnoe moe
formulisati u obliku opteg algebarskog izraza, tj. formule koja bi davala
vezu izmeu pojedinih vrijednosti koje uzima sluajna varijabla i
odgovarajuih vjerovatnoa. Takva funkcionalna veza
pi = f (xi); i = 1, 2, ..., n
(3.2.4.6)
na kondezovan nain sadri cijelu distribuciju vjerovatnoe i naziva se
model distribucije.
Ako je poznat model distribucije f tada se jednostavno mogu odreivati
pojedine vjerovatnoe tako to se indeksu i daju odgovarajue vrijednost od
1 do n. Osnovni znaaj modela distribucije je u tome to se na njima bazira
cjelokupno statistiko zakljuivanje.
Bez poznavanja pojedinih distribucija ne bi bilo mogue ocijeniti parametre
populacije, formirati intervale pouzdanosti, niti testirati odreenu statistiku
hipotezu.
Tokom razvoja statistike teorije formulisan je i detaljno istraen veliki broj
modela distribucije vjerovatnoe, za koje su izraene odgovarajue tablice
vjerovatnoe. U praktinim istraivanjima najiru primjenu su nale samo
one distribucije koje najbolje reprezentuju ponaanje veeg broja prirodnih i
drutvenih fenomena.
136

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Najpoznatiji modeli prekidnih distribucija vjerovatnoe su: binomni,


hipergeometrijski, Poasonov (Poisson) i uniformni.
U okviru modela neprekidnih distribucija vjerovatnoe u statistikoj praksi
najee se koriste: normalna, Studentova, (hi-kvadrat) i Snedekorova
(Snedecor) - Fierova (Fisher) distribucija.
Ako se kod izvoenja konkretnog eksperimenta tano zna distribucija
vjerovatnoe sluajne varijable X, tada se na jednostavan nain moe
odrediti vjerovatnoa javljanja bilo kog sluajnog dogaaja unutar prostora
uzorka. Naalost, u praksi je takva informacija izuzetno rijetko dostupna i
najee se ne zna koju distribuciju vjerovatnoe ima sluajna varijabla u
nekom eksperimentu, jer su poznate samo pojedine njene vrijednosti,
odnosno raspolae se empirijskom distribucijom frekvencija.
Meutim, na osnovu velikog broja sprovedenih istraivanja i rezultata
statistike teorije dolo se do spoznaje koji modeli distribucija najvie
odgovaraju pojedinim eksperimentalnim situacijama.
Dakle, bez obzira to je neka distribucija nepoznata ona se moe
aproksimirati, tj. modelirati, pomou neke poznate distribucije za koju je ve
ranije utvreno da najbolje odgovara slinim situacijama, i ije su
karakteristike u statistikoj teoriji ve ispitane. Tako, na primjer, ako se
ispituje visina, teina ili inteligencija pojedinih grupa, statistika praksa
sugerie da je najbolje koristiti normalnu distribuciju. Ako se ispituje
vrijednost aritmetike sredine ili proporcije u skupu na osnovu uzorka koji
ima vie od 30 elemenata, statistika teorija, na osnovu tzv. centralnog
graninog teorema, upuuje na koritenje normalne distribucije, itd.
Binomna distribucija
Najee koritena prekidna distribucija u primijenjenoj statistici je binomna
distribucija. Da bi se potpunije sagledala objasniemo prethodno pojam tzv.
Bernulijevog (Bernoulli) procesa.
Posmatrajmo sukcesivno izvoenje nekog eksperimenta u kome se jedno
izvoenje naziva opit. Pretpostavimo da su u svakom pojedinom opitu
mogua samo dva, uzajamno iskljuiva, ishoda koje emo arbitrarno nazvati
uspjeh i neuspjeh. Veliki broj eksperimenata moe se statistiki klasifikovati
na ovaj nain. Na primjer, pri bacanju novia mogua su samo dva ishoda
(dogaaja) pad pisma ili grba; proizvedeni artikal moe biti ispravan ili
neispravan; ispit se poe poloiti ili pasti, itd. U svakom od ovih primjera,
zavisno od istraivanja, jedna dogaaj se oznaava kao uspjeh a drugi kao
neuspjeh. Na primjer, pad pisma moemo oznaiti kao uspjeh, ali i
neispravan priizvod moe se oznaiti kao uspjeh.
137

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ovakav opit koji moe produkovati samo dva ishoda naziva se Bernulijev
opit. Nas, meutim, nee interesovati samo jedan Bernulijev opit, nego niz
nezavisnih, ponovljenih Bernulijevih opita. Takav niz opita naziva se
Bernulijev proces ako su ispunjeni slijedei uslovi:
a) Svaki opit rezultira u jednom od dva mogua ishoda koji se tehniki
klasifikuju kao uspjeh (U) i neuspjeh (N);
b) Vjerovatnoa uspjeha, p = P(U), konstantna je od opita do opita.
c) Vjerovatnoa neuspjeha P(N) = 1-p oznaava se se sa q, tako da je
p+q=1.
d) Opiti su nezavisni, odnosno bilo koji ishod da se realizuje u nekom opitu
nee imati uticaja na vjerovatnou ishoda u bilo kom drugom opitu.
Vjerovatno je jajjednostavniji primjer Bernulijevog procesa eksperiment sa
bacanjem pravilnog novia, gdje se pojavljivanje pisma ili grba moe
klasifikovati kao uspjeh i neuspjeh, respektivno, tako da je p+q=1.
Ukoliko se izvri n ponovljenih Bernulijevih opita tada broj uspjeha moe
iznositi 0, 1, 2, ..., n. Cilj je odrediti formulu za izraunavanje vjerovatnoe
ostvarivanja svakog mogueg broja uspjeha unutar n nezavisnih, uzastopno
ponovljenih opita koji formiraju Bernulijev proces. Distribucija do koje se
dolazi na ovaj nain i koja daje eljene vjerovatnoe naziva se binomna
distribucija.
Radi potpunijeg sagledavanja logike izvoenja binomne distribucije naprije
e se uzeti primjer odreivanja vjerovatnoe dobijanja tano dva pisma u
eksperimentu sa bacanjem novia pet puta, a zatim e se dobijeni izraz
generalizovati.
Svako pojedinano bacanje moe se tretirati kao Bernulijev opit odnosno kao
jedan opit unutar Bernulijevog procesa. Oznaimo pojavljivanje pisma kao
uspjeh. Pretpostavlja se da je u konkretnom eksperimentu prilikom pet
uzastopnih bacanja dobijen sljedei niz ishoda:
GPGGP
gdje su sa G i P oznaeni grb i pismo, respektivno. Da bi se pojednostavila
analiza transformisae se oznake ishoda tako to e se pojava uspjeha
oznaiti sa brojem 1, a neuspjeha sa 0. Kako je u eksperimentu pismo
oznaeno kao uspjeh, gornji niz izhoda moe se napisati kao 01001.
Vjerovatnoa uspjeha i neuspjeha u pojedinanom opitu iznose p i lj,
respektivno. Podsjetimo se da je, na osnovu definicije nezavisnih dogaaja,
vjerovatnoa njihovog zajednikog javljanja jednaka produktu pojedinanih
vjerovatnoa. Stoga je vjerovatnoa ostvarivanja konkretnog niza jednaka
P(P, G, G, G, P) = P(0, 1, 0, 0, 1) = q*p*q*q*p = p2 q3
138

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Dobijena vjerovatnoa ukazuje na mogunost dobijanja realizacije


navedenog niza uspjeha i neuspjeha po redoslijedu kako je dat. Ali nas ne
interesuje niti jedan pojedinani redoslijed rezultata, nego vjerovatnoa
dobijanja tano dva uspjeha (pisma) prilikom izvoenja 5 opita, bez obzira
na poredak. Da bi se izraunala ta vjerovatnoa pored osim posmatranog
niza potrebno je uzeti i sljedeih devet nizova, od kojih svaki sadri tano
dva uspjeha i tri neuspneha u pet uzastopnih opita:
1
1
0
0
0
1
0
1
0
0
1
0
0
1
0
1
0
0
0
1
0
1
1
0
0
0
1
0
1
0
0
0
1
1
0
0
0
1
0
1
0
0
0
1
1
Koristei isti nain razmiljanja kao i kod prvog niza, zakljuujemo da bilo
koji od navedenih nizova ima istu vjerovatnou pojavljivanja p2q3.
Broj razliitih nizova u naem primjeru jednak je broju kombinacija
5 2 3
p q 10 p 2 q 3
(3.2.4.7)
2
Ukoliko je novi pravilan, vjerovatnoe pojave pisma i grba su jednake, tj.
p = q = 0,5, pa zamjenom u izraz 3.2.4.7 dobije se vrijednost 0,3125.
Navedeni rezultat moe se sada pooptiti da bi se utvrdilo koliko iznosi
vjerovatnoa dobijanja tano x uspjeha pri izvoenju n opita Bernulijevoh
procesa. Potrebno je najprije odrediti vjerovatnou dobijanja bilo kog
mogueg niza koji sadri x uspjeha, a zatim tu vjerovatnou pomnoiti sa
brojem moguih nizova. Poto nije bitno kojim se redoslijedom pojavljuje
uspjeh i neuspjeh, odaberimo onaj niz u kojem se najprije realizuje x uspjeha
a zatim n-x neuspjeha. Ovaj niz moe se predstaviti u obliku:
1 1 1.... 1
0 0 0 ... 0
x uspjeha
n-x neuspjeha
Ukupan broj nizova koji u sebi sadri x uspjeha i (n-x) neuspjeha jednak je
broju kombinacija x elemenata izabranih iz skupa od n elemenata
n
n!

x x!(n x)!
Uslijed toga vjerovatnoa dobijanja tano x uspjeha u n opita iznosi
139

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

n
n
P( x) p x q n x p x (1 p) n x za x = 0, 1, 2, ..., n
x
x

(3.2.4.8)

Dobijeni izraz predstavlja binomnu distribuciju vjerovatnoe u sluaju n


opita.
Ako sada sa X oznaimo sluajnu varijablu koja pokazuje broj uspjeha u n
opita vidimo da je P( x) P( X x) odnosno da binomna sluajna varijabla
moe uzeti jednu od vrijednosti 0, 1, 2, ..., n sa odgovarajuim
vjerovatnoama koje su date izrazom 3.2.4.8.
Binomna distribucija:
n
n
P( x) p x q n x p x (1 p) n x
x
x

za x = 0, 1, 2, ..., n

n = broj opita; p = vjerovatnoa uspjeha u svakom opitu


Mogue vrijednosti binomne sluajne varijable i odgovarajue vjerovatnoe
prakazane su tabelom 3.2.4.3.
Tabela 3.2.4.3.: Binomna distribucija vjerovatnoe
Broj uspjeha

Vjerovatnoa P(x)

n 0
p (1 p) n 0 (1 p) n
0

n 1
p (1 p ) n 1 np(1 p ) n 1
1

n 2
p ( 1 p ) n 2
2

.
.
.

.
.
.

n x
p 1 p n x
x

.
.

n n
p (1 p) n n p n
n

Podsjetimo da je binomna distribucija prekidna distribucija, jer sluajna


varijabla moe uzeti samo jednu vrijednost iz skupa izolovanih konanih
brojeva n. Ona zadovaljava oba uslova za distribuciju vjerovatnoe - svaka
vjerovatnoa koja figurie u distribuciji vjerovatnoa je nenegativna i suma
svih vjerovatnoa jednaka je 1. Prvi uslov je ispuljen jer su p i (1-p)
nenegativni brojevi, pa P(x) ne moe biti negativno.

140

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Radi sagledavanja drugog uslova podsjetimo se jednog matematikog izraza,


tzv. binomne formule:
n
n
n
n
n
(a b) n a n ba n1 b 2 a n2 ... b x a n x ... b n
0
1
2
x
n

U naem sluaju ako uvrstimo da je a=lj i b=p ovaj izraz daje


n
n
n
(q p) n q n pq n1 p 2 q n2 ... p x q n x ... p n
1
2
x

(3.2.4.9)

S obzirom da je lj=1-p, usporedbom u tabeli 3.2.4.3. vidi se da sukcesivni


lanovi na desnoj strani izraza predstavljaju binomne vjerovatnoe P(0),
P(1), ..., P(n):
P(0) (1 p) n q n
n
P(1) np(1 p) n1 pq n1
1

.
.
.
P(n) p n
Zakljuujemo da se sa desne strane izraza 3.2.49. nalaze sve vjerovatnoe
koje figuriu u binomnoj distribuciji vjerovatnoe. Kako se na lijevoj strani
tog izraza nalazi (p+q)n, a poznato je da je (p+q)=1, vidi se da je suma svih
binomnih vjerovatnoa jednaka 1n=1, ime je ispunjen i drugi uslov.
Binomna distribucija ima dva parametra, n i p. Mijenjanjem njihovih
vrijednosti dobijaju se rezliite binomne distribucije, to znai da se termin
binomna distribucija odnosi na cijelu familiju binomnih distribucija od kojih
svaka zavisi od konkretnih vrijednosti parametara n i p. Da se sagleda kako
vrijednosti parametara utiu na oblik binomne distribucije, na slici 3.2.4.2.
dat je grafiki prikaz nekoliko razliitih binomnih distribucija.
Na osnovu slike 3.2.4.2. zakljuuje se da je binomna distribucija simetrina
kad je p=0,5 bez obzira na vrijednost n. Kad je p<0,5 distribucija je
asimetrina udesno, a u sluaju kad je p>0,5 distribucija je asimetrina
ulijevo. Izuzetno vana osobina binomne dostribucije moe se uoiti sa slika
c, d, e: ukoliko se parametar p ne razlikuje mnogo od 0,5 sa poveanjem
broja opita (n) distribucija postaje sve simetrinija (dobija zvonasti oblik).
Meutim, kada se p znatno razlikuje od 0,5 ta tendencija se ne moe uoiti
(slike f i g).

141

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 3.2.4.2.a. Binomna distribucija za n=5 i p=0,5

Slika 3.2.4.2.b. Binomna distribucija za n=10 i p=0,5

Slika 3.2.4.2.c. Binomna distribucija za n=5 i p=0,3


142

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 3.2.4.2.d. Binomna distribucija za n=10 i p=0,3

Slika 3.2.4.2.e. Binomna distribucija za n=25 i p=0,3

Slika 3.2.4.2.f. Binomna distribucija za n=5 i p=0,9


143

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 3.2.4.2.g. Binomna distribucija za n=10 i p=0,9


Sa poveanjem vrijednosti n izraunavanje binomnih vjerovatnoa na
osnovu izraza 3.2.4.9. postaje zamorno. Zbog toga su napravljene tablice
koje daju pregled izraunatih vrijednosti n, p i x.
Tako na primjer, za n=5, p=0,5 i x=2 u tablici benomne distribucije
vjerovatnoe moe se pronai vrijednost .3125, tj. 0,3125, to predstavlja
vjerovatnou realizacije dva uspjeha u eksperimentu koji se sastoji od pet
uzastopnih opita sa vjerovatnoom uspjeha u svakom opitu od 0,5.
Da bi se na sintetiki nain sagledali najvaniji aspekti binomne distribucije
potrebno je odrediti srednju vrijednost i mjeru disperzije binomne sluajne
varijable. Aritmetika sredina (oekivana vrijednost), varijansa i standardna
devijacija vinomne distribucije dobijaju se na osnovu izraza:
Aritmetika sredina
x E ( X ) np
x2 np(1 p) npq
Varijansa
(3.2.4.10)
Standardna devijacija x npq
Kao primjer koritenja navedenih izraza posmatrae se najjednostavniji
sluaj kada je n=1. Distribucija vjerovatnoe sluajne varijable X = broj
uspjeha u jednom Bernulijevom opitu dat je sa
x
0
1
vjerovatnoa
lj
p
Oekivana vrijednost i varijansa izrauna se pomou formula 3.2.4.1. i
3.2.4.3. respektivno:
144

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
2

E ( X ) x xi pi x1 p1 x2 p 2 0q 1 p p
i 1

E ( X 2 ) xi2 pi x12 p1 x22 p 2 0 2 q 12 p p


i 1
2

VarX E[ X E( X )] E( X 2 ) [ E( X )]2 p p 2 p(1 p) pq


Imajui u vidu da je n=1, oigledno je da izrazi 3.2.4.10 vae u ovom
sluaju.
Primjer 1:
Realizuje se eksperiment bacanja novia jedanput (n=1).
U ovom eksperimentu imamo samo dvije mogunosti: A i AC.
Ova binomna sluajna varijabla moe se ematski predstaviti kao:

1;0
, p q 1
X :
p; q
Za svaki dogaaj je izvjesno da e se realizovati ili se nee realizovati pa je
P(A)+P(A)=p+q=1.
Primjer 2:
Eskperiment bacanja novia realizuje se dva puta (n=2).
U ovom eksperimentu imamo etiri mogue realizacije: AA, ACA, AAC, AC
AC. Sluajna varijabla se moe predstaviti u obliku:
AA; AA C iliA C A; AC AC AA;2 AA C ; AC AC

n 2, X : 2
2
p 2 ;2 pq; q 2

p
;
pq

qp
;
q

pri emu je suma vjerovatnoa

p 2 2 pq q 2 p q 1
2

Primjer 3:
Eskperiment bacanja novia realizuje se tri puta (n=3).
AAA;3 AAA C ;3 AAC AC ; AC AC AC
, pi p q 3 1
n 3, X : 3
2
2
3
i
p ;3 p q;3 pq ; q

Nastavimo li sa ovim eksperimentom dalje dobija se:


k n
k n n

n
n
n
n
Pxk p k q nk q n pq n1 p 2 q n2 ... p n

k 0
k 0 k
0
1
2
n
q n npq n1

nn 1 2 n2
n
p q ... p n p q 1
2

145

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 4:
Kolika je vjerovatnoa da porodica sa sedmoro djece ima dva djeaka?
Ovdje se mora najprije uoiti da se radi o binomnoj raspodjeli jer postoje
samo dva ishoda: djeak ili djevojica.
Nadalje, vano je uoiti da je vjerovatnoa pojavljivanja nekog od ovih
dogaaja konstantna.
Vjerovatnoa da se rodi djeak neto je vea (0,51) od 1/2 ali zbog
jednostavnijeg rauna uzimamo da je jednaka 1/2.
7
7
21
2
72
7
P(2) 1 / 2 1 / 2 1 / 2
0.16
128
2
2

jer je:
n
n!
7!
7 * 6 * 5 * 4 * 3 * 2 *1 7 * 6

21
k n k !k! 7 2!2! 5 * 4 * 3 * 2 *1 * 2 *1 2 *1

Hipergeometijska distribucija
Vidjeli smo da binomni model zahtijeva da vjerovatnoa uspjeha p mora
ostati konstantno iz opita u opit, odnosno da opiti moraju biti meusobno
nezavisni. Posebnu primjenu binomna distribucija ima u problemima
vezanim za izbor uzorka. Strogo uzevi, elementi uzorka bie meusobno
nezavisni (tj. vjerovatnoa p bie konstantna) samo u sluajevima kada se
uzorak veliine n uzima iz beskonanog osnovnog skupa ili ako se iz
konanog skupa uzima uzorak sa ponavljanjem. U ovom drugom sluaju
svaki elemet uzorka nakon izpitivanja vraa se u osnovni skup i prua mu se
mogunost da ponovo bude izabran u uzorak.
Ukoliko iz konanog skupa uzimamo uzorak bez ponavljanja uzastopna
izvlaenja bie zavisna i vjerovatnoa p mijenjae se nakon izbora svakog
novog elementa jer se broj i struktura preostalih elemenata u osnovnom
skupu mijenja. U praksi se najvei broj istraivanja sprovodi koritenjem
uzorka bez ponavljanja, pa na prvi pogled ne bi se smjela koristiti binomna
distribucija kada je posmatrana populacija konana.
Meutim, ako veliina uzorka n nije suvie velika u odnosu na veliinu
populacije N, binomna distribucija se ipak moe koristiti jer predstavlja
dobru aproksimaciju stvarne distribucije rezultata uzorka. Smatra se da e
aproksimacija biti zadovoljavajua ako je odnos n/N manji od 5%. Ali u
sluaju da se primjenjuje uzorak bez ponavljanja koji sadri 5% ili vie
elemenata korane populacije mora se koristiti hipergeometrijska

146

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

distribucija. Upotreba binomne i hiprgeometrijske distribucije prikazae se


tabelom 3.2.4.4.
Tabela 3.2.4.4.: Upotreba distribucija (binomna i hipergeometrijska) u
zavisnosti od izbora i veliine uzorka
Uzorak

Beskonano velika
populacija

Veoma velika konana


populacija ili n/N<5%

Konana populacija
n/N>5%

Bez ponavljanja
Sa ponavljanjem

Binomna
Binomna

Binomna
Binomna

Hipergeometrijska
Binomna

Pretpostavimo da uzimamo uzorak bez ponavljanja od n elementata iz


konane populacije od N elemenata, pri emu se svi elementi populacije
mogu klasifikovati u dvije grupe u zavisnosti od toga da li pokazuju ili ne
odreenu karakteristiku. Te grupe mogu biti zaposleni-nezaposleni radnici,
ispravni-neispravni proizvodi, studenti koji su poloili-pali na ispitu, itd.
Oznaimo kao kod binomne distribucije elemente jedne grupe kao uspjeh, a
druge kao neuspjeh. Neka ukupan broj elemenata u populaciji koji posjeduju
ispitivanu karakteristiku (uspjeh) iznosi N1 a broj elemenata koji je ne sadre
(neuspjeh) N2. Dakle N=N1+N2. Potrebno je odrediti distribuciju
vjerovatnoe za sluajnu varijablu X koja pokazuje koliko elemenata u
uzorku ima posmatranu karakteristiku. Ova ema uzimanja uzorka moe se
prikazati grafiki (slika 3.2.4.3)
Populacija

Uzorak

N1=broj uspjeha
N2=broj neuspjeha

x=broj uspjeha
Uzima se uzorak
veliine n

N=veliina populacije

n-x=broj neuspjeha
n=veliina uzorka

Slika 3.2.4.3. Uzimanje uzorka bez ponavljanja iz skupa iji su elementi


klasifikovani u dvije grupe
Izraz za distribuciju hipergeometrijske sluajne varijable X dobije se na
osnovu pravila kombinatorike, vodei rauna da x elemenata u uzorku mora
doi iz podgrupe N1 i da n-x elemenata koji ne posjeduju posmatranu
karakteristiku dolazi iz podgrupe od N2 elemenata.

147

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Hipergeometrijska distribucija
N1 N 2

x n x

P( X x)
N

n

x = 0, 1, ..., min(n, N1)

gdje su:
N = veliina populacije
N1 = broj "uspjeha" u populaciji
n = veliina uzorka (bez ponavljanja)
N2 = broj "neuspjeha" u populaciji
x = broj "uspjeha" u uzorku
min(n, N1) = minimum od n i N1
n-x = broj "neuspjeha" u uzorku

Kao i binomna i hipergeometrijska distribucija je prekidna i predstavlja


itavu familiju distribucija. Svaki lan familije odreen je sa tri parametra:
N, N1 i n. Aritmetika sredina i standardna devijacija hipergeometrijske
distribucije mogu se izraunati na osnovu slijedeih formula, u kojima je radi
N
jednostavnosti sa p 1 oznaen udio uspjeha u populaciji:
N
x x E ( x) np
(3.2.4.11)
N n
SD x np(1 p) *
N 1
Vidimo da hipergeometrijska distribucija ima istu aritmetiku sredinu kao i
binomna. Standardna devijacija hipergeometrijske distribucije se, meutim,
( N n)
razlikuje jer se mnoi sa izrazom
koji se naziva popravni faktor za
N 1
konanu populaciju. Standardne devijacije binomne i hipergeometrijske
distribucije nee se mnogo razlikovati kad je popravni faktor blizak jedinici,
odnosno kad uzorak sadri mali broj elemenata skupa (podsjetimo da se
najee uzima vrijednost n/N<5% kao mogunost dobre aproksimacije
hipergeometrijske distribucije binomnom.
Kako je izraunavanje hipergeometrijske distribucije veoma komplikovano
preporuljivo je tako planirati eksperiment uzimanja uzorka da se moe
koristiti binomna distribucija. To znai da ili se eksperiment mora odnositi
na beskonaan skup, ili je potrebno uzimati uzorak sa ponavljanjem, ili broj
elemenata u uzorku mora biti manji od 5% veliine populacije. U ovom
posljednjem sluaju mala je razlika izmeu binomnih i hipergeometrijskih
vjerovatnoa, iako naravno hiperbeometrijske daju egzaktan odgovor.

148

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Da bi se ilustrovala primjena hipergeometrijske distribucije posmatra se


proizvodni proces u kome se za sat vremena proizvede 50 diskova za
raunar. Neka se, zbog smanjenja trokova, proces prati sa uzorkom od 5
elemenata. Pretpostavimo da su u jednom odabranom satu 4 proizvedena
diska bila neispravna. Kolika je vjerovatnoa da e uzorak od 5 elemenata
sadravati tano 1 neispravan i 4 ispravna diska? Ova vjerovatnoa dobija se
koritenjem hipergeometrijske distribucije, jer je populacija konana a
veliina uzorka prema veliini populacije iznosi 10%;
4 46
4! 46!

1
4
P( X 1) P(1 _ neispravan _ i _ 4 _ ispravna) 1!3! 4!42! 0,308
50!
50

5
!45!
5

Poasonova (Poisson) distribucija


Kako smo do sada vidjeli binomna distribucija pokazuje vjerovatnoe
dobijanja x uspjeha prilikom n opita nekog eksperimenta, tj. Bernulijevog
procesa, pod uslovom da je vjerovatnoe uspjeha p konstantna iz opita u
opit. Ako je broj opita velik tada je direktno raunanje vjerovatnoe za
odgovarajue vrijednosti sluajne varijable postaje komplikovano. Ukoliko
je vjerovatnoa uspjeha p veoma mala (najee se uzima da je p 0,05 ) i
kada je n 20 , umjesto binomnog modela moe se koristiti Poasonov model
kao zadovoljavajui nain aproksimacije vjerovatnoa.
Zapazimo da kada je p blisko nuli ustvari ispitujemo dogaaje ija je
vjerovatnoa pojavljivanja veoma mala, pa ih moemo oznaiti kao rijetke
dogaajae. Poasonova distribucija ne slui samo za aproksimaciju binomnih
vjerovatnoa. Pomou nje mogue je opisivati veliki brij pojava bilo u
vremenu ili prostoru: broj klijenata koji se nalaze u redu i ekaju neku
uslugu, broj saobraajnih nezgoda u toku nedjelje, broj tamparskih greaka
po stranici u nekoj knjizi, broj estica emitovanih od neke radioaktivne
supstance, broj zastoja u radu maine u preduzeu,broj telefonskih poziva na
centrali, broj defekata na kvadratnom metru tkanine, godinji broj umrlih u
nekom gradu od neke rijetke bolesti, itd.
U navedenim primjerima Poasonova distribucija moe se koristiti da bi se
odredila vjerovatnoa broja javljanja nekog dogaaja u jedinici vremena ili
prostora uz uslov da je ispunjeno slijedee:
1. Broj javljanja dogaaja nezavisan je od jedne do druge jedinice vremena
ili prostora.
2. Vjerovatnoa javljanja nekog dogaaja proporcionalna je duini odreene
jedinice vremena ili prostora.
149

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

3. Vjerovatnoa istovremenog javljanja dva ili vie dogaaja u sasvim maloj


jedinici vremena ili prostora zanemarivo je mala.
Pod ovim uslovima distribucija sluajne varijable X, koja pokazuje koliko se
puta javio neki dogaaj u jedinici vremena ili prostora, ima oblik Poasonove
distribucije (francuski matematiar S.D. Poisson koji je 1837. godine objavio
lanak u kome se prvi put opisuje ova distribucija).
Poasonova distribucija:

P( X x)

e x
x!

x = 0, 1, 2, ...

>0

Ovaj izraz predstavlja vjerovatnou da prekidna sluajna varijabla X uzme


neku proizvoljnu vrijednost x. Broj e je baza prirodnog logaritma i iznosi
koji predstavlja prosjean broj javljanja nekog dogaaja u jedinici vremena
ili prostora. Parametar istovremeno predstavlja aritmetiku sredinu i
varijansu Poasonove distribucije, tj.
E ( X ) x x2
(3.2.4.12)
Poasonova distribucija predstavlja itavu familiju distribucija u zavisnosti od
vrijednosti parametra , to je prikazano na slici 3.2.4.3.

Slika 3.2.4.3. a: Poasonova distribucija =0,10

150

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 3.2.4.3. b: Poasonova distribucija =0,5

Slika 3.2.4.3. c: Poasonova distribucija =1,0

151

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 3.2.4.3. d: Poasonova distribucija =5,0


Sa slika se vidi da je Poasonova distribucija asimetrina udesno i da sa
poveanjem vrijednosti distribucija tei da zauzme simetrian oblik.
Za razliku od binomne i hipergeometijske sluajne varijable, Poasonova
sluajna varijabla, iako prekidna, moe uzeti beskonano mnogo izolovanih
vrijednosti.
Da bi se sagledalo kako se pomou Poasonove distribucije aproksimiraju
binomne vjerovatnoe (kada je p blisko nuli a n 20) posmatrajmo
proizvodni proces nekih elektrinih komponenti i pretpostavimo da je 2%
proizvoda neispravno. Ako se uzme uzorak od n=100 elemenata, kolika je
vjerovatnoa da e on sadravati 3 neispravna proizvoda?
Da bi doli do rjeenja uspostavimo najprije vezu izmeu binomnih i
Poasonovih vjerovatnoa sa:
n x
e np (np) x
p (1 p) n x
x!
x
Poasonova distribucija uzeta je u ovom izrazu kao aproksimacija binomne sa
=np.
Kako je u naem primjeru n=100, p=0,02 slijedi da je =np=2, pa Poasonova
vjerovatnoa za X=3 iznosi:
P( X 3)

e 2 2 3
0,1804
3!

Da je binomna distribucija koritena direktno dobilo bi se:


100
0,02 3 0,9897 0,1823
P( X 3)
3

to je veoma blisko aproksimativnoj vrijednosti, a znatno tee se izraunava.


152

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Uniformna distribucija
Jedna od najjednostavnijih prekidnih distribucija je uniformna distribucija.
Posebnu primjenu je nala u raunarskim simulacijama i igrama na sreu.
Njena osnovna osobina je da svaka vrijednost sluajne varijable ima jednaku
vjerovatnou pojavljivanja.
Pretpostavimo da sluajna varijabla X moe uzeti jednu od vrijednosti 1, 2,
..., n. Ako je vjerovatnoa da X uzme bilo koju od ovih vrijednosti jednaka, i
iznosi 1/n, i ako se ove vjerovatnoe ne mijenjaju od opita do opita, za X se
kae da ima prekidnu uniformnu distribuciju.
Uniformna distribucija:
1
P( X x)
n

x = 1, 2, ..., n

n = broj razliitih vrijednosti koje X moe uzeti

Aritmetika sredina i varijansa uniformne distribucije date su sa:


n 1
(3.2.4.13)
E( X ) x
2

VarX x2

n2 1
12

Kao primjer uniformne distribucije uzeemo primjer bacanja pravilne kocke.


Kako svaka strana kocke ima podjednaku mogunost pojavljivanja, sluajna
varijabla koja pokazuje broj taaka na kocki ima uniformnu distribuciju.
1
x = 1, 2, ..., 6
P( X x)
6
Grafiki se to moe predstaviti kao na slici 3.2.4.4.

153

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 3.2.4.4: Uniformna distribucija u eksperimentu bacanja pravilne


estostrane kocke (n=6)
3.2.2.6. Distribucija vjerovatnoe neprekidne sluajne varijable
Prekidna sluajna varijabla moe u jednom opitu uzeti neku vrijednost iz
konanog skupa brojeva ili iz skupa koji sadri prebrojivo mnogo brojeva.
Modeli distribucija zasnovani na pojedinim prekidnim sluajnim varijablama
imaju znaajnu ulogu u velikom broju eksperimentalnih situacija. Meutim,
postavlja se pitanje kako primjeniti binomne ili Poasonove tablice
vjerovatnoe kad se parametri distribucija nalaze izvan opsega tablica. Ve
je pokazano da se, za vrijednosti p bliske nuli i n 20, binomne vjerovatnoe
mogu zadovoljavajue aproksimirati Poasonovim.
Ali ta uraditi u situaciji kada se p znatno razlikuje od nule (npr. p = 0,6) ili
ako parametar kod Poasonove distribucije iznosi 30. Tada modeli
neprekidnih distribucije vjerovatnoe mogu pruiti odgovarajuu
aproksimaciju traenih vjerovatnoa. Osim toga, veliki broj i drutvenih i
prirodnih pojava moe uzeti bilo koju vrijednost iz nekog konanog ili
beskonanog intervala, odnosno po svojoj po svojoj prirodi moraju se
tretirati kao neprekidne sluajne varijable. Najee kada je neka pojava
podlona mjerenju, kao na primjer, visina, teina, veijednost hemoglobina,
potronja per capita, tjelesna temperatura, temperatura vazduha, potrebno
vrijeme da se uslui klijent u servisu, i slino, tada se ona moe smatrati
neprekidnom sluajnom varijablom. Uoimo da navedene varijable teorijski
mogu uzeti bilo koju vrijednost u nekom intervalu, iako je u praksi broj tih
vrijednosti konaan zbog nesavrenih mjernih instrumenata.

154

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Kao kod prekidne sluajne varijable do distribucije vjerovatnoe dolazi se


tako to se formira lista pojedinih vrijednosti sluajne varijable i
odgovarajuih vjerovatnoa. Meutim, kod neprekidne sluajne varijable
nemogue je sastaviti takvu listu jer je broj njenih vrijednosti beskonaan.
Zbog toga nema ni smisla govoriti o vjerovatnoi da sluajna varijabla X
uzme jednu odreenu vrijednost P(X=x) jer takvih vrijednosti ima
beskonano mnogo, pa je ta verovatnoa jednaka nuli za svako x.
Radi jasnijeg sagledavanja koncepta neprekidne distribucije vjerovatnoe
posmatrajmo distribuciju 100 studenata prema vremenu potrebnom da se
uradi jedan zadatak na ispitu iz statistike prikazan tabelom 3.2.5.1.
Tablela 3.2.5.1.: Distribucija 100 studenata prema vremenu potrebnom za
izradu jednog zadatka
Red. br.
1
2
3
4
5
6
7

Vrijeme
(min)
20-24
25-28
29-32
33-36
37-40
41-44
45-48

Frekvencija
5
10
22
27
21
13
3

Relativna
frekvancija
0,05
0,10
0,22
0,27
0,21
0,13
0,03

Prema tabeli 3.2.5.1. dobije se grafiki prikaz na slici 3.2.5.1.

Slika 3.2.5.1: Distribucija frekvencije studenata prema vremenu izrade


ispitnog zadatka, irina intervala 5 min
Na osnovu date tabele i dijagrama moe se zakljuiti da histogram relativnih
frekvencija ima slijedee dvije karakteristike:
- Ukupna povrina ispod histograma jednaka je 1. jer je suma relativnih
frekvencija jednaka 1,
155

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

- Relativna frekvencija za bilo koje dvije granine vrijednosti grupnih


intervala (npr. 24 i 40) moe se dobiti kao povrina ispod histograma koja
odgovara datom intervalu.
U naem primjeru irina grupnog intervala je 4 a broj grupa 7. Ispitajmo
sada ta e se desiti sa histogramom relativnih frekvencija kada se poveava
broj obuhvaenih jedinica posmatranja. Pretpostavimo da imamo takve
mjerne instrumente koji nam omoguuju izbor proizvoljno male irine
vremenskog intervala. Ukoliko se irina intervala smanjuje, a broj intervala i
broj jedinica posmatranja raste, histogram relativnih frekvencija teie da
obrazuje glatku neprekidnu krivu pa se na isti nain kao i kod prikaza
prekidnih mogu prikazati i distribucije frekvencija neprekidnih sluajnih
varijabli.

Slika 3.2.5.2: Distribucija frekvencije studenata prema vremenu izrade


ispitnog zadatka: n= 841 student, irina intervala 0,5 min

Slika 3.2.5.3: Distribucija frekvencije studenata prema vremenu izrade


ispitnog zadatka: n= 19460 studentata, irina intervala 0,1 min.

156

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Na slikama 3.2.5.2 i 3.2.5.3. ilustrirano je smanjenje irine grupnog intervala


a poveanje broja intervala i broja jedinica posmatranja.
Sa daljim poveavanjem broja jedinica posmatranja, povaavanjem broja
intervala i smanjenjem irine intervala dolazi se do graninog sluaja u
kojem imamo beskonano male (infonitezimalne) intervale. Dakle, kada bi
broj podataka teio beskonanosti imali bi beskonano mnogo intervala ija
bi irina teila nuli, pa bi se histogram potpuno transformisao u neprekidnu
krivu. Kako su na osnovu koncepta relativne frekvencije, vjerovatnoe
ustvari granine relativne frekvancije, zakljuujemo da bi dobijena kriva
predstavljala distribuciju vjerovatnoe. Ona pokazuje kako je ukupna
vjerovatnoa distribuirana s obzirom na sve mogue vrijednosti sluajne
varijable. Takva funkcija naziva se kriva gustoe vjerovatnoe. Matematika
funkcija oznaena sa f(x) naziva se funkcija gustine vjerovatnoe (ili
distribucija vjerovatnoe) neprekidne sluajne varijable.
Osnovne karakteristike funkcije gustoe vjerovatnoe mogu se formulisati
polazei od osobina histograma relativnih frekvencija.
1. Funkcija gustoe nikada nije negativna, tj. f(x)0.
2. Ukupna povrina ispod krive gustoe vjerovatnoe uvijek je jadnaka 1.
Budui da se radi o neprekidnoj kriviumjesto znaka za sabiranje koristi se
integral, tj.
f ( x)dx 1
D

gdje je D - oblast definisanosti X (npr. - <X< +). Na slici 3.2.5.4.


prikazana je hipotetika distribucija nepekidne sluajne varijable X.
f(x)

P(a<x<b

Slika 3.2.5.4. Distribucija vjerovatnoe neprekidne sluajne varijable

157

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Vjerovatnoa da X uzme vrijednost u nekom intervalu (a,b) jednaka je


povrini izmeu krive f(x) i x ose du intervala (a,b). Ako je funkcija f(x)
integrabilna, ta se povrina moe izraziti odreenim integralom
b

P(a X b) f ( x)dx

(3.2.5.1)

Poto je sluajna varijabla neprekidna i moe uzeti beskonano mnogo


vrijednosti, vjerovatnoa da uzme jednu odreenu vrijednost jednaka je
1/=0. Stoga je P(X=a)=P(X=b)=0 pa je
P(a<X<b) = P(aX<b) = P(a<Xb) = P(aXb).
Znai kod neprekidne sluajne varijable ukljuivanje graninih vrijednosti
intervala nee mijenjati vjerovatnou da sluajna varijabla X pada u taj
interval. Na osnovu navedenog zakljuujemo da vrijednost funkcije gustoe
f(x) ne predstavlja vjerovatnou kao kod prekidne sluajne varijable P(X=x),
ve nam samo daje informaciju o veliini ordinate.
Kada je poznat matematiki izraz za funkcije gustoe f(x) neprekidne
sluajne varijable, problem nalaenja vjerovatnoe da X uzme vrijednost u
nekom intervalu svodi se na izraunavanje odgovarajue povrine ispod
krive. Meutim, nije potrebno u svakom konkretnom sluaju izraunavati taj
odreeni integral, jer su za veliki broj vrijednosti najvanijih neprekidnih
distribucija sluajnih varijabli konstruisane odgovarajue tablice
vjerovatnoe.
Do sada smo ve uoili osnovne zajednike karakteristike distribucije
vjerovatnoe u prekidnom i neprekidnom sluaju. Na slian nain mogue je
uspostaviti analogiju izmeu funkcije distribucije, oekivane vrijednosti i
varijanse prekidne i neprekidne sluajne varijable. S obzirom na to da ove
statistike kategorije imaju potpuno isto znaenje u oba sluaja, u tabeli
3.2.5.2. daju se samo formule (sa D je oznaena oblast definicije sluajne
varijable X).
Tabela 3.2.5.2.: Usporedba parametara prekidne i neprekidne sluajne
varijable
Usporedba
varijabli
Funkcija
distribucije

Sluajna varijabla
Neprekidna

Prekidna

F ( x) P( X x)

f ( x)dx

F ( x ) P ( X x ) P ( X xi )
i

Oekivana
vrijednost

E ( X ) xf ( x)dx

Varijansa

x2 [( x E ( X )] 2 f ( x)dx

E ( X ) xi p i
i

158

[( xi E ( X )] 2 pi
2
x

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Funkcija distribucije neprekidne sluajne varijable ima veliku ulogu kod


odreivanja vjerovatnoe da se X nae u nekom intervalu. Naime, tablice
vjerovatnoe pojedinih modela distribucija nejee su date na osnovu
funkcije distribucije.
Uoimo najprije da F(x) predstavlja povrinu ispod krive funkcije gustoe od
njenog poetka do take x, odnosno vjerovatnou da e sluajna varijabla X
uzeti neku vrijednost u intervalu ija je gornja granica x. Podsjetimo se da je,
slino, u prekidnom sluaju F(x) predstavljala kumulativ vjerovatnoa do
take x i da se dobijala sumiranjem pojedinih vjerovatnoa. Na slici 3.2.5.5.
prikazan je smisao neprekidne sluajne varijable.
f(x)

F(x)=P(X=x)

1-F(x)

Slika 3.2.5.5.: Grafiki prikaz proizvoljne funkcije gustoe i funkcija


distribucija
Poto povrina ispod krive predstavlja vjerovatnou, funkcija distribucije
(rafirani dio na slici) i ostatak povrine u zbiru moraju biti jednaki 1. Zbog
toga je taj ostatak povrine jednak 1-F(x)=P(X>x).
jerovatnoa da neprekidna sluajna varijabla uzme vrijednost u nekom
intervalu (a,b) moe se odrediti kao
p(A<x<B) = F(b) F(a)
(3.2.5.2)
tj. kao razlika funkcije distribucije gornje i donje granice intervala. Ovo se
lako moe shvatiti ako se podsjetimo da je F(b) vjerovatnoa da X uzme
vrijednost manju ili nednaku b, a F(a) vjerovatnoa da X uzme vrijednost
manju ili jednaku a; njihova razlika mora biti jednaka vjerovatnoi da se X
nae izmeu a i b. Slika 3.2.5.6. ilustruje nalaenje vjerovatnoe da se X
nae u intervalu (a,b) koritenjem izraza 3.2.5.2. Povrina rafirana na slici
3.2.5.2.a dobijje se kada se od rafirane povrine na slici 3.2.5.2.b oduzme
rafirana povvrina na slici 3.2.5.2.c

159

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
f(x)

P(a<x<b)

Slika 3.2.52.a Odreivanje vjerovatnoe da se X nae u intervalu (a,b)


koritenjem funkcije distribucije
f(x)

F(b)

Slika 3.2.52.b Odreivanje vjerovatnoe da se X nae u intervalu (a,b)


koritenjem funkcije distribucije

F(a)

Slika 3.2.5.2.c Odreivanje vjerovatnoe da se X nae u intervalu (a,b)


koritenjem funkcije distribucije

160

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U okviru neprekidnih modela distribucija razmotrie se normalna distribucija


dok e se t-distribucija i 2 - distribucija razmotriti kasnije kod rjeavanja
pojedinih statistikih problema.
3.2.2.7 Normalna distribucija
Normalnu distribuciju otkrio je Abraham de Movr (Abraham de Moivre)
1733. godine kao granini oblik binomne distribucije, posmatrajui ta se
deava sa binomnom distribucijom kad se broj opita neogranieno povea.
Ova distribucija bila je poznata jo i Laplasu (Laplace) u drugoj polovini 18.
vijeka. Meutim, ponovo je otkrivena i opisana od strane Gausa (C. Gauss)
1809. godine. Laplas i Gaus izveli su normalnu distribuciju kao matematiku
funkciju namijenjenu opisu distribucije greaka u mjerenjima astronomskih
opservacija.
Normalna distribucija ima centralno mjesto u statistikoj teoriji i praksi,
posebno u domenu statistikog zakljuivanja.
Za neprekidnu sluajnu varijablu kae se da ima normalnu distribuciju ako je
njena funkcija gustoe vjerovatnosti data sa:
Normalna distribucija:

f ( x)

( x )2
2 2

gsje su:
- matemetika konstanta priblino jednaka 3,14159;
e - matematika konstanta (baza prirodnog logaritma)
prblino jednaka 2,71828;
- aritmetika sredina normalne sluajne varijable
- standardna devijacija normalne sluajne varijable

(3.2.5.3)

Takvu sluajnu varijablu oznaavaemo sa X: N(, 2) (N( x ,SD2), to se


ita da X ima normalnu distribuciju sa parametrima i 2.
Karakteristike normalne distribucije lako je uoiti sa grafikog prikaza datog
na slici 3.2.5.3.

161

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

f(x)
N(,x2)

Slika 3.2.5.3.: Normalna kriva


Osobine normalne distribucije
1. Normalna distribucija ima zvonast oblik, unimodalna je i simetrina u
odnosu na vrijednost x=;
2. Aritmetika sredina, mod i medijana meusomno su jednaki kod normalne
distribucije;
3. Kriva normalne distribucije protee se od - do + , tj. asimptotski se
pribliava x osi, pa je njen intrval varijacije beskonaan (I=);
4. Relativna mjera asimetrije jednaka je nuli (3=0), a relativna mjera
spljotenosti jednaka je 3 (4= 3);
5. Ukupna povrina ispod krive, kao i kod svake krive gustoe vjerovatnoe,
jednaka je 1;
Kako je kriva simetrina, 50% povrine nalazi se lijevo od normale
podignute nad aritmetikom sredinom, a 50% desno. Poto je povrina ispod
krive ustvari vjerovatnoa, slijedi da vjerovatnoa da sluajna varijabla X
uzme neku vrijednost manju (ili veu) od aritmetike sredine iznosi 0,5.
6. Normalna distribucija u potpunosti je definisana parametrima i 2.
Dakle, kao i kod drugih do sada obraenih distribucija postoji itava familija
normalnih distribucija u zavisnosti od moguih vrijednosti parametara i 2.
Bilo koja distribucija moe se u optem sluaju oznaiti sa N(, 2). Na slici
3.2.5.4. prikazane su razliite kombinacije dvije normalne distribucije.

162

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
f(x)

Slika 3.2.5.4.a: Razliiti oblici normalnih distrubucija u zavisnosti od


vrijednosti parametara i ; sluaj
f(x)

Slika 3.2.5.4.b: Razliiti oblici normalnih distrubucija u zavisnosti od


vrijednosti parametara i ; sluaj i
f(x)

Slika 3.2.5.4.c: Razliiti oblici normalnih distrubucija u zavisnosti od


vrijednosti parametara i ; sluaj i
Sluaj (a) predstavlja dvije normalne distribucije sa jednakim varijansama a
razliitim aritmetikim sredinama. Sa poveanjem ili smanjenjem vrijednosti
aritmetike sredine dolazi do pomjeranja itave krive udesno ili ulijevo, uz
neizmjenjenu disperziju. U sluaju (b) aritmetike sredine su jednake ali se

163

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

varijanse razlikuju. U sluaju (c) razlikuju se i aritmetike sredine i


varijanse.
7. Tri-sigma ( 3 ) pravilo;
Pretpostavimo da smo povukli normale sa krive na osu x na udaljenosti od
jedne standardne devijacije u oba smjera u odnosu na aritmetiku sredinu.
Povrina ograniena krivom i normalama iznosie priblino 68% od ukupne
povrine ispod normalne krive (koja iznosi 1), odnosno u razmaku od 1
standardne devijacije od aritmetike sredine nalazi se priblino 68%
povrine ispod svake normalne krive. Time je odreena i vjerovatnoa da da
normalna sluajna varijabla X uzme neku vrijednost u navedenom intervalu.
P< X < ) 0,68
Ako sada normale povuemo na udaljenosti od dvije standardne devijacije
od aritmetike sredine u oba smjera, dobijena povrina iznosi priblino 95%
ukupne povrine, odnosno u terminima vjerovatnoe
P( - 2 < X < ) 0,95
Konano u intervalu 3 standardne devijacije od aritmetike sredine
obuhvaeno je priblimo 99,7% povrine itave krive, tj.
P< X < 0,997
Na slici 3.2.5.5. ilustrovana je navedena osobina koja se jo naziva i
pravilo, a koja vai nezavisno od veliine aritmetike sredine i standardne
devijacije.
Ova osobina ima izuzetno veliku primjenu u statistikom zakljuivanju. Vidi
se da je povrina koja se nalazi na krajevima distribucije zanemarivo mala.
To omoguava da se normalna distribucija koristi kao aproksimacija drugih
distribucija sa ogranienim intervalom varijacije, bez obzira na to to
normalna distribucija, teoriski, moe uzeti vrijednosti od - do + .
8. Linearna transformacija normalne sluajne varijable, takoe ima normalnu
distribuciju, a suma od n nezavisnih normalnih sluajnih varijabli ponovo je
normalna distribucija.
X1:N(i X2: N) tada je (X1 + X2): N(). Na isti
nain je i: (X1 - X2): N()

164

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

f(x)

{
{

Slika 3.2.5.5.a: Prikaz pravila normalne distribucije, sluaj


f(x)

{
{

Slika 3.2.5.5.b: Prikaz pravila normalne distribucije, sluaj 2

Slika 3.2.5.5.c: Prikaz pravila normalne distribucije, sluaj 3


Znaaj normalne distribucije
Normalna distribucija predstavlja najzanaajniju teorijsku distribucije
vjerovatnoe iz slijedeih razloga:
1. Veliki broj pojava ima priblino narmalnu distribuciju.
165

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2. Normalna distribucija moe posluiti kao dobra aproksimacija raznih


prekidnih distribucija (najee binomne i Poasonove) za one vrijednosti
parametara koje nisu date u tablicama vjerovatnoe.
3. Iz normalne distribucije izveden je veliki broj drugih neprekidnih
distribucija, koji imaju znaajno mjesto u statistikoj analizi,kao to su
Studentova (ili t) distribucija, 2 distribucija i F distribucija.
4. Normalna distribucija predstavlja bazu za parametarsko statistiko
zakljuivanje zbog svoje veze sa tzv. Centralnim graninim teoremom,
odnosno zbog tenje da distribucije statistika kao to je aritmetika sredina
uzorka i proporcija uzorka tee da, poveanjem veliine uzorka, formiraju
normalnu distribuciju, bez obzira na oblik distribucije matine populacije iz
koje potie analizarani uzorak.
5. Veliki broj statistikih problema se rjaava ili se moe rjeavati samo uz
pretpostavku da populacija kojoj pripada uzorak ima normalnu distribuciju.
Naime, normalna distribucija ima takve vane matematike karakteristike
kakve ne posjeduje niti jedna druga taorijska distribucija. ak i ako
pretpostavke o normalnosti skupa u praksi nisu ispuljene, metodi zasnovani
na tim pretpostavkama mogu dati sasvim zadovoljavajue rezultate.
Standardizovana normalna distribucija
Napomenuli smo da postoji cijela familija razliitih normalnih distribucija u
zavisnosti od vrijednosti parametara i 2. Da bi se utvrdila vjerovatnost da
normalna sluajna varijabla X uzme vrijednost u nekom intervalu moralo bi
se u svakom konkretnom sluaju izraunati odreeni integral koritenjem
izraza 3.2.5.1. to bi znatno usloilo analizu. Zbog toga je potrebno da se
formulie takav model normalne distribucije na koju e se moi svesti bilo
koja druga normalna distribucija, i da se na osnovu nje izraunaju eljene
vjerovatnoe. To se postie pomou standardizovane normalne distribucijeza
koju su konstruisane detaljne tablice vjerovatnoe.
Za normalnu distribuciju kae se da je u standardizovanom obliku ako je
njena aritmetika sredina jednaka nuli, a standardna devijacija jednaka
jedinici. Formula za funkciju gustoe standardizovane normalne sluajne
varijable moe se dobiti ako se u formulu 3.2.5.3. za normalnu distribuciju u
optem obliku zamijeni =0 i 2=1. Standardizovana normalna varijabla
oznaava se sa Z, pa se formula za njenu distribuciju moe napisati u obliku
f ( x)

1
2

z2
2

-<z<+

Krae se pie: Z: N(0,1)

166

(3.2.5.4)

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Na slici 3.2.5.6. prikazana je standardizovana normalna distribucija.


N(0,1)
0,5
0,4

0,3

0,2

0,1

-3

-2

-1

+1

+2

+3

Slika 3.2.5.6. Standardizovana normalna distribucija


Transformacijom X u Z dobijamo za svaku vrijednost X odgovarajuu
vrijednost Z, koja pokazuje odstupanje i smjer odstupanja vrijednosti
normalne varijable X od aritmetike sredine iskazano u standardnim
devijacijama .
Ako je, na primjer, z=2 to znai da je odgovarajua vrijednost normalne
varijable X vea od svoje aritmetike sredine za dvije standardne devijacije,
ako je z=-2,5, ta je vrijednost za 2,5 ispod .
U prilogu su date tablice vrijednosti funkcije distribucije standardizovane
normalne varijable. Kao i kod svake sluajne varijable i ovdje funkcija
distribucije F(z0) pokazuje vjerovatnou da sluajna varijabla Z uzme
vrijednost manju ili jednaku odreenoj vrijednosti z0:

F ( z 0 ) P( Z z 0 )

Grafiki je ova vjerovatnoa jednaka rafiranoj povrini


standardizovane normalne krive od - do take z0 na slici 3.2.5.7.
N(0,1)
0,5
0,4
F(z0)

0,3

0,2

0,1

-3

-2

-1

+1

z0 +2

+3

Slika 3.2.5.7. Funkcija distribucije standardizovane normalne varijable


167

ispod

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Budui da je ukupna povrina ispod krive jednaka 1, jasno je da nerafirani


dio povrine ispod normalne krive iznosi 1-F(z0). Ako bi se direktno
odreivala vrijednost funkcije distribucije morao bi sad izraunati odreeni
integral
z0

F ( z0 )

z2
2

dz

Meutim, rezultati integracije su ve sadrani u tablicama za vrijednost z0


koje su date na dvije decimale. Pretkolona tablice sadri vrijednosti z0 sa
jednom decimalom a druga decimala se ita u izdvojenom prvom redu
tablice. U presjeku tako izdvojenog prvog reda i pretkolone nalazi se traena
vrijednost funkcije distribucije. Tako, na primjer, vjerovatnoa da sluajna
varijabla Z uzme vrijednost manju ili jednaku 2,25 iznosi
P(Z 2,25) F (2,25) .9878 0,9878
Jasno je da se tablice mogu koristiti i u suprotnom smjeru. Na primjer, ako je
poznata vrijednost funkcije distribucije 0,9878 na osnovu tablica moe se
vidjeti da taka z0 iznosi 2,25.
Zbog posebne vanosti normalne distribucije u statistikoj analizi pokazae
se upotreba tablica standardizovane sluajne varijable u odreivanju
vjerovatnoe da Z uzme vrijednost u nekom intervalu.
Potraimo najprije vjerovatnou da z pada u interval (-1,5; 2,25).
Odgovarajua povrina ispod krive je rafirana na slici 3.2.5.8.
N(0,1)
0,5
0,4
P(-1,5<Z<2,25
0,3

0,2

0,1

z1=-1,5

z2=+2,25

Slika 3.2.5.8. Vjerovatnoa da Z uzme vrijednost u intervalu (-1,5; 2,25)


Traena vjerovatnoa se u optem sluaju izraunava koritenjem izraza
P(a<X<b)=F(b)-F(a), odnosno kao razlika funkcije distribucije gornje i donje
granice intervala P(z1<Z<z2)=F(z2)-F(z1) to je u naem sluaju:
P(-1,5 < Z < 2,25) = F(2,25) - F(-1,5) = 0,9878 - 0,0668 = 0,921

168

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Odredimo sada vjerovatnou da se Z nae u intervalu ije su granice


simetrine u odnosu na osu Y, tj. u odnosu na aritmetiku sredinu.
Ako se posmatra interval ogranien sa 1 od aritmerike sredine traena
vjerovatnoa se moe sagledati kao rafirani dio na slici 3.2.5.9. jer je .
N(0,1)
0,5
0,4
P(-1<Z<1)
0,3

0,2

0,1

-1

+1

Slika 3.2.5.9. Vjerovatnoa da se Z nae u intervalu od aritmetike


sredine, tj (-1,1)
Ovu vjerovatnou moemo izraunati na isti nain kao u prethodnom
primjeru, odnosno kao:
P(-1<Z<1) = F(1) - F(-1) = 0,8413 - 0,1587 = 0,6826
Ovim smo pokazali da se u razmaku od m nalazi 68,26% povrine ispod
itave normalne krive. Uoptimo ovaj rezultat i potrazimo vjerovatnou da Z
uzme vrijednost izmeu bilo koje dvije simetrine take (-z,z). Odgovarajua
povrina imae izgled kao na slici 3.2.5.10.
N(0,1)
0,5
0,4
P(-z<Z<z)
0,3

0,2

F(-z)

1-F(z)
0,1

-z

+z

Slika 3.2.5.10. Vjerovatnoa da Z pada u interval izmeu dvije simetrine


take
Traena vjerovatnoa se odreuje kao
P(-z<Z<z) = F(z) - F(-z)
169

(3.2.5.5)

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjetimo da su zbog simetrije normalne distribucije obe nerafirane


povrine na slici jednake, odnosno F(-z) = 1 - F(z). Zamjenom 3.2.5.5.
konano se dobije
P(-z <Z<z) = F(z) [1 - F(z)] = 2F(z) -1
(3.2.5.6)
Dakle, da bi se odredila vjerovatnoa da Z uzme vrijednost izmeu dvije
simetrine take, dovoljno je koristiti funkciju distribucije od gornje granice
intervala. U naem primjeru vjerovatnoa iznosi
P(-1<Z<1) = 2F(1) - 1 = 2*0,8413 - 1 = 0,6825
Sada moemo primijeniti i suprotan postupak, odnosno da poznavajui
vjerovatnou da Z uzme vrijednost u nekom intervalu odredimo granice
intervala. Ako je, na primjer, poznato da vjerovatnoa iznosi 0,95 granice
intervala moemo na osnovu 3.2.5.6. odrediti postavljajui jednakost
0,95 = 2F(z) 1 pa e F(z) iznositi 0,975. Odgovarajua vrijednost iz tablica
je z = +1,96, a na osnovu simetrije normalne krive zakljuujemo da donja
granica iznosi - 1,96. Znai, traeni interval iznosi (-1,96; 1,96).
Do sada smo govorili o primjeni tablica vjerovatnoa u izraunavanju
pojedinih vjerovatnoa kod standardizovane normalne distrirucije. Postavlja
se, meutim, pitanje kako odrediti vjerovatnoe za normalnu distribuciju u
optem obliku, odn osno sa proizvoljnom aritmetikom sredinom i
standardnom devijacijom.
Primjer 1.
Posmatrajmo primjer proizvodnje sijalica. Neka vijek trajanja sijalica ima
priblino normalnu distribuciju sa aritmetikom sredinom =100 asova i
standardnom devijacijom =20 asova. Kolika je vjerovatnoa da e
sluajno uzeta sijalica imati vijek trananja izmeu 60 i 90 asova?
Da se izrauna traena vjerovarnoa potrebno je najprije prevesti normalnu
distribuciju u standardizovanu. Bili koja sluajna varijabla X, sa
aritmetikom sredinom ( x ) i standardnom devijacijom (SD) moe se
transformisati u standardizovanu normalnu varijablu Z preko formule
X X x
Z

(3.2.5.6)

SD
Dok je originalna sluajna varijabla bila izraena u odreenim mjernim
jedinicama (u ovom sluaju to su asovi) primjenom formule 3.2.5.6. nova
sluajna varijabla Z ima standardizovanu skalu koja je nezavisna od mjernih
jedinica. Na ovaj nain, bez obzira na mjerne jedinice i kombinaciju
parametara podaci se uvijek mogu prevesti u standardizovane.
170

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Vjerovatnoa sa se sluajna varijabla X nalazi u nekom intervalu (x1, x2)


moe se sada izraunati koristei formulu:
P(x1 < X <x2) = P(z1 < Z < z2)
(3.2.5.7)
gdje su
z1

x1

z2

x2

Vidi se da je vjerovatnoa da sluajna varijabla X [X: (, 2)] uzme


vrijednost u intervalu (x1, x2) jednaka vjerovatnoi da standardizovana
x
x
sluajna varijabla Z[: N(0,1)] uzme vrijednost u razmaku 1
i 2
.

Ovo emo ilustrovati grafiki slikom 3.2.5.11.


Na osnovu relacije 3.2.5.7. moe se izraunati vjerovatnoa da e sluajno
izabrana sijalica imati vijek trajanja izmeu 60 i 90 asova:
90 100
60 X 90
60 100
P(60 X 90) P

Z
P


20

20
P(2 Z 0,5) F (0,5) F (2) 0,3085 0,0227 0,2758
N()

N(0,1)

x1

x2

P(x1 < X <x2)

z1

x1

z2

x2

S obzirom na to da je P(X x)=P(Z z=F(z)=0,95 iz tablice se nalizi z


vrijednost z=1,64 odakle, na osnovu 3.2.5.6. slijedi
x=m+zs=100+1,64*20=132,8
Dakle vjerovatnoa da sluajno izabrana sijalica ima vijek trajanja do 132,8
asova iznosi 0,95, odnosno, tano uee sijalica sa vijekom trajanja do
132,8 asova je 95%.
171

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Tablica br. 3.1. Vjerovatnoa y u zavisnosti od sluajne veliine z


z

0,0
0,1
0,2
0,3
0,4
0,5
0,8
1,0
1,3

0,399
0,397
0,391
0,381
0,368
0,352
0,290
0,242
0,171

1,5
1,8
2
2,3
2,5
2,8
3,0
3,4
3,5

0,129
0,079
0,054
0,030
0,018
0,008
0,004
0,001
0,001

Tablica br. 3.2. povrine ispod standardizovane normalne krive


z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1,0
1,3

1P
0,000
0,080
0,158
0,236
0,311
0,383
0,451
0,516
0,683
0,806

P
1,000
0,920
0,842
0,764
0,689
0,677
0,548
0,484
0,317
0,194

z
1,5
1,8
2,0
2,3
2,5
2,8
3,0
3,4
3,5
3,8

1-P
0,866
0,928
0,954
0,979
0,988
0,995
0,997
0,9993
0,999
0,9999

P
0,134
0,072
0,46
0,21
0,12
0,005
0,003
0,0007
0,001
0,0001

Primjeri:
Primjer 1:
Kolika se vjerovatnoa ostvaruje u intervalu od a) 1,00 SD; b) 1,96 SD
i c) 2,58 SD?
Da bi se dobila vjerovatnoa eljene povrine, iznos vjerovatnoe koja
odgovara granici zed vrijednosti proita se iz tablice povrina (tablica 3.2.) i
pomnoi za dva.
a) i = 1,00 SD
z=1,0 p = 0,3413*2 = 68,26%
b) i = 1,96 SD
z=1,96 p = 0,7450*2 = 95,00%
c) i = 2,58 SD
z=2,58 p = 0,4951*2 = 99,02%
Primjer 2:
U kom intervalu se ostvaruje vjerovatnoa od a) 0,6826; b) 0,95; c) 0,9902?
U ovom primjeru postupak je obrnut.
Vjerovatnoa se najprije dijeli sa dva. Zatim se dobijena vrijednost
(najpriblinija) trai u tablici 3.1. i oita se odgovarajua zed vrijednost.
172

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

a) p = 0,6826/2=0,3413
b) p = 0,95/2=0,4750
c) p = 0,9902/2=0,4951

z=1,0 i = 1,00 SD
z=1,96 i = 1,96 SD
z=2,58 i = 2,58 SD

Primjer 3:
Vrijednosti tjelesne mase ispitanika rasporeene su po nrmalnoj raspodjeli.
Ako je aritmetika sredina skupa 70 kg, a standardna devijacija 10 kg,
procijeniti vjerovatnou da sluajno izabrana osoba ima tjelesnu masu:
a)
izmeu 60 i 70 kg;
b)
izmeu 50 i 60 kg;
c)
izmeu 65 i 75 kg;
d)
preko 85 kg;
e) manje od 95 kg.
Najprije se empirijske vrijednosti standardizuju tj. transformiu u zed
vrijednosti, na osnovu kojih se iz tablice 3.1. proitaju vjerovatnoe
graninog odstupanja a zatim se izrauna vjerovatnoa povrine.
60 70
a) z
pz = 0,3413
1
10
50 70
b) z1
pz1 = 0,4772
2
10
60 70
pz2 = 0,3413
z2
1
10
p=p1-p2=0,4772-0,3413=0,1359
65 70
c) z1
pz1 = 0,1915
0,5
10
75 70
pz2 = 0,1915
z2
0,5
10
p = p1 + p2 =2p=2*0,1915=0,3830
85 70
d) z
pz = 0,4332
1,5
10
p = 0,5 pz =0,5-0,4332=0,0668
95 70
2,5
e) z
pz = 0,4938
10
p=0,5+pz=0,5+0,4938=0,9938

173

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

4. Uzorak i statistike uzorka (osnove reprezentativnog metoda)


Potpunu informaciju o karakteristikama osnovnog skupa daje samo
statistiki popis. Sprovoenje popisa, meutim, iziskuje mnogo vremena i
stvara velike trokove, posebno kada je osnovni skup veliki. Osim toga,
popis se ne moe sprovesti kada je osnovni skup neogranien (beskonaan),
ili je njegovo izvrenje besmisleno kada prikupljanje podataka znai
unitenje svih jedinica skupa. Zbog toga se popis esto zamjenjuje jednim
drugim metodom - metodom uzorka. Uzorak je dio osnovnog skupa
(populacije), a svrha njegovog izbora je da se u to kraem vremenu i sa to
manje trokova dobije valjana informacija o karakteristikama cijelog skupa
iz kojih uzorak potie.
Pored toga to je efikasniji i ekonominiji od popisa, metod uzorka moe
obezbjediti i bolji kvalitet prikupljenih podataka. Prikupljanje podataka
podlono je grekama bez obzira na to da li se vri popis ili bira uzorak. U
sprovoenju popisa angauje se veliki broj priuenih anketara (popisivaa),
dok se kod izbor uzorka, zbog manjeg obima posla, angauju samo struna
licakoja mogu istovremeno izriti i provjeru prikupljenih podataka. Zbog
mogunosti vee kontrole u ovoj fazi straivanja, podaci prikupljeni
uzorkom mogu biti preciznih od informacija dobijenih popisom.
4.1. Izbor uzorka
Osnovni motiv i zadatak pri izboru uzorka je donoenje vjerodostojnih i
pouzdanih zakljuaka o osnovnom skupu. Da bi zakljuci koje donosimo o
karakteristikama osnovnog skupa na osnovu uzorka bili vjerodostojni,
uzorak treba biti reprezentativan. Uzorak e biti reprezentativan ako je po
svojoj strukturi sliaj osnovnom skupu.
Pretpostavimo da nam je cilj da prognoziramo rezultat politikih izbora.
Uzorak od, na primjer, 100 biraa mogli bi formirati od lanova nae
porodice, bliskih prijatelja i poslovnih kolega. Malo je vjerovatno da bi na
ovaj nain formirali uzorak jer se politiki stavovi izabranih osoba mogu
znaajno razlikovati od stavova ostalih biraa. Da bi obezbjedili
reprezentativnost uzorka neophodno je da izbor jedinica vrimo na
odgovarajui nain.
Postoji vie metoda za izbor uzorka iz osnovnog skupa. Prema nainu izbora,
uzorke dijelimo u dvije osnovne grupe: u sluajne (probabilistike),
zasnovane na vjerovatnoi, namjerne (neprobabilistike). Ako prilikom
izbora elemenata u uzorak, svaki element osnovnog skupa ima unaprijed
174

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

poznatu vjerovatnou da bude izabran, i ako je ova vjerovatnoa razliita od


nule, takav uzorak naziva se sluajnim. Svi ostali metodi izbora uzorka su
poznati kao nesluajni, a tako izabrani uzorci kao namjerni uzorci.
Namjerni uzorak formiramo od jedinica osnovnog skupa koje biramo po
linom uvjerenju kao tipine ili reprezentativne za dati osnovni skup. U
namjerne uzorke spadaju uzorci formirani na osnovu subjektivnog suda
istraivaa, kvota uzorci i pogodni uzorci.
Ako istraiva po svom nahoenju bira svaku jedinicu uzorka, vjerujui da je
tako izabran uzorak reprezentativan za cijeli osnovni skup, on formira tzv.
uzorak zasnovan na subjektivnom sudu. Za razliku od ove vrste namjernih
uzoraka, ija reprezentativnost zavisi iskljuivo od slobodne procjene i
strunosti istraivaa, u izboru jedinica zakvotni uzorak prisutna su i neka
ogranienja. Struktura uzorka mora odgovarati cilju istraivanja i mora
odraavati strukturu osnovnog skupa.Elemente osnovnog skupa svrstavamo
u nekoliko grupa, prema jednom ili vie obiljeja, nakon ega izbor jedinica
iz svake grupe preputamo subjektivnom sudu anketara.
Pretpostavimo da iz skupa ena treba izabrati kvota uzorak, sa ciljem da se
analizira aktivnost ena u slobodnom vremenu.Uzorak treba da obuhvati
ene razliite starosne dobi, branog stanja, obrazovanja i mjesta stanovanja
(selo, grad) i to proporcionalno njihovoj zastupljenosti u osnovnom skupu.
Zbog subjektivnog izbora elemenata elemenata iz pojedinih grupa, i u ovom
sluaju je mogua pristrasnost u izboru, a njena veliina (pristrasnosti) zavisi
od strunosti i savjesnosti anketara.
Pogodni uzorci, kao to samo ime kae, formirani su od jedinica osnovnog
skupa iji je izbor pogodan. esto se koriste u ispitivanju javnog mnijenja
(anketiranje u glavnoj ulici, predgrau u okolini stadiona i slino) ali su
rijetko reprezentativni.
Principi teorije uzoraka ne mogu se primjenjivati na namjerne uzorke. Kod
svih ovih uzoraka ne poznajemo vjerovatnou izbora pojedinih elemenata
osnovnog skupa u uzorak, zbog ega se ne moe objektivno utvrditi
pouzdanost donesenih zakljuaka. Ipak, primjena namjernih uzoraka
opravdana je u sluajevima kad biramo uzorak u kratkom vremenu ili kada
izbor vrimo iz malog osnovnog skupa (pa je zastupljenost nekih jedinica
veoma vana). Prikladan je i u tzv. pilotskim istraivanjima, kada na osnovu
informacija o osnovnom skupu biramo vrstu uzorka koju emo koristiti u
analizi.

175

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prost sluajan uzorak


Ako iz odnovnog skupa veliine N izvlaimo uzorke od n elemenata tako da
svaki mogui uzorak veliine n ima istu vjerovatnou da bude izabran, takav
uzorak nazivamo prostim sluajnim uzorkom.
Iz osnovnog skupa veliine N mogue je izabrati vei broj uzoraka veliine n
koji se meu sobom razlikuju u bar jednom elementu. Naka je K broj svih
razliitih uzoraka.
Na osnovu izraza za broj kombinacija n-te klase od N elemenata dobije se
broj svih razliitih uzoraka veliine n iz osnovnog skupa veliine N
elemenata.
N
N!
K
n n!( N n)!
Ako se osnovni skup sastoji od pet elemenata A, B, C, D, i E, i ako iz skupa
biramo uzorak od dva elementa (n=2), onda je
5
5!
5 * 4 * 3 * 2 *1 5 * 4
K

10
2
2 2!(5 2)! 2 *1(3 * 2 *1)
Prosti sluajni uzorci su slijedei parovi elemenata:
(A, B)
(A, C)
(A, D)
(A, E)
(B, C)
(B, D)
(B, E)
(C, D)
(C, E)
(D, E)
Svaki od ovih parova ima istu vjerovatnou pojavljivanja, koja je ovdje
jednaka 1/10.
Navedeni postupak izbora jedinica u uzorak nazivamo izborom bez
ponavljanja, a na ovaj nain izabrani uzoram naziva se uzorkom bez
ponavljanja. Jedinicu iz osnovnog skupa koju izaberemo u prvom izvlaenju
ne vraamo u osnovni skup, tako da slijedei element uzorka biramo izmeu
preostalih jedinica osnovnog skupa. Zbog toga izbor jednog elementa u
uzorak mijenja vjerovatnou izbora preostalih elemenata u slijedeem
izvlaenju. U naem primjeru vjerovatnoa izbora jednog odreenog
elementa u prvom izvlaenju je 1/5, dok bi vjerovatnoa izbora u drugom
izvlaenju bila 1/4. Zakljuuje se da su uzastopni izbori elemenata u uzorku
bez ponavljanja meu sobom statistiki zavisni.
Napomenimo da pri izboru u uzorak bez ponavljanjaobino zanemarujemo
redoslijed izvlaenja. Uzorke smatramo razliitim ako se oni razlikuju u bar
jenom elementu, zbog ega, na primjer, uzorke (A, B) i (B, A) smatramo
identinim.
176

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prost sluajan uzorak moe biti i uzorak sa ponavljanjem. U postupku izbora


ovog uzorka, element koji smo izabrali u uzorak vraamo u osnovni skup
prije izbora slijedeeg elementa, to znai da isti element moemo izabrati u
uzorak vie puta. U sluaju izbora uzorka sa ponavljanjem najee
uzimamo u obzir i redoslijed izvlaenja, tako da uzorke sa istim elementima
smatramo razliitim ako je redoslijed izbora elemenata razliit. Ovdje je broj
moguih uzoraka K=Nn; u naem primjeru je K = 52 = 25i to su slijedei
ureeni parovi elemenata:
(A, A)
(A, B)
(A, C)
(A, D)
(A,E)
(B, A)
(B, B)
(B, C)
(B, D)
(B,E)
(C, A)
(C, B)
(C, C)
(C, D)
(C, E)
(D, A)
(D, B)
(D, C)
(D, D)
(D, E)
(E, A)
(E, B)
E, C)
(E, D)
(E, E)
Ovi uzorci imaju istu vjerovatnou izbora i ona iznosi 1/25. Pored toga,
birajui elemente sa ponavljanjem, svakom elementu osnovnog skupa
pruamo iztu vjerovatnou izbora u svakom izvlaenju, koja u naem sluaju
iznosi 1/5. Na ovaj nain obezbjeena je meusobna nezavisnost uzastopnih
izbora elemenata u uzorak.
U oba sluaja uzorci su birani iz konanog osnovnog skupa od N elemenata.
Kada je osnovni skup bezkonaan iz njega se moe izabrati i beskonano
mnogo razliitih uzoraka veliine n elemenata. Tada se prost sluajan uzorak
definie na slijedei nain: prost sluajan uzorak iz beskonanog osnovnog
skupa je uzorak u kome su sve opservacije meusobno nezavisne. Otuda je
prost sluajan uzorak izvuen iz beskonanog skupa ekvivalentan sa prostim
sluajnim uzorkom sa ponavljanjem izvuenim iz konanog skupa; u oba
sluaja izbori elemenata u uzorak su meu sobom statistiki nezavisni.
I pored navedene prednosti uzorka sa ponavljanjem u praksi se najee
koriste uzorci bez ponavljanja i to iz dva razloga. Prvi razlog; osnovni skup
iz koga se bira uzorak u pravilu je veliki pa se promjene koje sukcesivni
izbor elemenata izaziva na vjerovatnoama izbora preostalih jedinica mogu
zanemariti. Na primjer, ako iz osnovnog skupa od 10000 jedinica biramo
uzorak od 30 jedinica bez ponavljanja, vjerovatnoa izbora svake jedinice u
prvom izvlaenju je 1/10000 = 0,0001, u drugom je 1/9999 0,0001, dok u
posljednjem, tridesetom izvlaenju, iznosi 1/9970 0,0001003 i priblino je
jednaka vjerovatnoi izbora u prvom izvlaenju. Drugi razlog, uzorci bez
ponavljanja imaju prednostu odnosu na uzorke sa ponavljanjem jer su
efikasniji. U njima nema ponovljenog izbora istih elemenata iz osnovnog
skupa,pa svaka jedinica uzorka nosi novu informaciju. U daljem izlaganju
baviemo se prije svega uzorcima bez ponavljanja, izabranim iz velikih
177

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

konanih osnovnih skupova. Samo u sluaju kada biramo uzorak koji


predstavlja relativno veliki dio osnovnog skupa, izbor elemenata vrie se sa
ponavljanjem.
Tablice sluajnih brojeva
Izbor jedinica iz konanog osnovnog skupa u prost sluajan uzorak u praksi
se najee sprovodi primjenom tablica sluajnih brojeva. Ove tablice su
tako konstruisane da svi brojevi u njima imaju istu i nezavisnu vjerovatnou
javljanja. Na taj nain se svakoj jedinici osnovnog skupa daje podjednaka
mogunost (1/N) da bude izabrana u uzorak, pri emu su izbori jedinica u
uzorak meu sobom nezavisni. Jedna od tablica petocifrenih sluajnih
brojeva data je u tabeli 4.1.1. a dobijena je upotrebnom rand() funkcije na
raunaru.
Tabela 4.1.1.: Tablice sluajnih brojeva dobijene upotrebom rand () funkcije
u MS Excel
13629
44802
80916
11220
38589
06408
57095
72563
16950
52234

74730
77510
89987
13582
50027
17838
34318
97855
53894
15857

66221
98448
55429
91130
16366
89227
43256
94031
48491
36676

75262
69451
11845
69033
79940
31348
03709
99050
23473
19338

49237
67025
31890
91207
95393
70707
20526
02503
97689
08247

22943
00310
11293
05332
55552
49623
54485
84022
13856
83636

Prikaimo upotrebu tablice sluajnih brojeva na slijedeem primjeru.


Pretpostavimo da od 2500 zaposlenih u jednom preduzeu biramo prost
sluajan uzorak od 30 zaposlenih. Cilj je utvrditi strukturu svih zaposlenih
po starosti. Da bi izabrali 30 jedinica osnovnog skupa, u prvom koraku
numeriemo sve jedinice skupa od 1 do N, tj. od 1 do 2500. Broj N je
etvorocifren, pa u drugom koraku iz tablica sluajnih brojeva biramo 30
etvorocifrenih brojeva od 0001 do 2500 i to na sistematski nain. Poetak
izbora brojeva i nain itanja (vertikalno ili horizontalno) biramo
proizvoljno.
Pretpostavimo da smo izabrali sam poetak iz tabele 4.1.1. i da brojeve
itamo vertikalno. Za poetak se moe izabrati i neki drugi broj ali se to
unaprijed mora definisati, na primjer broj u petoj koloni i sedmom redu. Iako
su brojevi u tablicama petocifreni, biraju se etvorocifreni brojevi
zanemarujui zadnju cifru u petocifrenom broju. Poetni ervorocifreni broj
178

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

je 1363, pa je prvi element prostog sluajnog uzorka zaposleni radnik sa


rednim brojem 1363. Zatim slijedi broj 4480. Kako je ovaj broj vei od
2500, ukupnog broja posmatranih radnika, zanemarujemo ga. Trei broj u
nizu je 8091 koji, takoe, zanemarujemo. etvrti broj u nizu je 1122 pa je
drugi radnik u uzorku radnik sa rednim brojem 1122.
Na opisani nain izdvajaju se brojevi 640, 1695, 1358, 1783, itd. sve dok se
ne sastavi eljeni spisak od 30 brojeva. U sluaju da se prije izbora traenih
30 brojeva naemo na kraju prve kolone etvorocifrenih brojeva, izbor se
nastavlja od vrha slijedee kolone, itd. U sluaju da se u nizu brojeva javi
0000, tada se po dogovoru bira prvi ili posljednji element iz osnovnog skupa,
tj. 0001 ili 2500. U sluaju da se izti broj javi dva ili vie puta,njegova
ponavljanja ne uzimaju se u obzir ako izbor jedinica vrimo bez ponavljanja.
Ukoliko se bira uzorak sa ponavljanjem, element sa datim rednim brojem
uzvrstiemo u uzorak onoliko puta koliko se njegov redni broj ponovio.
Nakon izbora 30 brojeva, u treem koraku iz spiska zaposlenih izdvajaju se
oni sa izabranim rednim brojem i biljee se vrijednosti posmatranog
obiljeja, tj. godine starosti izabranih radnika. Na osnovu ovih informacija iz
uzorka donosimo zakljuak o starosnoj strukturi u osnovnom skupu.
Napomenimo da se tablice sluajnih brojeva nikada ne koriste od istog
poetka. Pri svakoj slijedeoj upotrebi polazi se od kraja prethodne upotrebe.
Ako pri izboru brojeva doemo do krja tablica vraamo se na poetak.
Primjenom tablica sluajnih brojeva pruamo jednake izborne mogunosti
svim jedinicama osnovnog skupa da se nau u uzorku. Time stvaramo uslove
za reprezentativnost uzorka: ako sve jedinice imaju istu vjerovatnou izbora,
naosnovu teorije vjerovatnoe uzorak bi trebao sadravati najvei broj
jedinica sa osobinama koje su najee u osnovnom skupu i najmanji broj
onih jedinica kojih i u osnovnm skupu ima najmanje.
Pretpostavimo da je u naem primjeru starosna struktura 2500 zaposlenih
slijedea: 1250 radnika je staro do 30 godina, 1000 radnika je staro od 30 do
60 godina, dok je 250 radnima starijih od 60 godina.
Vjerovatnoa izbora jednog zaposlenog je 1/2500; tada je vjerovatnoa
izbora osobe mlae od 30 godina jednaka 1250/2500=0,50; vjerovatnoa
izbora osobe izmeu 30 i 60 godina je 1000/2500=0,40; dok je vjerovatnoa
izbora osobe stare od 30 do 60 godina 250/2500=0,10. Vidimo da su ansje
izbora najmalaih radnika pet puta vee od ansi izbora najstarijih radnika,
kao i da postoje etiri puta vee anse izbora srednjovjenih u odnosu na
najstarije radnika. Otuda je realno oekivati da e u uzorku biti najvie
najmlaih a najmanje najstarijih radnika, odnosno da e uzorak vijerno
udraavati strukturu osnovnog skupa.
179

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Kontrolisani sluajni uzorci


Pored izbora elemenata prostim sluajnim putem, podtoje brojni metodi
sluajnog izbora elemenata u uzorak kojima formiramo razliite sluajne
uzorke. Sluajan izbor elemenata u ovoj grupi metoda znai da svaka
jedinica ima poznatu, ali ne obavezno i jednaku vjerovatnou izbora u
uzorak, dok se osnovni skup posmatra kao skup jasno razgranienih
podskupova. Ovakvi uzorci esto se nazivaju kontrolisanim uzorcima; svaki
od njih ima neke prednosti u odnosu na prost sluajan uzorak. Ovdje emo se
upoznati sa stratifikovanim, uzorkom skupina, vieetapnim i sistematskim
uzorkom.
Stratifikovani uzorak: Ako je osnovni skup relativno homogen, onda prost
sluajan uzorak predstavlja dobru osnovu za donoenje preciznih ocjena o
parametrima skupa. Ali, ako je osnovni skup heterogen, tj. ako se njegovi
elementi meu sobom bitno razlikujupo posmatranom obiljeju, prost
sluajan uzorake rijetko biti reprezentativan, a zakljuci koje donosimo bie
neprecizni. Da bi poveali reprezentativnost sluajnog uzorka vrimo
stratifikaciju osnovnog skupa: skup se dijeli na potreban broj relativno
homogenih, jasno razgranienih podskupova, stratuma. Zatim iz svakog
stratuma biramo po jedan prost sluajan uzorak. Tako se formira
stratifikovan uzorak koji predstavlja uniju sluajnih uzoraka od kojih je svaki
izabran iz po jednog stratuma.
Kao kriterijum za diobu osnovnog skupa na stratume koristimo neku osobinu
elemenata skupa koja je u vrstoj vezi sa posmatranim obiljejem.
Pretpostavimo da nas interesuju izdaci stanovnika nekog grada za kupovinu
knjiga. Varijacije u kupovini knjiga uslovljene su u velikoj mjeri nivoom
obrazovanja pojedinaca, pa bi reprezentativan uzoraktrebao obuhvatiti
pojedince razliitog nivoa obrazovanja (osnovnog, srednjeg, vieg i
visokog).
Prost sluajan uzorak ne garantuje zastupljenost sve etiri kategorije
stanovnika. Reprezentrativnost uzorka se zato obezbjeuje diobom osnovnog
skupa na etiri stratuma (podskupa) prema nivou obrazovanja, a zatim
sluajnim izborom jedinica iz svakog stratuma.
Sve jedinice unutar pojedinih stratuma imaju istu vjerovatnou izbora u
uzorak. Budui da stratumi nisu iste veliine, jedinice skupa imaju meu
sobom razliite vjerovatnoe izbora i one su poznate unaprijed.
Svrha stratifikacije je dvostruka. Prije svega, ovim nainom izbora
elemenata u uzorak obezbjeujemo reprezentativnost stratifikovanog uzorka
na osnovu kojeg se donose preciznijji zakljuci o osnovnom skupuu odnosu
180

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

na prost sluajan uzorak. Pored toga, stratifikovani uzorak prua informacije


i o pojedinim dijelovima osnovnog skupa, to daje mogunost sprovoenja
zasebnih analiza za svaki stratum.
Uzorak skupina i vieetapni uzorak: Ako je osnovni skup veoma velik, ili
ako ne raspolaemo spiskom svih jedinica osnovnog skupa ili ne moemo da
ih identifikujemo, izbor uzorka ne moe se vriti po do sada objenjenim
postupcima. Uzorak koji moemo primjeniti u ovakvim sluajevima je
uzorak skupina. Umjesto pojedinanih elemenata osnovnog skupa, ovdje
biramo pojedine grupe elemenata, tzv. skupine. Skupine predstavljaju na
odreen nain ve formirane cjeline unutar osnovnog skupa, i po pravilu se
meu sobom razlikuju po veliini. Sluajnim izborom izvjesnog broja
skupina formira se uzorak skupina.
Uzorak kojim obuhvatamo sve jedinice izabranih skupina, tj. u svakoj
izabranoj skupini izvrimo popis, naziva se prostim uzorkom skupina.
Pretpostavimo da nas interesuje miljenje putnika o kvalitetu usluga jedne
avio kompanije. Umjesto sluajnog izbora pojedinih putnika sa svih letova u
toku jednog mjeseca, sluajnim putem emo izabrati, na primjer, 15 letova i
anketirati sve putnike na njima; uzorak dakle obuhvata 15 skupina. Da bi
ocjena neke karakteristike skupa na osnovu ovog uzorka bila precizna,
potrebno je da skupine po svojoj strukturi budu to slinije strukturi
osnnovnog skupa; ro je osnovna razlika izmeu skupina i stratuma.
Ako uzorkom ne obuhvatimo sve elemente u skupinama, ve sluajnim
putem biramo samo neke od njih, formiramo tzv. dvoetapni uzorak: u prvoj
etapi sluajnim putem biramo skupine, a u drugoj sluajnim putem biramo
samo neke jedinice unutar skupina. Ako nas interesuju izdaci domainstva za
higijenu na jednoj teritoriji, dvoetapni uzorak moemo izabrati tako to emo
najprije sluajnim putem izabrati mikroregije (npr. optine), a zatim, samo
neka domainstva u odabranim mikroregijama. Ako su jedinice izbora u
prvoj etapi prevelike, onda formiramo troetapni uzorak: u drugoj etapi,
unutar mikroregije biramo popisne krugove, a u treoj etapi unutar izabranih
popisnih krugova biramo domainstva. Prednost vieetapnog uzorka je to ne
moramo raspolagati sa spiskovima svih elemenata u osnovnom skupu.
Uzorak skupina koristimo kada elimo smanjiti trokove ocjenjivanja. Ovaj
uzorak obino je manje precizan od prostog sluajnog ili stratifikovanog
uzorka iste veliine.
Sistematski uzorak: Sistematski uzorak je sluajan uzorak kod kojeg izbor
elemenata vrimo po nekom sistematskom redu, polazei od sluajno
izabranog poetka. Da bi izabrali sistematski uzorak veliine n, iz konanog
osnovnog skupa veliine N, potrebno je formirati spisak svih jedinica sa
181

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

rednim brojevima. Zatim se odreuje interval k=N/n iz kojeg se po principu


sluajnosti bira prvi element uzorka. Ako sa d oznaimo redni broj prvog
elementa (1 d k), tada poevi od prvog elementa, svaki k-ti element
osnovnog skupa predstavlja element sistematskog uzorka; uzorak ine
elementi sa rednim brojevima d, d+k, d+2k, d+3k, ... d+(n-1)k. Prednost
ovog u odnosu na ranije obraene uzorke je jednostavnost, jer sluajnim
izborom prvog elementa odreujemo i ostale elemente uzorka. Budui da pvi
element uzorka biramo izmeu prvih k elemenata osnovnog skupa, moemo
izabrati ukupno k razliitih sistematskih uzoraka. Izbor sistematskog uzorka
moe se prikazati i kao izbor jedne od k moguih skupina, sa vjerovatnoom
1/k.
Pri izboru sistematskog uzorka vano je poznavati osobije osnovnog skupa.
Ako je redoslijed elemenata osnovnog skupa sluajan, sistematski uzorak
moemo posmatrati kao prost sluajan uzorak. Ali, ako redoslijed elemenata
u osnovnom skupu nije sluajan (ako su jedinice skupa ureene po veliini
obiljeja koje pratimo, ili ako osnovni skup karakteriu periodine
varijacije), tada ni jedan sistematski uzorak nee dati zadovoljavajue
rezultate. Ako u jednom stambenom bloku iztovjetnih zgrada izbor stanova u
uzorak vrimo sistematskim putem, moe se dogoditi da se u uzorku nau
istovjetni stanovi iz svake pojedinane zgrade (na istom spratu, istog
poloaja, kvadrature i sl.). Razultat uzorka e sadravati greku
neadekvatnog izbora. Ovaj problem nesluajnog redislijeda elemenata u
osnovnom skupu rjeavamo tako to iz osnovnog skup biramo vei broj
sistematskih uzoraka.
Pretpostavimo, na primjer, da iz osnovnog skupa veliine N=3000 biramo
sistematski uzorak od n=100 elemenata. Ako je redoslijed elemenata u
osnovnom skupu sluajan, tada biramo samo jedan sistematski uzorak. Prvi
element uzorka biramo sluajnim putem izmeu prvih k=3000/100=30
elemenata (naka je d=16), a zatim uknjuujemo svaki 30-ti element
osnovnog skupa u uzorak; tada uzorak ine elementi sa slijedeim rednim
brojevima:
16, 46, 76, ..., 1986. Ovako formiran sistematski uzorak moemo posmatrati
kao prost sluajan uzorak i da na isti nain ocjenjujemo nepoznate parametre
osnovnog skupa.
Ako redoslijed elemenata u osnovnom skupu nije sluajan, biramo vie
sistematskih uzoraka. Pretpostavimo da elimo izabrati 5 sistematskih
uzoraka. Budui da veliina uzorka ostaje nepromjenjena, n=100, svaki
sistematski uzorak treba da sadri po 20 elemenata. Iz osnovnog spupa
N=3000 moe se izabrati ukupno k=3000/20=150 sistematskih uzoraka od
po 20 elemenata. Primjenom tablice sluajnih brojeva izabraemo 5 brojeva
182

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

od 1 do 150; tako emo odrediti prve elemente, a sukcisivnim dodavanjem


konstante 150 na svaki od ovih brojeva formiraemo uzorke od po 20
elemenata.
Sluajne i nesluajne greke
Na alost, ne postoji niti jedan nain izbora elemenata u uzorak koji bi
garantovao potpunu reprezentativnost uzorka. Savrenu reprezentativnost
uzorak moe imati samo ako je jednak osnovnom skupu ili ako je osnovni
skup potpuno homogen, kada on i nije predmet statistike analize. Greke u
zakljuivanju koje nastaju zbog nereprezentativnosti uzorka najee
svrstavamo u dvije grupe. Prvu grupu ine tzv. sluajne greke ili greke
koje nastaju zbog sluajnog izbora elemenata u uzorak, a drugu ine tzv.
nesluajne (sistematske) greke koje su mnogo opasnije po zakljuivanje.
Sluajna greka definie se kao razlika izmeu stvarne vrijednosti
parametra osnovnog skupa i ocijenjene vrijednosti ovog parametra koju
izraunavamo na osnovu uzorka. Sluajna greka odraava rizik vezan za
primjenu metoda uzorka, a to je da izmeu strukture osnovnog skupa i
strukture uzorka postoji neizbjena razlika.
Uzorci iste veliine razlikuju se meu sobom i razliito su reprezentativni,pa
sluajna greka varira od jednog do drugog uzorka. Da se izrauna njena
vrijednost za konkretan uzorak, potrebno je da vrijednost posmatranog
parametra osnovnog skupa usporedimo sa njegovom ocijenjenom
vrijednostina osnovu datog uzorka. Vrijednost parametra osnovnog skupa,
meutim, ne znamo (jer u protivnom ne bi bilo potrebno uzimati uzorak), pa
ni vrijednost sluajne greke ne moemo precizno izraunati. Ipak, ako
izvlaimo sluajan uzorak, ovu vrijednost moemo ocijeniti. Osim toga,
veliina greke se moe kontrolisati: greka se smanjuje sa poveanjem
uzorka, jer vei uzorak obuhvata i vei dio snovnog skupa, pa je uzorak
reprezentativniji.
Nesluajne (sistematske) greke nastaju iz vie razloga i teko ih je
kontrolisati. Ozbiljna greka pri zakljuivanju javlja se zbog primjene loeg
"okvira" iz kojeg se bira uzorak. Naime, u praksi je esto nemogue sluajan
izbor elemenata sprovesti na cijeloj populaciji. Tada se iz praktinih razloga,
izbor uzorka vri iz tzv. okvira, tj. velikog podskupa osnovnog skupa. Okvir
omoguuje relativno lak izbor elemenata, a potrebno je da po svojoj strukturi
bude istovjetan ili da neznatno odstupa od osnovnog skupa.
Primjer loeg okvira: Netana prognoza rezultata politikih izbora u SAD
1948. godine je primjer loe izabranog okvira za izbor uzorka. Naime,
183

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

prognoza je predviala pobjedu republikanca Diveja (Dewey), a sa velikom


veinom pobivjedio je demokrata Truman (Truman). Iz telefonskih imenika
sluajnim putem birani su brojevi i glasai su kontaktirani telefonom.
Prognoza zasnovana na ovako formiranom uzorku bila je pogrena jer su
telefon imali samo imuniji graani koji su veinom podravali
republikance. Drugim rijeima, okvir iz kojeg je uzorak stvarno izabran, nije
po strukturi odgovarao osnovnom skupu.
Ova vrsta nesluajne greke javlja se i kod psiholokih eksperimenata koji se
sprovode po velikim univerzitetskim centrima. Uzorak se esto formira od
sluajno izabranih ili dobrovoljno prijavljenih studenata koji nisu tipina
grupa za stanovnitvo u cjelini, pa zakljuke takvih eksperimenata ne bi
trebalo uoptavati. Navedenu greku moemo izbjei ako paljivo odredimo
okvir iz kojeg biramo elemente, kako bi on po svojim karakteristikama
odgovarao osnovnom skupu. Ako se okvir poklapa sa osnovnim skupom,
ova greka se ne moe javiti.
Nesluajna greka moe se javiti i prilikom same realizacije sluajnog izbora
elemenata u uzorak. Kasnih 1960-tih godina u SAD su mladii regrutovani u
vojsku po datumu roenja. Tehnika je bila takva da se iz bubnja sa 366
etona (sa datumima od 01.01. do 31.12.) sluajnim putem biraju etoni.
Utvreno je da su zbog redoslijeda stavljanja etona u bubanj kao i brzine
centrifuge favorizovani datumi posljednjih mjeseci u odnosu na poetne
mjesece u godini.
Nesluajna greka moe se javiti i ako zakljuak donosimo na osnovu samo
jednog dijela uzorka, a ne na osnovu svih njegovih elemenata. Ova greka je
prije svega prisutna kod anketa koje se sprovode potom (putem pisma ili
telefonom). Ako proizva na osnovu pismene ankete eli da odredi
preferencije svojih kupaca i ako zakljuak donese samo na osnovu peispjelih
odgovora, a ne svih poslatih upitnika, on moe poiniti greku jer polazi od
esto pogrene pretpostavke da bi i lica koja nisu odgovorila na anketu dala
istovjetne odgovore. Ova greka naziva se pristrasnost zbog odsustva
odgovora.
Novi izvor greaka moe biti i primjena nepreciznog upitnika. Da bi se
otklonila greka nastala uslujed razliitog tumaenja istog pitanja, sastavljeni
upitnik, prije konane upotrebe, obino testiramo na kontrolnoj grupi.
Pored navedenih, u nesluajne greke spadaju i greke ankatara prilikom
upisivanja odgovora, tehnike greke prilikom obrade i slino. Budui da ih
ne moemo iskljuiti, osnovni cilj planiranja statistikog eksperimenta jeste
da se izbjegnu one nesluajne greke koje mogu biti pogubne po zakljuak.
184

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

4.2. Statistika uzorka


Razlukuju se dvije vrste numerikih pokazatelja distribucije frekvencija, tj
dvije vrste deskriptivnih mjera: deskriptivne mjere osnovnog skupa i
deskriptivne mjere uzorka.
Deskriptivna mjera koja se izraunava na osnovu svih jedinica osnovnog
skupa naziva se parametar skupa ili krae parametar. Aritmetika sredina
osnovnog skupa (m ili X ), standardna devijacija ( ili SD0) i proporcija (
ili P) predstavljaju tri parametra kkoja se najee koriste.
Jednom osnovnom skupu odgovara samo jedna vrijednost aritmetike
sredine, standardne devijacije ili odgovarajue proporcije, pa se moe
zakljuiti da su parametri osnovnog skupa konstante. Obiljeavaju se ili
grkim slovima m, s, p, ili sa velikim latininim slovima X , SD0, P0
respektivno, a mogu se teno izraunati samo putem popisa.
Deskriptivna mjera koja se izraunava na osnovu vrijednosti elemenata
uzorka i koja predstavlja numeriki pokazatelj uzorka naziva se statistika
uzorka ili krae statistika. Aritmetika sredina uzorka ( x ), standardna
devijacija uzorka (SDx ili sdx) i proporcija uzorka (px) tri su odgovarajue
statistike.
Kako se uzorci iste veliine meu sobom razlikuju, razlikovae se i
vrijednosti izte statistike uzorka od uzorka do uzorka; kae se da statistike
uzorka variraju sa fluktuacijama uzoraka.
Neka je (X1, X2, ..., Xi, ..., Xn) prost sluajan uzorak od n elemenata.
Elementi se oznaavaju sa velikim slovima jer svaki element uzorka
predstavlja jednu sluajnu varijablu. Na primjer, prije izvlaenja prvog
elementa u uzorak ne moemo sa sigurnou odrediti koji e element
osnovnog skupa biti izabran. Zbog toga zakljuujemo da prvi element uzorka
(X1) predstavlja sluajnu varijablu. Isto vai i za ostale elemente prostog
sluajnog uzorka.
Samim tim i aritmetika sredina uzorka, kao prosjek, tj. funkcija n sluajnih
varijabli:
n

X
i 1

(4.2.1)
n
sama je jedna sluajna varijabla. Dakle, za razliku od parametara osnovnog
skupa koji su konstante, statistike uzorka su sluajne varijable.
Pretpostavimo da smo izabrali jedan uzorak. Elementi izabranog uzorka
predstavljaju realizovane vrijednosti sluajnih varijabli Xi (i=1, 2, ..., n) u
185

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

datom eksperimentu; to su numerike vrijednosti xi koje kao konstante


oznaavamo malim slovima. Izabrani uzorak je (x1, x2, ..., xi, ..., xn), a
njegova aritmetika sredina je:
n

x
i 1

n
Kao prosjek n numerikih vrijednosti, aritmetika sredina izabranog uzorka
je konstanta. Dakle statistika uzorka X je sluajna varijabla, a njena
realizovana vrijednost u uzorku, x je konstanta.

Analogno vai i za standardnu devijaciju i proporciju pa su realizovane


vrijednosti ovih sluajnih varijabli konstante i oznaavaju se da sdx i px ili
krae sa sd i p.
Predmet naeg interesovanja su parametri osnovnog skupa, a ne statistike
uzorka. Ali, budui da se popis u praksi rijetko sprovodi, vrijednost
odreenog parametra ne moe se tano izraunati, ve se moe samo
ocijeniti.
Ocjenjivanje se vri na osnovu uzorka, preciznije, primjenom odgovarajue
statistike uzorka. Tako, nepoznatu vrijednost aritmetike sredine osnovnog
skupa () ocjenjujemo na osnovu realizovane vrijednosti aritmetike sredine
u izabranom uzorku ( x ), proporciju skupa () ocjenjujemo na osnovu
realizovane vrijednosti proporcije uzorka (p) i slino.
Vidjeli smo, meutim, da je nepoznati parametra osnovnog skupa konstanta,
dok je statistika uzorka sluajna varijabla. Zato je neophodno utvrditi odnos
izmeu vrijednosti parametara skupa i svih moguih vrijednosti
odgovarajue statistike uzorka.
Svaka statistika uzorka, budui da je sluajna varijabla, ima svoju
distribuciju vjerovatnoe koju nazivamo distribucijom statistike uzorka,
svoju oekivanu vrijednost i varijansu. Ovdje emo se upoznati sa
distribucijom vjerovatnoe aritmetike sredine uzorka ( X ) i distribucijom
proporcije uzorka (Px).
Distribucija aritmetikih sredina uzoraka
Rekli smo da razliiti uzorci veliine n koji potiu iz istog osnovnog skupa
imaju meusobno razliite vriejdnosti x . Sve ove vrijednosti formiraju jednu
distribuciju koju nazivamo distribucijom aritmetikih sredina uzoraka.
Takvu distribuciju moemo utvrditi empirijskim i matematikim putem.
Ovdje e se primjeniti empirijski postupak koji se sprovodi u tri koraka:
186

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1. U prvom koraku iz osnovnog skupa veliine N izvlae se svi razliiti


prosti sluajni uzorci veliine n;
2. U drugom koraku izraunava se vrijednost aritmetike sredine svakog
uzorka;
3. U treem koraku formira se se distribucija frekvencija aritmetikih sredina
svih uzoraka od n elemenata i na osnovu njega odreuje se distribucija
vjerovatnoe aritmetikih sredina uzoraka.
Prikaimo postupak na slijedeem primjeru. Pretpostavimo da osnovni skup
od pet elemenata ine radnici sa slijedeim brojem lanova poradice:
A
B
C
D
E
1
2
3
4
5
Sve vrijednosti obiljeja X - broj lanova porodice, imaju frekvenciju
jednaku 1. Drugim rijeima, u eksperimentu u kojem na sluajan nain
biramo element osnovnog skupa, sluajna varijabla X uzima jednu od
vrijednosti 1, 2, 3, 4, 5, sa jednakim vjerovatnoana P(xi) = 1/5, i=1, 2, 3, 4,
5. Dakle rije je o uniformnoj distribucijiiji je gragiki prakaz nat na slici
4.2.1.

Slika 4.2.1. Uniformna distribucija osnovnog skupa


Aritmetika sredina i varijanca osnovnog skupa su:
= (1+2+3+4+5)/5 = 3
2 = [(1-3)2 + (2-3)2 + (3-3)2 + (4-3)2 + (5-3)2]/5=2.
Iz datog osnovnog skupa izabraemo sve uzorke veliine n, izraunaemo
aritmetiku sredinu u svakom od njih, a zatim emo odrediti distribuciju koju
formiraju aritmetike sredine uzoraka. Osobine ove distribucije zavise, pored

187

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

ostalog, i od toga da li se uzorci biraju sa ponavljanjem ili bez ponavljanja,


pa emo ovdje razmotriti oba sluaja.
a) Distribucija aritmetikih sredina uzoraka sa ponavljanjem
Pretpostavimo da iz navedenog osnovnog skupa biramo proste sluajne
uzorke od dva elementa i da vrimo izbor elemenata sa ponavljanjem; njihov
ukupan broj je K=25. Uzorke emo dat i tabeli 4.2.1. kao ureene parove
brojeva tako da, na primjer, uzorak (C,D) dajemo parom brojeva (3,4) koji
odgovaraju broju lanova porodice radnika C i D.
Tabela 4.2.1. Uzorci sa ponavljanjem veliine n=2 iz osnovnog skupa
veliine N=5
Radnik

(1,1)

(1,2)

(1,3)

(1,4)

(1,5)

(2,1)

(2,2)

(2,3)

(2,4)

(2,5)

(3,1)

(3,2)

(3,3)

(3,4)

(3,5)

(4,1)

(4,2)

(4,3)

(4,4)

(4,5)

(5,1)

(5,1)

(5,3)

(5,4)

(5,5)

U drugom koraku izraunavamo vrijednost aritmetike sredine svakog od 25


izabranih uzoraka. Prije izbora uzorka aritmetika sredina uzorka je, kao
funkcija dvije sluajne varijable, i sama sluajna varijabla:
X X2
X 1
2
Po izvlaenju uzorka, vrijednost aritmetike sredine odreena je
realizovanim vrijednostima prvog i drugog elementa u uzorku, tj.
vrijednostima x1 i x2. Tako je, na primjer, u uzorku (C,D) realizovana
vrijednost aritmetike sredine jednaka
3 4
x
3,5
2
Vrijednosti aritmetikih sredina svih uzoraka date su u tabeli 4.2.2.
Tabela 4.2.2. Aritmetike sredine svih K uzoraka sa ponavljanjem
Radnik
A
B
C
D
E
A
1,0
1,5
2,0
2,5
3,0
B
1,5
2,0
2,5
3,0
3,5
C
2,0
2,5
3,0
3,5
4,0
D
2,5
3,0
3,5
4,0
4,5
E
3,0
3,5
4,0
4,5
5,0

188

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U treem koraku emo izraunate aritmetike sredine svih uzoraka prikazati


u obliku distribucije frekvencija (tabela 4.2.3.a, prve dvije kolone)
Tablea 4.2.3.a: Distribucija frekvencija aritmetikih sredina uzoraka
Aritmetika sredina
Broj uzoraka
uzorka

xf

x f

1,0

1,0

1,0

1,5

3,0

4,5

2,0

6,0

12,0

2,5

10,0

25,0

3,0

15,0

45,0

3,5

14,0

49,0

4,0

12,0

48,0

4,5

9,0

40,5

5,0

5,0

25,0

25

75,0

250,0

Tabela 4.2.3.b: Distribucija statistike uzorka X

P( X x)

1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0

0,04
0,08
0,12
0,16
0,20
0,16
0,12
0,08
0,04
1,00

Na osnovu ove distribucije vidi se da pet uzoraka ima aritmetiku sredinu


jednaku 3, dakle, jednaku aritmetikoj srediniosnovnog skupa. Broj uzoraka
sa manjom ili veom aritmetikom sredinom ravnomjerno se smanjuje ka
krajevima distribucije.
189

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Vidi se da najvei broj uzoraka ima aritmetiku sredinu jednaku ili


bliskuaritmetikoj srediniskupa, dok mali broj uzoraka ima aritmetiku
sredinu koja se znaajno razlikuje od .
Izraunajmo aritmetiku sredinu i varijansu ove distribucije. Aritmetiku
sredinu aritmetikih sredina oznaiemo sa x ili sa X . Izraunava se
primjenom izraza za ponderisanu aritmetiku sredinu, gdje ponder fi
predstavlja broj uzoraka sa aritmetikom sredinom x i :
k

* fi

75
3
K
25
Dakle, aritmetika sredina aritmetikih sredina svih uzoraka jednaka je
aritmetikoj sredini odnovnog skupa.

x X

i 1

Ovaj rezultat vai i u optem sluaju:


Aritmetika sredina svih uzoraka veliine n koji se mogu izabrati iz jednog
osnovnog skupa jednaka je aritmetikoj sredini tog skupa:
(4.2.2)
x
Varijabilitet aritmetikih sredina uzoraka mjerimo varijansom x2 koja
predstavlja prosjeno kvadratno odstupanje aritmetikih sredina svih K
uzoraka veliine n od njihove zajednike aritmetike sredine x . Kako je

x , varijansa je i mjera u kojoj aritmetike sredine uzoraka odstupaju


od atirmetike sredine osnovnog skupa. U sluaju grupisanih podataka, kao u
naem primjeru x2 je:
k

x2

f
i 1

* (xi )2
K

* xi

250
32 1
25

Varijansa aritmetikih sredina uzoraka manja je od varijanse osnovnog


skupa, tj. x2 2 (u naem primjeru (1<2), to se moglo i oekivati.
Poznato je da aritmerika sredina izravnava apsolutne razlike izmeu
originalnih podataka, pa esktremne vrijednosti u pojedinim uzorcima imaju
relativno mali uticaj na vrijednosti aritmetikih sredina tih uzoraka. Zato su
razlike izmeu aritmetikih sredina uzoraka po pravilu mnogo manje od
razlika izmeu samih originalnih podataka, tj. varijabilitet u skupu
aritmetikih sredina uzoraka je manji od varijabiliteta u osnovnom skupu.
Ako vrijednost varijanse osnovnoh skupa podijelimo sa veliinom uzorka,
dobije se vrijednost varijanse aritmetikih sredina uzoraka, tj.
190

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

2
1 x2 . Ovaj odnos vai i u potem sluaju, odnosno: Varijansa
n
2
aritmetikih uzoraka sa ponavljanjem jednaka je koliniku varijanse
osnovnog skupa i veliine uzorka.

x2

(4.2.3)
n
Standardna devijacija aritmetikih sredina uzoraka je pozitivan kvadratni
korjen iz varijanse:
k

f
i 1

* (xi x )2
K

f
i 1

* (xi )2
K

Nazivamo je standardnom grekom ocjene aritmetike sredine osnovnog


skupa (ili samo standardnom grekom) i to iz slikedeeg razloga. Rekli smo
da najee ne raspolaemo sa podacima o cijelom osnovnom skupu,zbog
ega nepoznatu vrijednost aritmetike sredine ocjenjujemo na osnovu
realizovane vrijednosti u uzorku ( x ). Kako standardna devijacija ( x )
predstavlja mjeru odstupanja od , ona pokazuje koliku greku u prosjeku
inimo prilikom ovog ocjenjivanja. Otuda i naziv standardna greka.
Izmeu standardne greke i standardne devijacije osnovnog skupa, na
osnovu 4.2.3.), vai slijedea realcija:
Standardna greka ocjene aritmetike sredine osnovnog skupa

SE x

n
gdje je SE - standard error (engl. standardna greka)

(4.2.4)

Vratimo se distribuciji frekvancija u tabeli 4.3.a. Ova distribucija je


formirana od svih aritmetikih sredina uzoraka od n elemenata izabranih iz
osnovnog skupa veliine N. Otuda, na osnovu nje, moe se odrediti
distribucija vjerovztnoe aritmetikih sredina uzoraka prikazanih u tabeli
3.3.2.3.a. Vjerovatnoa da e aritmetika sredina uzorka X u datom
eksperimentu biti jednaka x i iznosi P( X x i f i . Na primjer, vjerovatnoa
K

da emo izabrati prost sluajan uzorak sa aritmetikom sredinom 3, jednaka


je P( X 3) 5 0,20 . Drugim rijeima, od svih prostih sluajnih uzoraka
25

sa ponavljanjem veliine n=2 koje moemo izabrati iz posmatranog skupa,


20% svih uzoraka ima aritmetiku sredinu 3, dakle, jednaku aritmetikoj
sredini osnovnog skupa. Vjerovatnoe javljanja ostalih vrijednosti x
191

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

simetrino se smanjuju u oba smjera i date su u tabeli 4.23.b. koja


predstavlja distribuciju vjerovatnoe aritmetikih sredina uzoraka. Ova
distribucija naziva se krae distribucija statistike X .
Primjenom distribucije statistike X mogu se donositi probabilistiki
zakljuci o vrijednostima aritmetikih sredina uzaraka sa ponavljanjem.
Takoe, moe se izraunati oekivana vrijednost i varijansa statistike X i
potvrditi jednakosti 4.22. i 4.2.3.:
E ( X ) x i * P( X x )

Var X [ x i E ( X )]2 * P( X x i )

n
Na slici 4.2.2. prikazana je distribucija statistike X . Ako je usporedimo sa
distribucijom osnovnog skupa (slika 4.2.1.) vidi se da su ove distribucije
meu sobom veoma razliite. Dok je distribicja osnovnog skupa uniformna,
oblik distribucije aritmetikih sredina uzoraka je simetrian i unimodalan.
Oblik distribucije aritmetikih sredina nije jedinstven ve zavisi od oblika
distribucije osnovnog skupa iz kojeg su uzorci izabrani i od veliine uzarka.
Sa porastom veliine uzorka, distribucija postaje vie zvonasta, i za dovoljno
veliko n pribliava se normalnoj distribuciji.

Slika 4.2.2.: Distribucija aritmetikih sredina uzoraka


Distribucija osnovnog skupa i distribucija aritmetikih sredina uzoraka
a) Osnovni skup ima normalnu distribuciju
Izaberimo iz osnovnog skupa koji ima normalnu distribuciju sve sluajne
uzorke veliine n i izraunajmo njihove aritmetike sredine. Tada vae
slijedea pravila:
192

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1. Distribucija aritmetikih sredina uzoraka je normalna, nezavisno od


veliine uzorka (n). (Budui da normalnu distribuciju odreuju dva
parametra, aritmetika sredina i varijansa, potrebno je utvrditi njihove
vrijednosti.)
2. Aritmetika sredina distribucije aritmetikih sredina jednaka je
aritmetikoj distribuciji osnovnog skupa, x .
3. Varijansa distribucije aritmetikih sredina jednaka je koliniku varijanse
osnovnog skupa i veliine uzorka, odnosno x2

.
n
Navedena pravila mogu se objediniti na slijedei nain:
Ako je X : N ( , 2 ) , onda je X : N ( ,

2
n

(4.2.5)

Na slici 3.3.2.3. prikazana je distribucija aritmetikih sredina uzoraka koji su


izabrani iz osnovnog skupa sa normalnom distribucijom. Ova distribucija je
normalna nezavisno od veliine uzorka. Posebno je istaknuto 3s pravilo, tj.
da 68% uzoraka ima aritmetiku sredinu kokja se od aritmetike sredine
osnovnog skupa razlikuje za menje od jedne standardne greke, dok ak 99%
uzoraka ima aritmetiku sredinu koja se od aritmetike sredine osnovnog
skupa razlikuje za najvie 2,58 standardnih greki.

68%

P( X X X ) 0,68
P( 1,96 * X X 1,96 * X ) 0,95
P( 2,58 * X X 2,58 * X ) 0,99

95%
99%
X

2,58 X
1,96 X

X
X

2,58 X
1,96 X

Slika 4.2.3 Distribucija aritmetikih sredina uzoraka


b) Centralna granina teorema
U mnogim sluajevima distribuciju osnovnog skupa ne znamo ili ona
znaajno odstupa od normalne distribucije. Ipak, i tada, koristei rezultate
Centralne granine teoreme, moemo odrediti oblik distribucije aritmetikih
sredina uzoraka.
193

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Po ovoj teoremi, nezavisno od oblika distribucije osnovnog skupa,


distribucija aritmetikih sredina uzoraka bie priblino normalna, ako su
uzorci koje izvlaimo veliki.
Preciznije reeno, ako osnovni skup ima distribuciju proizvoljnog oblika, sa
aritmetikom sredinom i varijansom 2, tada e distribucija aritmetikih
sredina svih prostih sluajnih uzoraka veliine n teiti normalnoj distribuciji,
sa aritmetikom sredinom i varijansom 2/n, kad n tei beskonanosti.
Ukratko:
Ako je X : W(, 2), tada je, za n , priblino X : N ( ,
gdje W predstavlja distribuciju proizvoljnog oblika.

),
n
(4.2.6)

(Prilog "priblino" odnosi se samo na oblik distribucije, dok su aritmetika


sredina i varijansa precizno odreene.)
Postavlja se praktino pitanje koliki uzorak treba biti da se Centralna
granina teorema moe koristiti. Potrebna veliina uzorka zavisi od oblika
distribucije osnovnog skupa.
to distribucija osnovnog skupa vie odstupa od normalne, potreban je vei
uzorak, i odbatno. Pravilo je da se pod velikim uzorkom smatra uzorak od 30
i vie elemenata; otuda, kadgod je n 30 smatraemo da vai Centralna
granina teorema. Uzorak manji od 30 elemenata naziva se malim uzorkom.
Na slici 4.2.4. mogu se pratiti promjenu oblika distribucije aritmetikih
sredina uzoraka koja nastaje sa poveanjem veliine uzarka. Iz etiri
osnovna skupa sa razliitim distribucijama izvlaili smo uzorke (sa
ponavljanjem) razliitih veliina.
Kada su uzorci mali (n=2), distribucije njihovih aritmetikih sredina se meu
sobom zmaajno razlikuju. Sa porastom n, ove razlike se smanjuju i ve za
n=10 sve etitri distribucije aritmrtikih sredina uzoraka pokazuju tendenciju
ka normalnoj distribuciji.
Budui da su uzorci sa ponavljanjem iz konanog skupa ekvivalentni sa
uzorcima izabranim iz beskonanog skupa, dobijeni rezultati vae i za ove
uzorke. Zbog toga se distribucija aritmetikih sredina uzoraka sa
ponavljanjem iz konanog skupa esto naziva distribucijom aritmetikih
sredina uzoraka iz beskonanog skupa.

194

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

f(x)

f(x)

P(x)

f(x)

0,40
0,20

Normalna

Uniformna

Asimetri~na
(eksponencijalna)

Bimodalna

Distribucija osnovnog skupa


f (X )

f (X )

P( X )

f (X )

0,36
0,16

1,0 1,5 2,0 2,5 3,0

Distribucija aritmeti~kih sredina uzoraka (n=2)

f (X )

f (X )

P( X )

f (X )

1,0

2,0

3,0

Distribucija aritmeti~kih sredina uzoraka (n=5)

f (X )

f (X )

P( X )

f (X )

1,0

2,0

3,0

Distribucija aritmeti~kih sredina uzoraka (n=10)

Slika 4.2.4. Promjene oblika distribucije aritmetikih sredina uzoraka sa


porastom veliine uzorka
v) Distribucija aritmetikih sredina uzoraka bez ponavljanja
Ostalo je da se upoznamo sa distribucijom aritmretikih uzoraka izabranih
bez ponavljanja iz konanog osnovnog skupa. Ve je reeno da se ovi uzorci
ee koriste zbog svoje efikasnosti, posebno ako je osnovni skup veoma
veliki.
Ako iz ve posmatranog skupa od pet elemenata biramo uzorke veliine n=2,
pri emu je redoslijed izbora elemenata nevaan, ukupan broj uzoraka koje
moemo izabrati je K=10. To su slijedei uzorci:
(A, B)
(A, C)
(A, D)
(A, E)
(B, C)
(B, D)
(B, E)
(C, D)
(C, E)
(D, E)
195

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ponavljanjem naprjed objanjenog postupka odredi se distribucija


frekvencija aritmetikih srednina uzoraka bez ponavljanja. Distribucija je
prikazana u tabeli 4.2.4.a., a distribucija vjerovatnoe statistike X u tabeli
4.2.4.b
Tabela 4.2.4.a: Distribucija frekvencija atirmetikih sredina uzoraka
Aritmetika sredina
Broj uzoraka
uzorka

1,5
2,0
2,5
3,0
3,5
4,0
4,5

1
1
2
2
2
1
1
10

xf

x f

1,5
2,0
5,0
6,0
7,0
4,0
4,5
30,0

2,3
4,0
12,5
18,0
24,5
16,0
20,3
97,5

Tabela 4.2.4.b: Distribucija vjerovatnoe statistike X

P( X x)

1,5

0,10

2,0

0,10

2,5

0,20

3,0

0,20

3,5

0,20

4,0

0,10

4,5

0,10

1,00

Na slici 4.2.5. data je distribucija vjerovatnoe statistike X

196

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Slika 4.2.5. Distribucija vjerovatnoe statistike X


Aritmetika sredina i varijansa za ovu distribuciju iznose:
97,5 2
30
x2
3 0,75
x
3 i
10
10
Usporedimo distribucije aritmetikih sredina uzoraka
ponavljanjem i bez ponavljanja (tabele 43.2.3a i 4.2.4.a).

izabranih

sa

Vidi se da su aritmetike sredine ove dvije distribucije jednake, tako da i u


ovom sluaju (bez ponavljanja) vai relacija 4.2.2. , tj. x . Varijanse
distribucijja se, meutim, razlikuju (0,75<1). Varijansa aritmetikih sredina
ovih uzoraka manja je od varijanse aritmetikih sredina uzoraka sa
ponavljanjem, to, takoe, predstavlja pravilnost. Dakle, aritmetike sredine
uzoraka bez ponavljanja u prosjeku odstupaju manje od aritmetike sredine
osnovnog skupa, nego to to ine aritmetike sredine uzoraka sa
ponavljanjem.
Manji varijabilitet javlja se zbog toga to jednom izabrani elementi sa
ekstremnim vrijednostima ne mogu biti izabrani vie puta (kao kod uzoraka
sa ponavljanjem), pa je njihov uticaj na varijabilitet aritmetikih sredina
ovdje znaajno smanjen. Ako usporedimo vrijednosti aritmetikih sredina u
tabelama 4.2.3.a i 4.2.4.a vidi se da kod uzoraka sa ponavljanjem one
variraju u intervalu od 1 do 5, dok je kod uzoraka bez ponavljanja ovaj
interval ui i iznosi od 1,5 do 4,5. Samim tim ne vai relacija 4.2.3. izmeu
varijansi x2 i 2: naime, x2

, tj. 0,75<2/2. Da bi se dobila jednakost,


n
kolinik 2/n treba smanjiti uvoenjem tzv. popravnog faktora za konane
skupove, (pfks):
197

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Popravni faktor za konane skupove je:


N n
N 1

(4.2.7)

Tako se dobije:
(2/2)*(5-2)/(5-1)=1*3/4=0,75
Dakle, u sluaju izbora uzoraka bez ponavljanja vai slijedei izraz:
2 N n
2
(4.2.8)
x
*
n N 1
Vrijednost pfks zavisi od odnosa veliine osnovnog skupa i veliine uzorka.
Sa porastom veliine uzorka, vrijednost popravnog faktora se smanjuje i za
n=N iznednaava se sa nulom. U tom sluaju je i x2 0 jer se osnovni skup
i uzorak poklapaju pa je razlika izmeu x i jednaka 0. S druge strane, ako
je osnovni skup relativno veliki u odnosu uzorak, pfks je priblino jednak 1.
Zbog toga, ako varijansu x2 izraunavamo primjenom izraza (4.2.8), pfks
po pravilu ne koristimo ako uzorak sadri manje od 5% elemenata osnovnog
skupa, tj, ako je tzv. stopa izbora n/N < 0,05.
Napomenimo da Centralna granina teorema ne vai za uzorke iz konanih
osnovnih skupova. Ipak, za praktine potrebe, distribuciju aritmetikih
sredina uzoraka moemo grubo aproksimirati normalnom distribucijom.
Uslov za primjenu Centralne granine teoreme je da iz velikih osnovnih
skupova biramo velike uzorke, pri emu obim uzorka treba biti manji od
N/2.
Primjer.
Posmatra se osnovni skup od 10000 studenata, ija je prosjena starost 22,3
godine i varijansa 1,44 godine2. Ako iz osnovnog skupa biramo prost
sluajan uzorak od 30 studenata, postavlja se pitanje koliko e iznositi
prosjena starost u izabranom uzorku.
Prije izbora uzorka ne moe se tano odrediti vrijednost njegove aritmetike
sredine x , ali se moe donijeti probabilistiki zakljuak. Za to nam je
potrebna distribucija vjerovatnoe aritmetikih sredina uzoraka. Budui da
izvlaima veliki uzorak (n=30), na osnovu Centralne granine teoreme
zakljuujemo da distribucija aritmetikih sredina uzoraka tei normalnoj, tj.
X : N ( x , x2 ) . U naem primjeru dobijamo

x 22,3 i x2

2
n

1,44
0,048 .
30
198

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Dakle, distribucija aritmetikih sredina uzoraka od 30 elemenata, izabranih


iz datog osnovnog skupa, je X : N (22,3;0,048) . Na osnovu ove distribucije
moemo izraunati vjerovatnou da e prosjena starost u uzorku biti manja
od neke unaprijed izabrane vrijednosti, da e biti vea od nje, ili da e uzeti
jednu od vrijednosti in unaprijed izabranog intervala.
Izraunajmo, na primjer, vjerovatnou da e prosjena starost u uzorku biti:
a) vea od 22 godine, i
b) da e se nai u intervalu od 21,8 do 22,5 godina.
Da bi u izraunavanju traenih vjerovatnoa mogli koristiti tablice
standardizovane normalne distribucije, potrebno je izvriti transformaciju
normalno distribuirane sluajne varijable X u standardizovanu varijablu Z,
Z: N(0, 1).
Ovdje je X sluajna varijabla, njena aritmetika sredina je x , a
standardna devijacija je x , pa na osnovu formule za Z vrijednost, tj.
X dobijemo:
Z

X x

(4.2.9)

a) Vjerovatnou P( X 22) izraunavamo primjenom slijedee relacije:


P( X 22) P(Z z) 1 P(Z z) 1 F ( z) , pri emu je

x x

22 22,3
0,3

1,37 , pa slijedi da je
1,2
0,219

n
30
P( X 22) 1 F (1,37) 1 0,0853 0,9147 . Dakle, vjerovatnoa da
emo izabrati uzorak ija je aritmetika sredina vea od 22 jednaka je
0,9147. Drugim rijeima, od svih uzoraka veliine n=30 koje moemo
izabrati iz datog osnovnog skupa, njih 91,47% ima aritmetiku sredinu veu
od 22.

199

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

-2,283

21,8

x 22,3

22,5

0,913

Slika 4.2.6. Distribucija aritmetikih sredina uzoraka n=30 iz osnovnog


skupa sa =22,3 i 2=1,44 i njena transformacija u standardnu normalnu
distribuciju
b) Vjerovatnoa da e se prosjena starost u uzorku nai u intervalu od 21,8
do 22,5 godina je:
P(21,8 X 22,5) P( z1 Z z 2 ) F ( z 2 ) F ( z1 ) ,
gdje su vrijednosti z1 i z2 jednake:
21,8 22,3
22,5 22,3
i
z1
z2
2,283
0,913 .
0,219
0,219
Slijedi da je:
P(21,8 X 22,5) P(2,283 Z 0,913) F (0,913) F (2,283)
0,8159 0,0113 0,8046
Dakle, ukupno 80,46% ovih uzoraka ima aritmetiku sredinu u intervalu od
21,8 do 22,5 godina (slika 4.2.6)
Na osnovu distribucije vjerovatnoe sluajne varijable X moemo odrediti i
interval u kojem e se, sa unaprijedodabranom vjerovatnoom, nai
aritmetika sredina sluajno izabranog uzorka.

200

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Odredimo, primjera radi, ove granice za vjerovatnou od 0,95, Na osnovu


ranije izvedenih izraza
P( z Z z) F ( z) [1 F ( z)] 2F ( z) i
P( x1 X x2 ) P( z1 Z z 2 )
moe se napisati da je:
P( x1 X x 2 ) P( z1 Z z 2 ) P( z Z z) 2F ( z) 1 0,95
Za F(z)=1,95/2=0,975 u tablici se nalazi vrijednost z=1,96. Kako je
x2
x1
i
z
z

slijedi da je:
x 2 z * x
x1 z * x
i
Zamjenom odgovarajuih vrijednosti izraunavamo granice intervala:
x1 22,3 1,96 * 0,219 21,871 i x 2 22,3 1,96 * 0,219 22,729
Tako dobijamo sljedei rezultat:
P(21,871 X 22,729) 0,95
Sa vjerovatnoom od 0,95 atirmetika sredina sluajno izabranog uzorka
nai e se u intervalu od 21,871 do 22,729. Ukupno 95% izabranih uzoraka
ima vrijednost aritmetike sredine koja se nalazi u ovom intervalu.

g) Distribucija proporcija uzorka


Osim aritmetike sredine, drugi vaan pokazatelj osnovnog skupa je
proporcija elemenata sa osgovarajuom osobinom (), koja se jo naziva
uee ili relativna frekvencija. Da se izrauna vrijedsnost p, potrebno je sve
jedinice skupa razvrstati po dihotomnoj klasifikaciji: elementi koji imaju
traenu osobinu klasifikuju se kao "uspjeh", a svi ostali kao "neuspjeh". Ako
je N1 ukupan broj "uspjeha" u skupu od N elemenata, onda je proporcija
"uspjeha" (ili krae proporcija skupa) jednaka:
N
(4.2.10)
1
N
Proporcija uzima vrijednosti od 0 do 1 (tj. od 0 do 100%) i moe se
interpretirati kao vjerovatnoa javljanja "uspjeha" pri sluajnom izboru jedne
jedinice iz osnovnog skupa.
Na primjer, ako u skupu od 10000 studenata ima 400 brucoa, proporcija
brucoa je p = 400/10000 = 0,04. Otuda vjerovatnoa da se pri sluajnom
izboru jednog studenta izabere bruco iznosi 0,04.

201

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Zakljuke o nepoznatoj proporciji skupa donosimo na osnovu proporcije


"uspjeha" u uzorku. Proporcija "uspjeha" u uzorku veliine n (ili, krae
proporcija uzorka) izraunava se kao kolinih broja "uspjeha" u uzorku , X, i
veliine uzorka:
X
(4.2.11)
Pr P
n
Broj "uspjeha" u n nezavisno izabranih elemenata moe biti 0, 1, 2, ..., n, pa
e i proporcija uzorka varirati u intervalu od 0 do 1. Prije izbora uzorka ne
moe se predvidjeti tana vrijednost proporcije pa se zakljuuje da je
proporcija uzorka sluajna varijabla.
Kada se uzorak izabere u njemu se javlja tano jadan broj "uspjeha" (x).
Ovaj broj ustvari predstavlja frekvenciju "uspjeha" u uzorku, pa ga esto
obiljeavamo sa f. Realizovana vrijednost proporcije uzorka je:
f
p
n
Distribucija proporcije Pr moe se odrediti primjenom istog postupka kao
koji je koriten kod odreivanja distribucije statistike X . Iz osnovnog skupa
veliine N izaberu se svi mogui uzorci od n elemenata i u svakom uzorku
izrauna se proporcija pi, i = 1, 2, ..., K. Ove vrijednosti formiraju
distribuciju frekvencija proporcija uzoraka, na osnovu kojeg bi se izraunala
distribucija vjerovatnoe statistike Pr.
Slino aritmetikoj sredini i ovdje su mogua dva postupka odreivanja
distribucije proporcija: empirijski i matematiki. Kako je empirijski izraz
koriten kod odreivanja distribucije aritmetikih sredina, za odreivanje
distribucije proporcija koristie se matematiki postupak.
U eksperimentu pronalaenja broja "uspjeha" u n nezavisnih opita, pokazalo
se da je broj "uspjeha" X binomna sluajna varijabla sa parametrima n i p.
Na osnovu 4.2.11. vidi se da statistika Pr predstavlja linearnu transformaciju
sluajne varijable X (njen prosjek), pa se zakljuuje da se i proporcija (u
uzorcima sa ponavljanjem) ima binomnu distribuciju.
Odredimo sada oekivanu vrijednost i varijansu ove distribucije. Uz
aritmetiku sredinu i varijansu binomne sluajne varijable X: E(X)=n*p i
Var(X)=n*p*(1-p) dobije se:
1
1
1
E ( Pr ) E[( * X ] * E ( X ) ( ) * n , i
n
n
n
202

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1
1
(1 )
.
Var ( Pr ) P2r ( ) 2 * Var ( X ) ( 2 ) * n (1 )
n
n
n

Dakle, proporcije prostih sluajnih uzoraka sa ponavljanjem veliine n


formiraju binomnu distribuciju, ija je aritmetika sredina (aritmetika
sredina proporcija uzoraka) jednaka proporciji osnovnog skupa:
Pr E ( Pr )
a varijansa iznosi:
(1 )
P2r
n
Radi jednostavnosti ove parametre oznaavamo sa P i P2. Kvadratni
korjen iz varijanse je standardna devijacija proporcija uzoraka. Ona
predstavlja mjeru odstupanja proporcija uzoraka od njihove aritmetike
sredine, tj. od proporcije osnovnog skupa. Nazivamo je standardnom
grekom ocjene proporcije osnovnog skupa ili krae standardnom grekom
proporcije.
Poto na osnovu proporcije uzorka ocjenjujemo nepoznatu proporciju
osnovnog skupa, standardna greka pokazuje koliku greku u prosjeku
inimo prilikom ocjenjivanja.
(1 )
P
(4.2.12)
n
Kada se biraju uzorci bez ponavljanja, proporcije uzoraka formiraju
hipergeometrijsku distribuciju sa aritmetikom sredinom:
P
i varijansom:
(1 ) N n
.
P2
*
n
N 1
Izraunavanje vjerovatnoa primjenom navedenih distribucija postaje
glomazno kada je uzorak veliki. Tada se moe primjeniti Centralna granina
teorema: Sa porastom veliine uzorka, distribucija proporcija uzoraka tei
normalnoj distribuciji, tj. Pr : N ( P , P2 ) . Aritmetika sredina jednaka je
proporciji osnovnog skupa P , a varijansa iznosi P2 (1 ) , tj.:
n

Pr: priblino N ( ; (1 ) )

(4.2.13)

203

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

n
0,05 ), za izraunavanje se koristi
N
popravni faktor konanog skupa (pfks).

Pri izboru iz konanog skupa (ako je

Dakle, slino aritmetikim sredinama uzoraka koje se "grupiu" oko


aritmetike sredine osnovnog skupa, i proprocije uzoraka pokazuju
tendenciju "grupisanja" oko proporcije osnovnog skupa, kada n raste.
Za dovoljno viliko n, oblik distribucije proporcije uzoraka pribliava se
normalnoj distribuciji. Grafiki prakaz ove distribucije dat je na slici 4.2.7,
gdje je istaknuto 3 pravilo.
P( P Pr P ) 0,68

P( 1,96 * P Pr 1,96 * P ) 0,95


68%

P( 2,58 * P Pr 2,58 * P ) 0,99

95%
99%

2,58P
P
P
2,58P
1,96P
P
1,96P

Slika 4.2.7. Distribucija proporcija velikih uzoraka


Postavlja se pitanje koliko veliki treba biti uzorak da bi bilo opravdano
aproksimirati ga normalnom distribucijom. U praksi se koristi uslov dat
slijedeim nejednakostima:
n*p>5 i n*(1-p)>5.
Ako je p=0,5, navedeni uslov bie ispunjen ve za uzorke veliine n 10 ; za
ekstremne vrijednosti p (bliske 0 ili 1) potrebni su veoma veliki uzorci da bi
primjena normalne distribucije bila opravdana. Mi emo razmatrati samo
sluajeve kad su ovi uslovi ispunjeni i u daljem izlaganju koristiemo
iskljuivo normalnu aproksimaciju distribucije Pr.
Primjer
Neka je dat osnovni skup od 10000 studenata u kojem se nalazi 30000
studentica. Ako iz skupa izvlaimo prost sluajan uzorak veliine n=50,
izraunajmo vjerovatnou da e uee studentica u uzorku iznositi najvie
0,27, tj 27%.
204

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Proporcija studentica u osnovnom skupu je =3000/10000=0,30 (ili 30%).


Budui da je n*=50*0,30=15 > 5 i da je n*(1-)=50*0,70=35 > 5,
zadovoljen je uslov za primjenu normalne distribucije, tj. Pr je priblino :
N(0,30; 0,0042).
Da bi izraunali traene vjerovatnoe P(Pr 0,27) pomou tablica
standardizovane normalne distribucije, potrebno je izvriti transformaciju
varijable Pr u standardizovanu normalno distribuiranu varijablu Z koristei
modifikovani izraz za Z varijablu:
P P
Pr
(4.2.14)
Z r

P
(1 )
n

Traena vjerovatnoa je:


P( Pr 0,27) P( Pr 0,27) P(Z z) F ( z) ,
p
0,27 0,30
0,30
gdje je z

0,463 0,46 ; pa je
(1 )
0,30 * 0,70 0,0648
n
50
P(Pr < 0,27) = F(-0,46)=0,3228. Vjerovatnoa da e proporcija studentica u
sluajno izabranom uzorku biti manja ili najvie jadnaka 0,27 iznosi 0,3228.
Drugim rijeima, od svih uzoraka veliine n=50, u 32,28% uzoraka
proporcija studentica iznosi najvie 0,27 (ilustracija je data na slici 4.2.8).
0,3228

0,27

=0

0,3228

-0,46

Slika 4.2.8. Distribucija proporcija uzoraka n=50 iz osnovnog skupa sa


p=0,30 i njena transtormacija u standardizovanu normalnu distribuciju.

205

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjenom normalne distribucije vjerovatnoe statistike Pr moe se


izraunati i interval u kojem e se sa unaprijed izabranom vjerovatnoom
nai proporcija sluajno izabranog uzorka.
Odredimo, u naem primjeru, ovaj interval sa vjerovatnoom od 0,99.
Granice intervala p1 i p2 izraunamo primjenom izraza za standardizovanu
normalnu distribuciju, tj
P(-z<Z<z)=F(z)-[1-F(z)]=2F(z)-1 i
P(x1<X<x2)=P(z1<Z<z2), pa je:

P( p1 Pr p2 ) P( z Z z) 2F ( z) 1 0,99 .
Iz tablica je z=2,575 2,58, i kako su:
p
p
z 1
i z 2

granice intervala iznose


p1 = p - z * P = 0,1328, i
p2 = p + z * P = 0,1328.
Konano je

P(0,1328 Pr 0,4672) 0,99


Dakle, sa vjerovatnoom od 0,99 proporcija studentica u sluajno izabranom
uzorku kree se u intervalu od 0,1328 do 0,4672. Drugim rijeima, u 99%
uzoraka (n=50) koji potiu iz datog osnovnog skupa, vrijednost proporcije
studentica nalazi se u intervalu od 13,28% do 46,72%.
Po analogiji sa utvrenim odnosima kod aritmetike sredine mogli bi ispitati
i odnos izmeu varijanse osnovnog skupa (2) i varijance uzorka proporcija
(SD2). Vrijednost varijanse uzorka varira od uzorka do uzorka i ne moe se
unaprijed precizno odrediti. Zbog toga se SD2 predstavlja kao sluajna
varijabla, koja ima svoju distribuciju, oekivanje i varijansu.
Oblik ove distribucije zavisi od dva parametra: varijanse osnovnog skupa i
veliine uzorka. Za male vrijednosti n, distribucija je izrazito asimetrina
udesno, ali sa poveanjem broja uzorka ona postaje vie simetrina.
U ovom poglavlju poli smo od pretpostavke da znamo parametre osnovnog
skupa, na osnovu kojih smo odredili distribuciju vjerovatnoa odgovarajuih
statistika uzorka. Zatim smo, na ovim distribucijama zasnivali
probabilistike zakljuke o vrijednostima pojedinih statistika uzorka.
206

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U praksi je upravo obrnuto. Vrijednost parametara osnovnog skupa ne


znamo, ve najee razpolaemo informacijama iz jednog uzorka, pa se
zakljuivanje odvija u suprtnom smjeru, od uzorka ka osnovnom skupu.
Metodi na kojima se na osnovu realizovane vrijednosti statistike uzorka
donosi zakljuak o nepoznatoj vrijednosti parametra osnovnog skupa
razmatrae se u narednim izlaganjima.
Primjeri:
Primjer 1:
Radi ocjene prosjene vrijednosti hemoglobina (Hb) kod aneminih osoba
izabrati uzorak od 10 osoba iz osnovnog skupa od 50 osoba pomou prostog
sluajnog i sistematskog uzorka.
Vrijednosti Hb mmol/l, u osnovnom skupu su:
5,1 5,5 5,2 5,6 5,5 5,3 5,4 5,4 5,4 5,4
5,4 5,2 5,5 5,5 5,4 5,7 5,3 5,4 5,4 5,4
5,5 5,3 5,3 5,4 5,3 5,5 5,4 5,6 5,3 5,2
5,4 5,4 5,4 5,4 5,5 5,3 5,6 5,3 5,4 5,5
5,5 5,6 5,2 5,3 5,3 5,4 5,5 5,7 5,4 5,4
Na osnovu izabranih uzoraka, prostog sluajnog i sistematskog, odrediti
intervale povjerenja za aritmetiku sredinu osnovnog skupa pomou
aritmetike sredine i standardne greke uzorka sa vjerovatnoom od 0,95 i
usporediti je sa pravom, izraunatom aritmetikom sredinom osnovnog
skupa.
Dato je:
N=50 (veliina osnovnog skupa)
n=10 (veliina uzorka)
Izbor uzorka
Prost sluajan uzorak:
Prost sluajni uzorak ima za sluajni poetak broj koji se nalazi u sedmom
redu i sedmoj koloni (broj 1) tablice sluajnih brojeva.
itanjem po horizontali tj. redu formiraju se dvocifreni brojevi koji
predstavljaju jedinice posmatranja uzorka od 10 lanova.
Oni brojevi koji su vei od okvira uzorka (50) ne dolaze u obzir tj. preskau
se, kao i oni koji su ve uli u izbor.
10 - 31 - 01 - 18 - 48 - 12 - 36 - 15 - 46 - 43
ili po veliini:
01 - 10 - 12 - 15 - 18 - 31 - 36 - 43 - 46 - 48
5,1 5,4
5,2
5,4
5,4
5,4
5,3
5,2
5,4
5,7
207

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sistematski uzorak:
Neka sluajan poetak ostane isti i pri izboru sistematskog uzorka tj. neka je
to cifra 1.
Od ovog poetka iz okvira uzorka bira se svaka K-ta vrijednost tj. svaka peta
jer je korak izbora 5 (K=N/n=50/10=5).
Sistematski uzorak glasi:
1 - 6 - 11 - 16 - 21 - 26 - 31 - 36 - 41 - 46
5,1 5,3 5,4
5,7
5,5
5,5
5,4
5,3
5,5
5,4
Aritmetike sredine uzorka su:

x 53,5

5,35
n
10

x 54,1
xs

5,41
n
10

x ps

Standardne devijacije uzorka iznose:


2

SD ps
SDs

x x

x2 2
x
n

0,129
0,11
10
292,91
29,27 0,14
10

Standardne greke uzorka su:


SE p.s.

SD

0,11

0,03
10
SD 0,14
SE s.

0,04
n
10

Intervali povjerenja glase:


x ps t * SE x X

ps

x ps t * SE x

5,35 1,96 * 0,03 X

5,35 0,06 X

5,29 X

ps

5,2 X

ps

ps

ps

5,35 1,96 * 0,03

5,35 0,06

5,41

5,5

208

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prosjena vrijednost hemoglobina u osnovnom skupu X p.s. procjenjena na

osnovu prosjene vrijednosti uzorka


x p.s.

sa vjerovatnoom od 0,95 kree se

u intervalu od 5,2 do 5,5 mmol/l.


Zaokruivanje granica povjerenja vri se tako da se donja zaokrui na prvu
manju vrijednost, a gornja na prvu veu vrijednost bez obzira na algebarske
principe zaokruivanja.

x s. t * SE x X s. x s. t * SE x

5,41 1,96 * 0,04 X s. 5,41 1,96 * 0,04

5,41 0,08 X s. 5,41 0,08

5,33 X s. 5,49

5,3 X s. 5,5

Prosjena vrijednost hemoglobina osnovnog skupa ( X s. ) procijenjena na

osnovu prosjene vrijednosti uzorka ( x s . ) sa vjerovatnoom od 0,95 kree


se u intervalu od 5,3 do 5,5 mmol/l.
U intervalu povjerenja sa t je oznaen koeficjent odgovarajue vjerovatnoe
tj. rizika.
Za vjerovatnou od 0,95 (95%) odnosno rizik od 0,05 (5%) ovaj koeficjent
iznosi 1,96 (priblino 2).
Za vjerovatnou od 0,99 (99%) odnosno rizik od 0,01 (1%) t iznosi 2,58
(priblino 3).
Do ovih vrijednosti dolo se na osnovu poznavanja normalne raspodjele
vjerovatnoa.
Primjer 2:
Iz osnovnog skupa od 7000 bolesnika sa hipertenzijom, izabran je uzorak od
100 bolesnika i kod njih je pronaeno da sistolni pritisak u prosjeku iznosi
20 kPa sa standardnom devijacijom od 2 kPa.
a) Odrediti interval povjerenja u kome se treba nalaziti prava vrijednost
aritmetike sredine osnovnog skupa sa vjerovatnoom od 0,95.

209

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

b) Ispitati kolika treba biti veliina uzorka za preciznost 0,02 od aritmetike


sredine uzorka.
Dato je:

N 7000

n 100

x 20
SDx 2
t 1,96 (jer je verovatnoa 0,95)

E 0,02 od x 0,02 * 20 0,4


Rjeenje:
a) Standardna greka u ovom sluaju je:

SE x

SD
n

2
100

0,2

Standardna greka je obrnuto proporcionalna drugom korjenu veliine


uzorka.
Interval povjerenja glasi:

x t * SE x X x t * SE x

20 1,96 * 0,2 X 20 1,96 * 0,2

20 0,392 X 20 0,392

19,608 X 20,392

19 X 21

Prosjena vrijednost sistolnog pritiska osnovnog skupa ( X ) procijenjena na

osnovu prosjene vrijednosti sistolnog pritiska iz uzorka ( x ) kree se u


intervalu od 19 do 21 kPa.
b) Veliina uzorka izraunava se preko izraza
N
n
N 1
1
n0
210

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sa n0 oznaena je prva aproksimacija veliine uzorka.


Ona se dobija pomou izraza:

t * SD
n0

Sa E je oznaena preciznost.
U datom primjeru najprije se mora odrediti eljena preciznost.
Ona iznosi 0,02 (tj. 2%) od aritmetike sredine uzorka odnosno 0,4
(E=2*20/100=0,4).
Prva aproksimacija veliine uzorka je:
2

1,96 * 2
t * SD
n0
96,04

E
0,4
a veliina uzorka iznosi:
N
7000
n

94,75 95
N 1
7000 1
1
1
n0
96,04
Veliina uzorka za preciznost od 0,392 ( E t * SE x 1,96 * 0,2 0,392 )
iznosila je 100, a za preciznost 0,4 iznosi 95 bolesnika.
Kao to se vidi uzorak izabran sa preciznou 0,392 je vei od uzorka ija je
preciznost manja, tj. 0,4.
Prema tome to je preciznost manja, manji je i uzorak i obrnuto, odnosno
preciznost i veliina uzorka su direktno proporcionalni.
Primjer 3:
Iz osnovnog skupa od 5000 osoba izabran je uzorak od 400 osoba i ocijenjen
je postotak pothranjenih osoba koji je iznosio 16%.
a) Ocijeniti interval povjerenja za postotak pothranjenih u
osnovnom skupu sa jverovatnoom od 0,99.
b) Ocijeniti interval u kome se nalazi broj pothranjenih osoba u
osnovnom skupu sa istom vjerovatnoom (0,99).
c) Kolika je potrebna veliina uzorka ako se eli preciznost
ocjene od 6%.
Dato je:
N 5000
n 400
p 0,16
211

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

t 2,58 (odgovara vjerovatnoi od 0,99)


E 6%
Rjeenje:
a)
Da bi se procijenila proporcija osnovnog skupa mora se najprije
izraunati standardna greka za proporciju.
Ona se dobija preko izraza:
SD p * q
SD
SE p
n
p*q
n
gde je p simbol za proporciju, a q za dopunu do jedinice.
SE p

Izmeu p i lj vai odnos p+q=1, prema tome lj se dobija kada se od jedinice


oduzme iznos proporcije.
q 1 p 1 0,16 0,84

SE p

p*q

0,16 * 0,84
0,02
400

Interval preciznosti iznosi:

p t * SE p P p t * SE p
0,16 2,58 * 0,02 P 0,16 2,58 * 0,02
0,16 0,05 P 0,16 0,05
0,11 P 0,21
11% P 21%
Proporcija pothranjenih osoba u osnovnom skupu (P) procijenjena na osnovu
proporcije uzorka (p) sa vjerovatnoom od 0,99 kree se u intervalu od 11%
do 21%.
b) Ukupan broj, odnosno total (NP) procjenjuje se na osnovu intervala
povjerenja koje glasi:

N p t * SE p NP N p t * SE p

U datom primjeru on iznosi:


N p t * SE p NP N p t * SE p

50000,16 2,58 * 0,02 NP 50000,16 2,58 * 0,02


5000 * 0,11 NP 5000 * 0,21
550 NP 1050
212

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Ukupan broj pothranjenih osoba u ovome skupu (NP) procijenjen na osnovu


proporcije iz uzorka (p) sa vjerovatnoom od 0,99 kree se u intervalu od
550 do 1050.
c) Za preciznost ocjene od 6% (0,06) veliina uzorka bie:
2

t 2 * pq 2,58 2 * 0,16 * 0,84


t * SD
n0

248,50

E2
0,06 2
E

Izraz za prvu aproksimaciju ( n0 ) za proporciju izveden je iz istog izraza za


aritmetiku sredinum zamjenom SD sa

p * q jer se standardna devijacija

dobija preko izraza SD p * q .


N
5000
n

236,74 237
N 1
5000 1
1
1
n0
248,5
Primjer 4:
Na osnovu prikupljenih podataka o ulkusnoj bolesti za sto sluajeva dobijena
je distribucija frekvencija u odnosu na godine ivota.
Godine ivota Broj bolesnika
20,0-29,9

30,0-39,9

20

40,0-49,9

44

50,0-59,9

24

60,0-69,9

10

Ukupno

100

a) Ako se ovih sto bolesnika smatraju uzorkom iz osnovnog skupa od 4000


sluajeva, donijeti sud o prosjenim godinama ivota za sve oboljele u
osnovnom skupu sa rizikom od 5%.
b) Ocijeniti postotak onih bolesnika u osnovnom skupu kod kojih se ulkusna
bolest javlja do 40-te godine ivota.

213

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Rjeenje:
a)

Sa

x1

fx1

fx1

24,9
34,9
44,9
54,9
64,9
Ukupno

2
20
44
24
10
100

49,80
698,00
1975,60
1317,60
649,00
4690,00

1240,00
24360,20
88704,40
72336,20
42120,10
228760,90

x1 oznaena je sredina grupnog intervala.

fx1 4690

46,9
f
100
2
fx1
x
f
2

SD x
SE x

SD x 9,4
n

100

228760,9
46,9 2 9,4
100

0,94

Kada se izraunaju aritmetika sredina, standardna devijacija i standardna


greka uzorka, prelazi se na procjenjivanje aritmetike sredine osnovnog
skupa pomou intervala povjerenja.

x t * SE x X x t * SE x

46,9 1,96 * 0,9 X 46,9 1,96 * 0,9

46,9 1,8 X 46,9 1,8

45,1 X 48,7

Sa vjerovatnoom od 0,95 ili rizikom od 5% (0,05) moe se rei da se prava

vrijednost prosjenih godina starosti ( X ) nalazi u intervalu od 45,1 do 48,7.


b) Da bi se procijenila proporcija osnovnog skupa mora se najprije izraunati
proporcija uzorka.
n1 2 20 22
n1
22

0,22
f 100
q 1 p 1 0,22 0,78
p

SE p

p*q

0,22 * 0,78
0,04
100

Interval povjerenja je:

p t * SE p P p t * SE p
214

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

0,22 2,58 * 0,04 P 0,22 2,58 * 0,04


0,22 0,1 P 0,22 0,1
0,12 P 0,32
12% P 32%

Proporcija osnovnog skupa (P) procijenjena na osnovu proporcije uzorka (p)


sa rizikom od 1% nalazi se u intervalu od 12% do 32%.
5. Ispitivanje razlike
Iz svega dosad izloenog mogue je dati opti pregled statistikog naina
rezonovanja i zakljuivanja.
Kada se statistiko posmatranje organizuje sa ciljem da se analizira uzorak,
neminovno se raa potreba da se opis usporeuje bilo sa nekom zamiljenom
teorijskom veliinom, bilo sa drugim na isti nain obraenim uzorkom.
Pri tome su od dragocijene pomoi sljedee logike operacije.
Razlike ili istovjetnost mogu biti sluajne i organizovane.
Sluajne razlike posljedica su sluajnih variranja i po pravcu odnosno smislu
ne mogu se predvidjeti.
Nastaju zbog priblinosti mjerenja, nesavrene kategorijalne definicije
obiljeja, prirodne heterogenosti skupa i opte pojave u prirodi da se jedinke
meusobno razlikuju.
Organizovane promjene (razlike) vode porijeklo od djelovanja faktora koji
se mogu, ili je poeljno da se identifikuju.
U statistici se podjednako paljivo dokazuju i sluajne i organizovane
razlike. Za ove posljednje se kae da su statistiki znaajne.
Pri elementarnoj usporedbi reprezentativnih numerikih veliina mogue su
dvije kombinacije:
1. Obe veliine pripadaju istom osnovnom skupu i razlika meu njima, i ako
objektivno postoji, statistiki nije znaajna i pri sljedeem posmatranju moe
se predvidjeti samo po razmahu variranja a ne i u pojedinanom sluaju.
2. Obe veliine pripadaju razliitim osnovnim skupovima i razlika izmeu
njih statistiki je znaajna.
Ako se pri dokazivanju pripadnitva istom skupu upotrebljavaju parametri,
kako bi se skupovi rekonstruisali i time dokazalo pripadnitvo uzoraka,
koriste se parametarski statistiki testovi.
215

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Najee upotrebljavani su z-test i Studentov t-test.


Mogue je ocijeniti znaajnost razlike i ne obraajui panju na skup kojem
uzroci pripadaju.
Pri tome se cijeni stepen izmjeanosti izmeu uzoraka koji se usporeuju i
esto se pri tome nulta hipoteza numeriki definie kao privremeno
objedinjavanje oba uzorka u jedan skup. Tipian predstavnik ovakvog testa
je izraunavanje hi-kvadrata za frekvenciju.
5.1. Parametarski metodi za ispitivanje razlike
5.1.1. Zed test
Test baziran na kararistikama standardne normalne raspodjele i standardne
zed vrijednosti naziva se zed test.
Zed test je parametarski analitiki metod za procjenu znaajnosti razlike.
Zed testom procjenjuje se znaajnost razlika statistikih parametara,
parametarskih, homogenih veijednosti obiljeja posmatranja dvije grupe
podataka.
Zed testom procjenjuje se znaajnost razlike po jednom obiljeju
posmatranja pod uslovom da su podaciobiljeja posmatranja parametarskog
karaktera i kvantitativne (numerike) prirode.
Za upotrebu zed testa moraju biti zadovoljeni uslovi:
osnovni skup rasporeen je po normalnoj raspodjeli;
poznata standardna devijacija osnovnog skupa.
Uslov normalnosti osnovnog skupa ne mora uvijek biti ispunjen pod
uslovom da je uzorak dovoljno veliki, zbog toga to raspodjela aritmetikih
sredina uzoraka tei normalnoj s porastom veliine uzorka.
Zed testom se procjenjuje:
znaajnost razlike dva osnovna skupa;
znaajnost razlike osnovnog skupa i uzorka;
znaajnost razlike vezanih nezavisnih uzoraka;
znaajnost empirijskih vrijednosti drugih statistikih parametara.
Znaajnost razlike procjenjuje se zed testom na osnovu razlike statistikih
parametara validnih za odreene empirijske situacije.
Najei parametri ija se znaajnost razlike utvruje su aritmetika sredina i
proporcija ( x X ; x1 x 2 ; p1 p2 ).

216

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Istraivanje razlike pomou zed testa sastoji se u izraunavanju empirijske


vrijednosti i odreivanju teorijske vrijednosti zed testa.
Vrijednosti zed testa obiljeavaju se velikim latininim slovom z - Z.
Empirijska vrijednost zed testa izraunava se normiranjem (dijeljenjem)
razlike posmatranih statistikih veliina sa odgovarajuom standardnom
grekom izraunatom na osnovu standardne devijacije osnovnog skupa tj.:

d
SE d

Teorijska vrijednost zed testa (Zt) je granina vrijednost standardizovane zed


vrijednosti za odgovarajui nivo znaajnosti (vjerovatnoe sigurnosti).
Standardna zed vrijednost kod dvosmjernog tipa testiranja iznosi 1,96 za nii
nivo znaajnosti (Z0,05=1,96) i 2,58 za vii nivo znaajnosti (Z0,01=2,58) a
kod jednosmjernog tipa testiranja 1,64 za nii (Z0,05=1,64) i 2,33 za vii
(Z0,01=2,33) nivo znaajnosti.
Statistiki zakljuak o znaajnosti razlike statistikih parametara donosi se
usporedbom empirijske (Ze) i teorijske (Zt) vrijednosti zed testa.
Ako je empirijska vrijednost zed testa manja ili jednaka teorijskoj vrijednosti

(Ze Zt) za nivo vjerovatnoe sigurnosti od 0,95 prihvata se nulta a odbacije


radna hipoteza i zakljuuje se da razlika statistikih veliina nije znaajna
(p>0,05).
Ako je empirijska vrijednost zed testa vea od teorijske (Ze>Zt) za
odgovarajui nivo znaajnosti (p=0,95; p=0,99) odbacuje se nulta a prihvata
radna hipotezi i zakljuuje da je razlika statistikih parametara znaajna
(p<0,05) odnosno visoko znaajna (p<0,01).
Kod procjene razlike aritmetikih sredina uzorka i osnovnog skupa
empirijska vrijednost zed testa dobija se pomou izraza:

Ze

x X x X

SD x
SE x
n

Primjer 1.
U cilju procjene zdravstvenog stanja bolesnika primljenih na lijeenje u
bolnicu odreivana je, izmeu ostalog i, vrijednost leukocita.
217

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
9

Kod 100 ispitanika utvrena je prosjena vrijednost leukocita od 7x10 /l.


Da li je bolest uticala na promjenu vrijednosti leukocita?

Rjeenje
Normalna vrijednost leukocita iznosi 6x109/l (SDx=0,8x109/l).
Kako je odstupanje leukocita od normalne vrijednosti u oba smjera
nepoeljno uticaj bolesti na broj leukocita testiramo dvosmjernim tipom
testiranja.
Poto je uzorak na osnovu koga se vri ispitivanje veliki (n=100>30) a
strandardna devijacija osnovnog skupa poznata (SDx=0,8*109/l) znaajnost
razlike aritmetikih sredina uzorka i osnovnog skupa moe se procijeniti na
osnovu z-testa.

Ze

x X
76
1

12,5
SDx
0,8
0,08
100
n

Empirijska vrijednost z-testa (Ze=12,5) vea je od teorijske (granine)


vrijednosti z-testa za nivo sigurnosti od 0,99 (Z0,99=2,58) pa se odbacuje
nulta a prihvata radna hipoteza i zakljuuje da je razlika aritmetikih sredina
visoko znaajna (p<0,01).
Bolest je visokoznaajno uticala na promjenu vrijednosti leukocita odnosno
vrlo znaajno poveala vrijednost leukocita (Ze=12,5>Z0,99=2,58).
Pored aritmetike sredine esto se procjenjuje znaajnost razlike proporcije
odnosno uea dijela jedinica posmatranja u osnovnom skupu kao cjelini.
S obzirom na injenicu da se proporcija oekivanih dogaaja rasporeuje po
binomnoj raspodjeli postavlja se pitanje korektnosti primjene z-testa koji je
baziran na normalnoj raspodjeli.
z-test se moe primijeniti na testiranje razlike proporcija pod uslovom da se
binomna moe aproksimirati normalnom raspodjelom.
Binomna se najbolje aproksimira normalnom raspodjelom pod uslovima
nulte hipoteze tj. ako su vjerovatnoe odnosno proporcije oekivanog i
suprotnog dogaaja jednake (p=q=0,5) odnosno ako su produkti ukupnog
broja jedinica posmatranja i proporcija oekivanog ili suprotnog dogaaja
meusobno jednaki a jednaki ili vei od ( np nq 5 ).
Pod tim uslovima moe se proporcija testirati z-testom.
Standardna greka (SEp) rauna se na osnovu proporcije osnovnog skupa (P).
218

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Meutim, proporcija osnovnog skupa je nepoznata veliina pa se standardna


greka proporcije ocjenjuje na osnovu hipotetike vrijednosti proporcije
osnovnog skupa (P0) koja se procjenjuje na osnovu realizovane proporcije u
uzorku (p), pa je:

SE p0

P0 * Q0
n

Ze

p p0
SE p0

Primjer 2.
Farmaceutska firma preporuuje novi preparat protiv osteomalacije tvrdei
da smanjuje procenat neuspjeha ispod 10%. Od 125 djece lijeene ovim
preparatom kod 12 su na kontrolnom pregledu naeni diskretni znaci
osteomalacije. Da li se novi preparat moe preporuiti?
Rjeenje
Novi preparat se moe preporuiti ako se ispitivanjem odbaci nulta hipoteza,
tj. ako se dokae da je procenat oboljenja u uzorku ispitanika ljeenih ovim
preparatom znaajno nii od 10%.
U postupku procjene uspjenosti preparata najprije treba ispitati uslove za
primjenu z-testa.
Kako je pretpostavljena proporcija osnovnog skupa P0 10% 0,1 tada je

n * p 125 * 0,1 12,5 5


n * q 125 * 0,9 112,5 5
S obzirom da su uslovi procjene znaajnosti razlike proporcije z-testom
zadovoljeni odreuje se proporcija uzorka

m 12

0,096
n 125

a zatim i standardna greka

SE P0

P0 * Q0
0,1 * 0,9

0,027
n
125

i izrauna se empirijska vrijednost z-testa


p P0 0,096 0,1
Ze

0,148
SE P0
0,027
Empirijska vrijednost z-testa (Ze=0,148) manja je od teorijske vrijednosti
(Zt=1,64 jer se procjenjuje jedan smjer, snienje) za nivo sigurnosti od 0,95
prihvata se nulta a odbacuje radna hipoteza i zakljuuje da razlika proporcija
osnovnog skupa i uzorka nije znaajna (p>0,05).
219

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Novi preparat nije snizio procenat neuzpjeha znaajno ispod 10%.


Preporuka proizvoaa novog preparata ne moe se prihvatiti.
5.1.2. Studentov t-test (William Sealy Casset (1876-1937) Student)
Te test, koji se po pseudonimu autora naziva i Studentov t-test, jedan je od
najjaih i najee koritenih metoda parametarske statistike.
Studentov t-test je analitiki parametarski metod za procjenu znaajnosti
razlike.
Izraunavanje statistikih parametara neophodnih za primjenu t-testa
mogue je samo kod jedinica posmatranja koji su numerikog tipa.
Studentov t-test primjenjuje se na vrijednosti obiljeja koje potiu iz
osnovnog skupa koji se distribuira po normalnoj raspodjeli.
Meutim, ukoliko nije mogue provjeriti pripadnost skupa normalnoj
raspodjeli potrebno je aproksimirati tip raspodjele utvrivanjem
homogenosti vrijednosti obiljeja (CV<30%).
Najee se, u medicinskim istraivanjima, pojavljuje potreba za
odreivanjem odnosa grupe prema populaciji, za ispitivanje promjene stanja
grupe i za usporedbu dviju grupa.
S obzirom na ove ciljeve t-test se moe koristiti u vie eksperimentalnih
situacija.
t-testom moe se ispitivati:
znaajnost razlike uzorka i osnovnog skupa,
znaajnost razlike zavisnog uzorka i
znaajnost razlike dva nezavisna uzorka.
Pod pojmom zavisnog, odnosno vezanog uzorka, podrazumijeva se uzorak
kod koga jedinice posmatranja same sebi predstavljaju kontrolu.
Osim toga t-test se upotrebljava i u situacijama kao je potrebno ocijeniti
znaajnost empirijskih vrijednosti drugih analitikih metoda.
Svrha testiranja hipoteza je pruanje pomoi u donoenju odluka koje se
odnose na izabranu populaciju.
Ove odluke se zasnivaju na podacima dobijenim iz ogranienog dijela cjeline
- uzorka.
Studentov t-test karakteristian je za ispitivanja, koja omoguavaju
izraunavanje razliitih parametara osnovnog skupa koritenjem uzorka
(parametri su aritmetika sredina, relativni brojevi, mjere varijabiliteta itd.).
Po navedenim parametrima vidi se da su mogunosti testiranja vrlo velike.
Ovdje e se testirati samo znaajnost razlika aritmetikih sredina u sljedeim
situacijama:
a. izmau dva mala nezavisna uzorka;
b. izmau dva velika nezavisna uzorka;
220

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

c. izmeu uzorka i osnovnog skupa i


d. izmeu dva vezana (zavisna) uzorka (bez obzira na veliinu).
a) Testiranje znaajnosti razlika izmeu aritmetikih sredina dva mala
nezavisna uzorka ( n1

n2 60 )

Primjer
Podaci se odnose na vrijednost serumske amilaze kod dvije grupe ispitanika.
Prva grupa je kontrolna (zdravi ispitanici), a druga je sastavljena od
hospitalizovanih ispitanika, za koje se zna da im obolenje utie na vrijednosti
serumske amilaze.
U prvoj grupi bilo je 15 ispitanika ( n1 15 ).

Njihova prosjena vrijednost serumske amilaze je x1 120 jedinica/ml sa


standardnom devijacijom od 40 jedinica/ml.
U drugoj grupi, u kojoj je bilo 22 ispitanika ( n2 22 ), prosjena vrijednost

je x 2 96 sa SD2 35 jedinica/ml.
Oigledno, aritmetike sredine ove dvije grupe su razliite. Jedna iznosi 96,
a druga 120.
Meutim, nas interesuje da li je ta razlika znaajna, odnosno, da li je
posljedica djelovanja sistematskog faktora.
U ovom sluaju taj sistematski faktor bi bio razlog hospitalizacije ispitanika.
Ako razlika izmeu ovih srednjih vrijednosti nije znaajna prihvatie se
pretpostavka da je sluajna.
Da se donese odluka potrebno je da se izrauna empirijska vrijednost t-testa.
Pri tome koristimo sljedei izraz:

x1 x 2

t emp.

n1 SD n2 SD n1 n2
*
n1 n2 2
n1 * n2
2
1

2
2

120 96
15 * 40 22 * 35 15 22
*
15 22 2
15 * 22
2

1,88

Nadalje, koristei tablicu graninih vrijednosti t-testa i izraz za stepen

DF n1 n2 2 nalazi se
DF n1 n2 2 15 22 2 35

slobode:

Iz tablica se oita granina vrijednost t-testa

221

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

t gr 2,03; p 0,05

t gr 2,72; p 0,01

Kako je empirijska (izraunata) vrijednost 1,88 manja od one koja odgovara


teorijskoj (graninoj) vrijednosti pri vjerovatnoi nulte hipoteze od 0,05
(2,03), i manja od one koja odgovara teorijskoj vrednosti t-testa za
vjerovatnou nulte hipoteze od 0,01 (2,72) zakljuuje se da aritmetike
sredina ova dva uzorka nisu znaajno razliite pri emu je vjerovatnoa nulte
hipoteze p 0,05.
b) Testiranje znaajnosti razlika izmeu aritmetikih sredina dva velika
nezavisna uzorka ( n1 n2 60 )
Primjer
Dati su podaci o novoroenoj djeci majki domaica ( n1 400 ) i majki
radnica ( n2 500 ):

SD1 200 grama

x1 3820 grama

SD2 250

x 2 3760 grama

grama
Da li se prosjene tjelesne teine novoroenadi majki domaica i majki
radnica znaajno razlikuju?
Rjeenje
U ovakvim sluajevima koristi se sljedei izraz za izraunavanje empirijske
vrijednosti t-testa:

x1 x 2
SD12 SD22

n1
n2

3820 3760
200 2 250 2

400
500

60
4
15

Primjenom ovoga izraza dobijamo: t=4 pri emu je broj stepeni slobode
DF n1 n2 2 tj. DF 898 .
Veliina izraunate empirijske vrijednosti t-testa ukazuje da se prihvati radna
hipoteza.
Ona tvrdi da postoji znaajna razlika u prosjenim teinama novoroenadi
pri emu je vjerovatnoa nulte hipoteze

222

p 0,01 .

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

c) Testiranje znaajnosti razlika izmeu aritmetikih sredina uzoraka i


populacije
U ovoj, kao i prethodnim situacijama, konaan odgovor je prihvatanje jedne
od dvije polazne pretpostavke.
Nulta hipoteza, koja pretpostavlja da nema znaajnih razlika izmeu
aritmetikih sredina uzorka i populacije, u sutini oznaava posmatrani
uzorak kao reprezentativni dio ispititvane populacije.
Nasuprot tome, radna hipoteza pretpostavlja da postoje znaajne razlike
izmeu usporeivanih aritmetikih sredina.
Do te razlike moglo je doi iz vie razloga. Najei je, da taj uzorak ne
pripada populaciji koju posmatramo.
Primjer
Ispitiva je zainteresovan da zakljui da je srednji nivo nekog enzima u
odreenoj populaciji 25.
Podaci na osnovu kojih je elio da doe do definitivnog odgovora odnosili su
se na nivo tog enzima kod 10 ispitanika iz populacije koju je ispitivao.
U ovom uzorku izraunao je aritmetiku sredinu nivoa enzima od 22.
Istovremeno je bio upoznat sa variranjem vrijednosti ispitivanog enzima u
itavoj populaciji koje je iznosilo SD=45.
Da bi dobio eljeni odgovor, tj. saznao da li je tana pretpostavka, da li je
srednji nivo enzima 25 (nulta hipoteza) ili pretpostavka da je taj srednji nivo
znaajno razliit od 25 (radna hipoteza), upotrebio je sljedeu varijantu ttesta:

x X 22 25
t

1,41
SE
45
10
Usporeivanjem dobijene vrijednosti sa onom iz tablice za broj stepeni
slobode DF=n-1=9 zakljuuje se da nema razloga da se odbaci nulta
hipoteza, tj. srednji nivo ispitivanog enzima vjerovatno je 25.
U okviru ovog primjera skree se panja na sljedee:
vrlo esto nije mogue znati varijabilitet ispitivanog obiljeja u itavoj
populaciji.
Tada se zadovoljavamo sa varijabilitetom koji je mogue procijeniti samo na
osnovu uzorka.

223

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

d) Testiranje znaajnosti razlika izmeu aritmetikih sredina dva


zavisna (vezana) uzorka
Kod dva mala zavisna (vezana) uzorka mora se voditi rauna o stepenu
njihove povezanosti, korelacije. Meutim, da bi se izbjeglo izraunavanje
koeficijenta linearne korelacije, kod dva mala zavisna uzorka primijenjuje se
posebna tehnika izraunavanja, poznata kao t-test diferencije. Princip
"diferencije" sastoji se u tome da se niz individualnih razlika tretira kao
poseban uzorak, za koga se izraunava aritmetika sredina diferencije - x ,
standardna devijacija diferencije - SDdif i standardna greka diferencije
SE dif .
Ovakvi zavisni (vezani) uzorci najee se primijenjuju kod ispitivanja
efikasnosti kod nekog tretmana ili eksperimentalnog postupka.
To su dva uzorka jednake veliine, gdje se ispitanici nalaze u paru.
Pri tome razlikujemo dvije mogunosti (uspostavljanja para):

Prva, u kojoj se posmatra isti ispitanik prije i poslije tretmana;


Druga, gdje su ispitanici to je mogue sliniji.
Ovo se radi zbog toga da se odstrani to vei broj uticaja koji djeluju na
variranje posmatranog obiljeja.
Empirijska vrijednost t testa dobija se na osnovu izraza:

x dif
SE dif

gdje je

x dif

(x

SE dif

i2

xi1 )

n
SDdif
n 1

sa

SDdif

( xi 2 xi1 ) x dif

Primjer
Deset ispitanika uestvovalo je u eksperimentu koji je imao za cilj da utvrdi
efikasnost utvrene dijete, kombinovane sa programom vjebi u smanjenju
ukupnog holesterola u krvi.
Holesterol (mmol/l) je mjeren prije i poslije takvog tretmana:

224

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

ispitanik
1 2
3
4
5
6
7 8 9 10
holesterol prije 5,13 4,98 7,01 3,33 4,05 4,37 5,20 8,11 3,45 4,12
holesterol poslije 3,15 3,56 5,22 2,13 3,33 4,44 4,32 3,15 3,93 3,66

U ovom sluaju interesuje nas aritmetika sredina razlika u vrijednostima


holesterola prije i poslije tretmana, tj.
Formirajmo radnu tabelu:
d
d-xsr
(d-xsr)2

-1,98 -1,42 -1,79 -1,20 -0,72 0,07 -0,88 -4,96 0,48 -0,46 -12,86
-3,27 -2,71 -3,08 -2,49 -2,01 -1,22 -2,17 -6,25 -0,81 -1,75 -25,72
10,67 7,32 9,46 6,18 4,02 1,48 4,69 39,01 0,65 3,05 86,54

Na osnovu radne tabele dobije se:

x dif
SDdif

SEdif

(x

i2

xi1 )

1,29(mmol / l )

( xi 2 xi1 ) x dif

2,94(mmol / l )
n
SDdif

0,98(mmol / l )
n 1

pa je

x dif
1,31
SEdif

Tumaenje dobijene vrijednosti obaviemo pomou tablice za t-test.


Vidimo da je dobijena empirijska vrijednost manja, za broj stepeni slobode
DF=n-1=10-1=9 i p=0,01 od granine vrijednosti (3,25).
Zakljuujemo da se nulta hipoteza prihvata i zakljuujemo da ne postoji
znaajna razlika u nivoima ukupnog holesterola u krvi prije i poslije
tretmana, pri emu je vjerovatnoa nulte hipoteze p>0,01.
5.1.3. Zakljuak
Upoznali smo se sa naparametarskim metodima testiranja hipoteze, koje ima
sljedee korake:
a) opis podataka;
b) definisanje nulte i radne hipoteze;
v) izbor odreenog statistikog testa;

225

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

g) izraunavanje empirijske vrijednosti izabranog testa i odreivanje


granine vrijednosti testa;
d) statistika odluka zasnovana na rezultatima istraivanja i
e) odluka ljekara.
Pored toga objasnili smo nekoliko sluajeva karakteristinih za primjenu z i
Studentovog t-testa, koji su ilustrovani odgovarajuim primjerima.
5.2. Neparametarski metodi za ispitivanje razlike
Do sada je nae interesovanje bilo usmjereno na ocjenjivanje ili testiranje
hipoteza o jednom ili vie parametara osnovnog skupa, tj. populacije.
Pri testiranju pretpostavljano je da je sluajna varijabla koja se posmatra,
najee, rasporeena po normalnoj raspodjeli.
Meutim, ako raspodjela skupa posmatranja nije poznata potrebno je na
osnovu uzorka dobiti informaciju o toj raspodjeli.
Svi postupci koji se u tom cilju sprovode su tzv. neparametarski metodi.
Hipoteze koje se odnose na raspodjelu osnovnog skupa nazivaju se
neparametarske hipoteze, a testovi kojima se one provjeravaju
neparametarski testovi.
Kod neparametarskih testova, i nulta i radna (alternativna) hipoteza odnose
se na oblik funkcije raspodjele, odnosno na zakon vjerovatnoe osnovnog
skupa.
Nulta hipoteza H0 tvrdi da osnovni skup ima odreenu raspodjelu.
Kada je raspodjela odreena funkcijom raspodjele tada H0 glasi:
H0: F(x) = F0(x) za svako x Rx
gdje je Rx skup moguih vrijednosti obiljeja X.
F0(x) je na nekakav nain poznata, pretpostavljena funkcija raspodjele.
Alternativna hipoteza glasi
H1: F(x) F0(x) bar za jedno x Rx.
Od neparametarskih testova najee se koristi

2 test i test Kolmogorova.

2 test se primjenjuje na sluajnu varijablu nezavisno od njenog tipa, dok se


test Kolmogorova koristi samo na neprekidnu sluajnu varijablu.
5.2.1. Hi kvadrat test
Hi kvadrat test u statistiku praksu prvi je uveo 1900. godine Karl Pirson
(Karl Pearson).
Spektar situacija u kojima se ovaj test moe koristiti veoma je irok a za ove
potrebe podijeliemo ga u dvije velike kategorije.
U prvu spadaju tzv. testovi slaganja, a u drugu tablice kontigencije.
226

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Prvu grupu ine one empirijske situacije u kojima se procjenjuje znaajnost


razlike frekvencija po gradacijama jednog obiljeja posmatranja. Empirijske
frekvencije, u ovom sluaju, potiu iz jednog istog uzroka koji je formiran na
osnovu obiljeja posmatranja. Dihotomna gradacija obiljeja posmatranja
daje elementarnu empirijsku situaciju ovog tipa. Nju ini jedna serija (niz)
od samo dva lana (dvije empirijske frekvencije).
Drugoj grupi pripadaju one empirijske situacije u kojima se procjenjuje
znaajnost razlike frekvencija po gradacijama dva obiljeja posmatranja.
Empirijske frekvencije u ovom sluaju potiu oiz dva ili vie nezavisnih
uzoraka. Da bi se lake obradile frekvencije ovog tipa, svrstavaju se u tablice
kontingencije.
Hi kvadrat test najee se primjenjuje kad treba ispitati razlike izmeu
dobijenih (observiranih) i oekivanih (teorijskih) frekvencija. Pri tome Hi
kvadrat ne daje informaciju o stepenu asocijacije (povezanosti) izmeu
ispitivanih atributivnih obiljeja. Dobijene (observirane) frekvencije su
frekvencije dobijene empirijskim istraivanjima ili eksperimentom.
Oekivane frekvencije su teorijskog karaktera ili frekvencije koje se oekuju
na osnovu hipoteze koja se eli provjeriti. Teorijska distribucija frekvencija
se ne poklapa sa dobijenom distribucijom, izmeu njih postoji izvjesna
razlika. Osnovno je pitanje da li je ta razlika sluajnog karaktera ili je
statistiki signifikantna, odnosno da li je nastala pod djelovanjem sistemskih
(eksperimentalnih) faktora. Odgovor na ovo pitanje i mogunost ocjene
razlike izmeu (dobijenih i oekivanih) frekvencija daje Hi kvadrat test
definisan izrazom:

foi ft i

i 1

ft i

gdje je:
i - broja (modaliteta ispitivanog obiljeja);
fo - opservirane, posmatrane frekvencije iz ispitivanja;
ft - oekivane (teorijske) frekvencije, tj. one koje se oekuju za
istinitost nulte hipoteze
k - ukupan broj modaliteta .
Simbol (sigma) u formuli znai da Hi kvadrat test ima kumulativni
karakter.

227

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Najvaniji uslovi za primjenu Hi kvadrat testa su:


a. Hi kvadrat test izraunava se iskljuivo iz apsolutnih frekvencija, ili iz
podataka ako se oni mogu svesti na apsolutne frekvencije;
b. Niti jedan od apsolutnih frekvencija ne smije imati vrijednost manju od 5
jedinica;
c. Kada su uzorci manji od 200 jedinica (n1+n2<200) primjenjuje se
Jatesova (Yates) korekcija:
1. Svaka dobijena frekvencija, ako je vea od oekivane umanjuje se za
0,5;
2. Svaka dobijena frekvencija ako je manja od oekivane uveava se za
0,5.
5.2.2. Primjena hi kvadrat testa kao testa slaganja
Testovi slaganja prikladni su u sluajevima kada donosimo odluku o
saglasnosti naih podataka sa nekom hipotetikom raspodjelom.
Primjer
U okviru ankete, koja je sprovedena meu 500 studenata Medicinskog
fakulteta, postavljeno je i pitanje:
Da li ste, poslije odsluane prve godine, u bilo kom smislu promijenili
miljenje o studijama na ovom fakultetu?
Na ovo pitanje dobijeni su sljedei odgovori:
nisu promijenili miljenje
imaju bolje miljenje
imaju loije miljenje

350
50
100

S obzirom da se u prvoj kategoriji odgovora oekivalo 80%, a u druge dvije


po 10%, postavlja se pitanje:
Da li odnos ovako dobijenih odgovora znaajno odstupa od oekivanog?
Rjeenje
Poeemo sa formulisanjem pretpostavki, koje u toku procesa testiranja
elimo provjeriti na prikupljenim podacima.
To su nulta i radna hipoteza: Nulta hipoteza, ija se odrivost i provjerava,
govori da nema znaajnih razlika izmeu dobijenih frekvencija u
odgovorima od one, koja je prije poetka ispitivanja oekivana.
Znai, razlike e sigurno postojati, meutim njihovo porijeklo je u
varijabilnosti same pojave koja se ispituje. Nasuprot tome, radna hipoteza
228

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

tvrdi suprotno. Znaajne razlike postoje i one su posljedica djelovanja nekog


sistematskog faktora.
Na osnovu prikupljanja podataka izraunava se empirijska vrijednost hikvadrat testa pomou sljedee formule:

foi ft i

i 1

ft i

Formira se radna tabela:


i

foi

ft i

foi

ft i

foi

ft i

fo

ft

350

400

-50

2500

6,25

50

50

100

50

50

2500

50

2
emp

2
f ti

56,25

Teorijska ili granina vrijednost hi-kvadrata za odabrane vjerovatnoe nulte


hipoteze u funkciji broja stepena slobode, dobije se iz tablice Hi kvadrata.
Broj stepeni slobode je broj uslova koji definie sve ostale frekvencije pri
konstantnim ivinim zbirovima, znai u konkretnom sluaju broj modaliteta
minus jedan, tj. 3-1=2. Iz tablice se odreuje teorijska (granina) vrijednost
hi kvadrata za DF=2 i p=0,01 koja iznosi
Kako je emp. 56,25 vee od
odbacuje nulta hipoteza.
2

gr2 9,210 .

2
gr
9,210

prihvata se radna a

5.2.3. Tablice kontigencije


Tablice kontingencije su sloene kombinovane tabele koje prikazuju
distribucije empirijskih frekvencija po gradacijama dva obiljeja
posmatranja.
Obiljeje ije gradacije popunjavaju pretkolonu, i formiraju redove tablice,
naziva se strukturno obiljeje, a ono obieje ije gradacije popunjavaju
zaglavlje i formiraju kolone naziva se funkcionalno obiljeje.
229

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Elementarna, minimalna tablica kontingencije je tabela 2x2, to znai da ima


dva reda i dvije kolone validnih podataka. Ovaj oblik tablice kontingencije
uslovljen je najmanjim moguim brojem gradacija jednog obiljeja
posmatranja odnosno njegovim dihotomnim karakterom. Ove tablice
prikazuju vezu dvije ili vie atributivnih osobina.
Analiza frekvencija utvruje pripadnost kategorija koje se usporeuju istom
osnovnom skupu sa istom frekvencijom pojave ispitivanog obiljeja, gdje je
razlika u frekvencijama uslovljena faktorom koji se ispituje.
Osnovni model tablica kontigencije tipa 2 x 2 ima izgled:
Funkcionalna dihotomija
Ispitivana

Ispitivana osobina

osobina postoji

ne postoji

Ukupno

Strukturna

Jedna grupa

a+b

dihotomija

Druga grupa

c+d

a+c

b+d

a+b+c+d=n

Ukupno

Frekvencije sa kojima se obiljeja javljaju mogu biti iste, a eventualna


razlika meu njima nije znaajna zato to je sluajna, ili je situacija i
tumaenje obrnuto. Ovim smo poblie oderili nultu hipotezu, koju emo u
procesu testiranja provjeriti.
Kada postoje vie od dvije strukturne ili funkcionalne, ili i strukturne i
funkcionalne gradacije, formiraju se tablice kontingencije rxk. Parametar r
predstavlja broj gradacija strukturnog obiljeja i istovremeno broj redova, a
broj k predstavlja broj gradacija funkcionalnog obiljeja i istovremeno broj
broj kolona tablice kontingencije. Najmanja tablica kontingencije tipa rxk je
tablica 2x3 (dva reda i tri kolone) odnosno 3x2 (tri reda i dvije kolone).
Ovaj tip tablica kontingencije sadri:
ukupan broj frekvencija (a+b+c+d+f=n);
pet nezavisnih uzoraka izraenih ivinim zbirovima (a+b+e; c+d+f; a+c;
b+d e+f);
pet serija tj. empirijskih frekvencija (svaki red i svaka kolona jedan niz)
sa po dva ili tri lana (sa po dvije ili tri grupe frekvencija tj. empirijske
frekvencije i
est nezavisnih frekvencija (empirijskih frekvencija a; b; c; d; e; f).

230

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Funkcionalno obiljeje

Strukturno

Ukupno

obiljeje

I gradacija

II gradacija

III gradacija

Prva gradacija

a+b+e

Druga gradacija

c+d+f

Svega

a+c

b+d

e+f

a+b+c+d+e+f=n

U medicinskim istraivanjima dihotomna obiljeja obino se javljaju kao:


Zdravstveno stanje pojedinca:
zdrav - bolestan;
Zdravstveno stanje populacije: zdravi bolesni;
Faktori rizika (ekspozicija):
eksponiran -nije eksponiran:
o pui - ne pui;
o pije alkohol - ne pije alkohol
Vakcinalni status:
vakcinisan - nevakcinisan itd.
Praktino se cijeli skup moe podijeliti na dva dijela: na grupu jedinica koje
imaju i grupu jedinica koje nemaju neko obiljeje ili na dvije grupe od kojih
jedna ima jedno obiljeje a druga drugo obiljeje.
Ukoliko se obiljeja mogu klasifikovati u dva modaliteta onda se dobija
odnos kao na emi:

oboljeli
eksponirani
uzorak

nisu oboljeli
oboljeli
neeksponirani
nisu oboljeli

Ovi odnosi dva obiljeja jednog uzorka sa po dva modaliteta prikazuju se


tabelom kontingencije 2x2, u dva reda i dvije kolone.
Koji modaliteti se prikazuju u redovima, a koji u kolonama zavisi od metoda
i naina sprovoenja ispitivanja i studija.
a)

Observacione ili retrospektivne studije:

U ovim studijama polazi se od bolesti (posljedice) pa ide prema ekspoziciji


(uzroku bolesti).
Kod ovih studija tablica kontingencije 2x2 ima opti oblik:

231

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Faktor rizika
(ekspozicija)
Eksponirani
Neeksponirani
Ukupno

Stanje zdravlja
Oboljeli
Zdravi
a
b
c
d
a+c
b+d

Ukupno
a+b
c+d
a+b+c+d=n

Radna hipoteza kod observacionih (retrospektivnih) studija:


Prevalenca oboljenja je vea meu onima koji su bili eksponirani, odnosno
frekvencija eksponiranih i oboljelih (a) je znaajno vea od frekvencije
neeksponiranih a oboljelih (c):
Radna hipoteza

H1:

a
c

ab cd

b) Prospektivne studije:
U ovim studijama polazi se od uzroka (faktora rizika) i ide prema posljedici
(bolesti)
Kod ovih studija tablica kontingencije 2x2 ima opti oblik:
Stanje
zdravlja
Oboljeli
Nisu oboljeli
Ukupno

Uzrok ekspozicija
da
ne
a
b
c
d
a+c
b+d

Ukupno
a+b
c+d
a+b+c+d=n

Radna hipoteza kod prospektivnih studija:


Oekuje se da prevalenca oboljenja bude znatno vea kod eksponiranih,
odnosno frekvencija oboljelih a eksponiranih (a) znaajno je vea od
frekvencije oboljelih a neensponiranih:
Radna hipoteza

H1:

a
b

ac bd

Primjer 1:
Razmatra se klasian primjer povezanosti puenja i oboljevanja od raka
plua.
Istraiva je sluajnom metodom odabrao 500 zdravstvenih kartona u slubi
opte medicine (odraslo i starije stanovnitvo).
Pregledom kartona ustanovljeno je:
232

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

da je od 500 pacijenata 85 imalo karcinom plua. Od ovih oboljelih ljih


75 bili su strastveni puai;
da je od 415 bez oboljenja bilo 150 strastvenih puaa.
Problem: Postoji li veza izmeu puenja i karcinoma plua?
Da li je frekvencija puaa znatno zastupljenija u grupi oboljelih?
Rjeenje:
Prvi korak: Podaci se postavljaju u tablicu kontingencije 2x2 i definiu se
hipoteze:
Puenje
Da
Ne
Ukupno

Ca plua
75
(a)
10
(c)
85
(a+c)

Zdravi
150
(b)
265
(d)
415
(b+d)

Ukupno
225
(a+b)
275
(c+d)
500

Definisanje hipoteza.
H0: Izmeu puenja i raka plua ne postoji veza.
H1: Izmeu puenja i raka plua postoji veza.
Drugi korak: Odreuje se novo znaajnosti od p=0,05 (5%).
Trei korak: Primjenjuje se Hi kvadrat test, tj. formula

foi ft i

i 1

ft i

U formuli je potrebno uzeti observirane frekvencije, koje su poznate, ali je


potrebno odrediti oekivane (teorijske) frekvencije.
Observirane frekvencije su: 75, 10, 150, 265.
Postavlja se pitanje kako odrediti teorijeske frekvencije, odnosno koje
frekvencije u vezi sa postavljenim problemom se oekuju?
Do odgovora se moe doi intuitivnom analizom kako sljedi:
U zadnjoj koloni dati su podaci za 225 (45%) od 500 osoba koji su bili
eksponirani, dok je 275 (55%) osoba nije bilo eksponirano.
Ako je nulta hipoteza H0 tana tada se oekuje da je rak plua javlja u 45%
sluajeva kod eksponiranih a u 55% sluajeva kod neeksponiranih, tj.
oekivane frekvencije su:
za oboljele i eksponirane:
85 x 0,45 = 38,25
za oboljele i neeksponirane:
85 x 0,55 = 46,75
za zdrave i eksponirane:
415 x 0,45 = 186,75
za zdrave i neeksponirane:
415 x 0,55 = 228,25
Ovaj nain odreivanja teorijskih frekvencija, zavisno od problema, moe
postati veoma komplikovan.
Postoji jednostavniji nain - pravilo za izraunavanje teorijskih frekvencija:

233

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Vrijednost svake elije tabele moe se dobiti tako da se zbir kolone (K)
kojoj pripada posmatrana elija, podijeli za unupnom veliinom uzorka
(a+b+c+d=n) i pomnoi sa zbirom rada (R) kome pripada elija.
Ovo pravilo vrijedi za izraunavanje teorijskih frekvencija i za tablice
kontingencije koje nisu tipa 2x2.
Za tablicu kontingencije 2x2 teorijske frekvencije, prema datom pravilu
iznose:
( K )
ac
f at
* ( R)
( a b)
N
abcd
( K )
bd
f bt
* ( R)
( a b)
N
abcd
( K )
ac
f ct
* ( R)
(c d )
N
abcd

f dt

( K )
bd
* ( R)
(c d )
N
abcd

U ovom primjeru teorijske frekvencije iznose:

85
225 38,25
500
414
f bt
225 186,75
500
85
f ct
275 46,75
500
415
f dt
275 228,25
500
f at

etvrti korak: Izraunava se empirijska veijednost Hi kvadrata formiranjem


radne tablice:
fo

ft

foi ft i

f o i f t i 2

( f oi f ti ) 2
f ti

75

38,25

36,75

1350,56

35,31

150

186,75

-36,75

1350,56

7,23

10

46,75

-36,75

1350,56

28,89

265

228,25

36,75

1350,56

500

500

234

5,92
2

=77,35

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Peti korak: Odreuje se teorijska (granina) vrijednost Hi kvadrata.


Najprije se odredi stepen slobode koji se za tablice kontingencije rauna po
formuli:
FD=(K-1)(R-1)
gdje je K-broj kolona; R-broj redova.
Kod tablica kontingencije 2x2 je FD=1.
Za FD=1 i p=0,05 iz tablica za Hi kvadrat odredi se granina vrijednost, tj.

gr2 3,841 .
esti korak: Usporeuju se empirijska i granina vrijednost Hi kvadrata i
donosi zakljuak.
Kako je empirijska vrijednost Hi kvadrata

2
em
77,35 vea od teorijske

(granine) vrijednosti gr 3,841 odbacuje se nulta H0 i prihvata radna


hipoteza H1 i zakljuuje:
Izmeu puenja, kao riziko faktora, i oboljevanja od raka plua postoji
povezanost.
Na ovaj nain postupak testiranja je zavren.
Meutim, empirijska veijednost Hi kvadrata ne daje informaciju o stepenu
intanziteta ove asocojacije.
Informacija o stepenu intenziteta povezanosti uzroka i posljedice dobije se
na osnovu tzv. koeficijenta kontingencije koji je definisan kao:
2

2
N 2

to je koeficijent kontingencije vei to je veza izmeu ekspozicije i bolesti


intenzivnija.
Maksimalna vrijednost (koja se moe oekivati) za tablicu kontingencije 2x2
dobija se na osnovu izraza:
C

R 1
R

ili

K 1
K

odnosno

2 1
0,5 0,707
2

to je dobijena vrijednost koeficijenta kontingencije blia maksimalnoj


vrijednosti to je veza izmeu pojava intenzivnija i vea.
Za sluaj povezanosti puenja i raka plua koeficijent kontingencije je:
C

2
77,35

0,37
2
N
500 77,35

235

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Dobijena vrijednost koeficijenta kontingencije blia je maksimalnoj


vrijednosti nego nuli (0,707 - 0,37 = 0,337): C=0,37>0,337 pa se zakljuuje
da postoji visok stepen povezanosti puenja i raka plua.
Primjer 2:
Za vrijeme jedne epidemije gripa obavljena je aktivna imunizacija
odreenog broja osoba i to: 83 lica mrtvom, a 54 ivom vakcinom. Od
vakcinisanih ivom vakcinom oboljelo je 9, a od vakcinisanih mrtvom
vakcinom 34. Strukturna dihotomija predstavljena je grupama osoba koje su
vakcinisane mrtvom, odnosno ivom vakcinom. Funkcionalna dihotomija
predstavlja pojavu, odnosno odsustvo ili prisutstvo gripa. Tablica
kontigencija 2x2 ima sljedei izgled:
Vakcina
Mrtva
iva
Ukupno

Grip
da
34
9
43

ne
49
45
94

Ukupno
83
54
137

Interesuje nas: koja je od ovih vakcina efikasnija?


Rjeenje
Hi-kvadrat e nam pomoi da damo odgovor na to pitanje, tj. da prihvatimo
kao istinitu jednu od dvije sljedee pretpostavke:
Nulta hipoteza: ne postoji znaajna razlika u frekvenciji oboljenja od gripa
izmeu ove dvije grupe vakcinisanih osoba,
Radna hipoteza: postoji znaajna razlika.
Formula za izraunavanje empirijske vrijednosti hi-kvadrata ve je
navedena:
2
n f f
2 oi t i
i 1
ft i
Pod pojmom oekivana frekvencija = ft u sluaju tablica kontigencije 2x2
podrazumijeva se frekvencija, koja bi bila zabiljeena kada bi zaista nulta
hipoteza bila tana, znai, kada bi u obe grupe koje se usporeuju bila ista
frekvencija, a eventualna razlika posljedica sluajnih variranja. Zato se u
ovom sluaju konkretizovanje nulte hipoteze svodi na odreivanje
frekvencije u svih ispitanika, zanemarujui pri tome postojanje grupa.
Oekivana frekvencija nosi u ovom sluaju funkciju nulte hipoteze. Njen
brojani izraz bio bi jednak zbiru svih pozitivnih operacija iz obe grupe u
odnosu na broj svih ispitanika, pa je oekivana frekvencija a c
N

236

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Oekivana frekvencija moe se izraziti kao funkcija tj. dio cjeline i tako
odrediti frekvencija pri nultoj hipotezi za obe grupe (koje se usporeuju) u
osnosu na njihov broj:
ac
a
c

N
ab cd
U naem primjeru je

a c 43

0,314 frekvencija nulte hipoteze.


N
137

Znai, u obe grupe bi trebalo da ispitanici obole od gripa ako bi bila tana
nulta hipoteza. Tj. u grupi koja je dobila mrtvu vakcinu trebalo bi da bude
83*0,314 ispitanika (=26), a onih koji nisu oboljeli 83*0,686 (=57), itd.
Uopteno govorei oekivane frekvencija za tablice kontigencije dobiju se
na osnovu:
a ba c
a bb d
f ta
f tb
n
n
c d b d
c d a c
f da
f tc
n
n
Sad se pristupa formiranju radne tabele
i

fo

ft

foi ft i

f o i f t i 2

( f oi f ti ) 2
f ti

34

26

-8

64

2.46

17

-8

64

3.76

49

57

64

1.12

45

37

64

1.73
2
emp
. 9.07

U tablicama nalazimo, za odgovarajui broj stepena slobode (broj


redova=1)*(broj kolona=1)=DF=1, nalazi se granina vrijednost Hi-kvadrata
2
t2. 6,635 . Kako je empirijska vrijednost emp
. 9,07 vea od granine
2
vrijednosti t . 6,635 prihvata se radna hipoteza sa vjerovatnoom nulte

hipoteze p 0,01 . Drugim rijeima, primjenjene vakcine se po svojoj


efikasnosti znaajno razlikuju. Sada je potrebno odgovoriti na pitanje koja je
od ove dve vakcine efikasnija. Oboljevanje mrtvom vakcinom je 79% u
odnosu na 11% koje predstavlja oboljevanje sa prethodno dobijenom ivom
vakcinom. Iz ovoga je oigledno da je iva vakcina efikasnija.

237

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

5.2.4. Tablice kontigencije tipa razliitog od 2x2


Kada postoje vie od dvije strukturne kategorije (tj. ravanje nije dihotomno)
ili kada se ispituje vie modaliteta obiljeja formiraju se tablice kontigencije
tipa veeg od 2x2. One su tipa rxk, gde je r broj strukturnih kategorija, a k
broj modaliteta ispitivanog obeleja. Postupak rada je analogan ve
objanjenom.
Primjer
U studiji koja je trebala utvrditi vezu izmeu nutricionog statusa i
sposobnosti izvoenja odreenih zadataka uzeto je 400 eksperimentalnih
ivotinja. One su prethodno bile izvjebane da izvre odreene zadatke. Ove
ivotinje podijeljene su u etiri jednake grupe i razliito su hranjene. Poslije
izvjesnog vremena utvrena je sposobnost za izvravanje zadataka koji su po
teini rangirani u tri nivoa.
Teina
zadataka
Lako
Umjereno
Teko
Ukupno

1
3
13
84
100

Tip ishrane
2
3
12
27
62
36
26
37
100 100

4
49
48
3
100

Ukupno
91
159
150
400

Moe li se zakljuiti da ne postoje znaajne razlike izmeu ovih grupa u


odnosu na sposobnosti izvrenja zadataka razliitih teina?
Rjeenje
Formira se radna tabela:
i

fo

ft

foi ft i

f oi ft i 2

( f oi f ti ) 2
f ti

1
2
3
4
5
6
7
8
9
10
11
12

3
12
27
49
13
62
36
48
84
26
37
3

22,7
22,7
22,7
22,7
39,7
39,7
39,7
39,7
37,5
37,5
37,5
37,5

-19,7
-10,7
4,3
26,3
-26,7
22,3
-3,7
8,3
46,5
-11,5
-0,5
-34,5

388,1
114,5
18,5
691,7
712,9
497,3
13,69
68,9
2162,2
132,25
0,25
1190,2
2
emp

17,1
5,04
0,8
30,1
17,9
12,5
0,3
1,7
57,6
3,5
0,007
31,7
178,247

238

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

U radnoj tabeli teorijske vrijednosti frekvencija dobiju se promjenom izraza:


( K )
f it
* ( R)
N
U tablici za Hi kvadrat i broj stepeni slobode DF=(3-1)*(4-1)=6 i p=0,01
2
nalazi se granina vrijednost koja iznosi gr
16,812 . Kako je
2
2
emp
. 178.247 > gr 16,812 prihvata se radna i odbacuje nulta hipoteza i

zakljuuje: Postoje znaajne razlike izmeu ovih grupa ivotinja u odnosu na


sposobnost izvrenja zadataka razliite teine, a pri tome je verovatnoa
nulte hipoteze p 0,01 .
5.2.5. Ogranienja i uslovi za primjenu hi kvadrat testa
1. Ovaj test se moe primjeniti samo na frekvencije (ne moe se primjeniti
na procente, omjere, srednje vrijednosti, itd.).
2.

i 1

i 1

f e i f t i , zbog zaokruivanja mogue su manje razlike.

3. U svaku eliju tablice kontigencije unosi se drugi kontigent ispitanika.


4. Kada je ukupan broj frekvencija manji od 20, ne moe se primjeniti ovaj
test.
5. Suvie velike i suvie male vrijednosti za empirijske vrijednosti hi-kvadrat
testa mogu da ukau na greku u strukturi radne tablice.
6. U tablicama kontigencije 2x2 i kod ukupnog broja frekvencija izmei 20 i
40, ni jedna frekvencija ne smije biti manja od 5.
5.2.6. Zakljuak
Upoznali smo se sa postupkom testiranja hipoteza pomou hi-kvadrat testa
koji mjeri odstupanje izmeu opserviranih (fe) i oekivanih (teorijskih ft)
frekvencija smjetenih u diskretnim kategorijama.
Testovi slaganja i tablice kontigencije najee se pojavljuju u praksi.
Iako je formula identina ovi testovi se sutinski razlikuju.

239

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

6. Regresija i korelacija - dnos dvije promjenjive veliine, modeliranje,


predvianje
6. 1. Regresija modeliranje odnosa i njihova analiza
6. 1. 1. U vod
U analiziranju podataka esto se osjea potreba za saznavanjem odnosa
izmeu dvije (ili vie) promjenljive veliine. Na primjer: moe nas
interesovati veza i odnos krvnog pritiska i godina starosti, tjelesne visine i
teine, intezivnosti stimulusa i vremena reakcije, itd. Prirodu i jainu odnosa
izmeu dvije promjenjive veliine (dva obiljeja) moemo otkriti pomou
dvije statistike metode. To su metoda regresije i metoda korelacije.
Regresija otkriva tip (oblik) povezanosti izmeu odabranih obiljeja, s jedne
strane, a istovremeno omoguava predvianje vrijednosti jedne promjenjive
veliine na osnovu datih vrijednosti za drugu promjenjivu veliinu.
Korelacija mjeri jainu ve utvrene povezanosti izmeu dva obiljeja.
U ovoj grupi naa razmatranja su ograniena na utvrivanje linearnog
odnosa izmeu dvije promjenjive veliine.
6.1.2. Regresioni model
Opti oblik regresionog modela predstavljen je fujkcionalnom vezom
regresionom funkcijom f izmeu bar dvije varijable:
y = f(x)
Ova funkcionalna veza u regresiji ne znai da za svako x, vrijednost y mora
biti f(x), nego da je oekivana vrijednost za y ba f(x).
Funkcionalni oblik povezanosti ide od linearnog (kada je funkcija linearna u
svojim parametrima, ali ne neophodno i linearna u zavisnoj varijabli):
y = a + bx
(kada su dvije varijable)
ili
y = b0 + b1x1 + b2x2 + ... + bnxn
(kada je n nezavisnih varijabli u pitanju)
do poligona opteg stepena
y = b0 + b1x1 + b2x2 + ... + bnxn.
U tipinom regresionom problemu, kao i u veini problema u primjenjenoj
statistici, na raspolaganju je samo uzorak opservacija koji je potekao iz neke
realne (ili hipotetike) populacije. Na osnovu rezultata analize uzorakih
podataka potrebno je donijeti zakljuak o populaciji iz koje potiu podaci.
240

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Da bi se to napravilo potrebno je populaciju poznavati u toj mjeri da je


mogue konstruisati matematiki model koji e je predstavljati ili da se
dobije dovoljno elemenata za slaganje (fitovanje) populacije sa ve poznatim
i unaprijed datim modelom.
Najjednostavniji od svih regresionih modela je linearni regresioni model sa
dvije varijable X i Y. Varijabla X je nezavisna varijabla i u eksperimentu je
najee pod kontrolom. Vrijednosti ove varijable se biraju i za svaku od
izabranih vrijednosti dobija se jedna ili vie vrijednosti varijable Y. Varijabla
Y je zavisna varijabla pa se govori o regresiji Y nad X. Obino se ovaj
tegresioni model oznaljava kao Model I u sluaju da nezavisna varijabla X
ne varira sluajno nego se, u eksperimentu, mijenja pod kontrolom
istraivaa (npr., izbor doze lijeka za ispitivanje krvnog pritiska) a zavisna
varijabla Y je sluajno promjenjiva veliina. Obe varijable normalno se
raspodjeljuju i varijansa oko regresionog modela je konstanta.
Regresioni model moe biti i Model II u sluaju kad su obe varijable
sluajno varirajue, tj. kada su podlone prirodnoj razliitosti i/ili grekama
mjerenja.
Pretpostavke za ovaj linearni model su: normalnost, linearnost, nezavisnost i
jednakost varijansi.
Normalnost, oekuje da su vrijednosti Y za svaku vrijednost nezavisne
varijable X normalno raspodjeljene da bi procedure zakljuivanja
(ocjenjivanje i testiranje hipoteza) bile validne.
Linearnost, oekuje da su aritmetike sredine subpopulacija vrijednosti Y
sve na jednoj pravoj liniji, to se iskazuje jednainom:
y/x= + x
gdje je y/x aritmetika sredina subpopulacionih Y vrijednosti dobijenih za
svaku vrijednost X, a i su populacioni regresioni koeficijenti.
Geometrijski a i b su odsjeak i nagib prave linije na kojoj sve aritmetike
sredine lee.
Nezavisnost, Vrijednosti varijable Y iz uzorka za jednu vrijednost varijable
X ni na koji nain ne zavise od vrijednosti varijable Y dobijene za neku
drugu vrijednost varijable X.
Jednakost varijansi, oekuje se da su varijanse subpopulacija Y sva meu
sobom jednake.
Sve ove pretpostavke mogu se sumirati u jednu jednainu poznatu kao
regresioni model:
y = + x +
241

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

gdje je x vrijednost varijable X koja je nezavisna (eksperimentalna,


kontrolisana ili prediktivna varijabla); y je tipina vrijednost iz jedne od
subpopulacija vrijednosti zavisne varijable Y (rezultujua varijabla); i su
populacioni regresioni koeficijenti; je greka, odnosno, odstupanje y od
aritmetike sredine podskupa na osnovu kojeg se ta varijabla ispituje ( Y ); Y
je normalno rasporeena varijabla.
6.1.3. Regresiona analiza
Regresiona analiza prolazi sljedee korake:
1. ispitivanje pretpostavki za primjenu
2. dobijanje jednaine koja najbolje odgovara podacima
3. procjena adekvatnosti jednaine zbog predvianja i ocjenjivanja
4. predvianje i ocjenjivanje na osnovu uzorakih podataka u sluajevima
kada je potvreno slaganje sa linearnim modelom.
Kad regresioni model koristimo za predvianje, predvia se vrijednost Y
koja je najvjerovatnija za datu vrijednost X. Kad se taj isti model koristi za
ocjenjivanje, ocjenjuje se prosjena vrijednost podskupa vrijednosti Y za
koje se pretpostavlja da postoje za datu vrijednost od X.
Primjer
U psihijatrijskoj klinici mjeren je nivo odgovora na program motivacione
terapije. Standardni test je dostupan ali veoma komplikovan, pa istraivai
predlau novi, laki test. Da li se stari test moe zamijeniti novim? Dobijeni
podaci dati su u tabeli 6.1.3.1.
Tabela 6.1.3.1: Parovi podataka za staru i novu metodu
Pacijent

10

11

Skor na starom testu X

50

55

60

65

70

75

80

85

90

95

100

Skor na novom testu Y

61

61

59

71

80

76

90

106

98

100

114

Da bi se dobila predstava o funkcionalnom odnosu Y i X obino se crta tzv.


dijagram rasipanja (rasturanja) (Slika 6.1.3.1). Izmjerene vrijednosti u
uzorku (y1, x1), (y2, x2), ... (yn, xn) predstavljaju skup raaka u ravnini XOY
sa pravom linijom koja ih opisuje.

242

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Dijagram rasipawa skorova pri testirawu

Skor na novom testu

120
100
80
60
40
20
0
0

20

40

60

80

100

120

Skor na starom testu

Slika 6.1.3.1: Dijagram rasipanja skorova pri testiranju


Jednaina koja najbolje odgovara izmjerenim vrijednostima u uzorku: y = a
+ bx sadri koeficijente a i b koji se izraunavaju iz uslova da odstupanja
izmjerenih vrijednosti yi u uzorku i vrijednosti izraunatih iz vrijednosti xi,
budu to manja metoda najmanjih kvadrata.
Zbir kvadrata tih odstupanja dat je sa:
n

Y
i 1

(a bX i ) F (a, b)
2

Vrijednosti a i b treba odrediti tako da funkcija F(.) ima najmanju moguu


vrijednost, to znai da srednje kvadratno odstupanje bude minimalno. U
cilju jasnijeg prikaza vrijednosti za a i b, koji zadovoljavaju prethodni uslov,
uveemo jednostavnije oznake:
- Suma kvadrata pojedinanih odstupanja Xi od aritmetike sredine X :
( X i ) 2
2
2
2
x (X i X ) X i n
- Ukrteni proizvod proizvod razlika od svojih aritmetikih sredina:
( X i Yi )
xy ( X i X )(Yi Y ) X iYi n
- Suma kvadrata pojedinanih odstupanja Yi od aritmetike sredine Y :
( Yi ) 2
2
2
2
y

(
Y

Y
)

i
i
n
Na osnovu datih izraza odreuju se:
- najbolja ocjena parametra b, koji se naziva i regresioni parametar:

243

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

xy

X Y

i i

2
i

( X i )( Yi )

n
( X i ) 2

n X i Yi ( X i )( Yi )
n X i2 ( X i ) 2

- najbolja ocjena parametra a, koji se naziva i odsjeak na Y osi (za X=0):


a Y bX
U radnoj tabeli prikazano je kompletno izraunavanje potrebno za
definisanje jednaine linearne regresije:
Tabela
Pacijent

XY

X2

Y2

50

61

3050

2500

3721

55

61

3355

3025

3721

60

59

3540

3600

3481

65

71

4615

4225

5041

70

80

5600

4900

6400

75

76

5700

5625

5776

80

90

7200

6400

8100

85

106

9010

7225

11236

90

98

8820

8100

9604

10

95

100

9500

9025

10000

11

100

114

11400

10000

12996

825

916

71790

64625

80076

Xsr
Ysr

1.12364

-1

75.000
83.273

Regresiona jednaina je Y = - 1.000 + 1.236 X

Konano se dobije y ocijenjeno tj.

Y 1.000 1.124 X
jednaina za koju vai da je suma kvadriranih rezidualnih odstupanja

empirijskih vrijednosti (Yi) od dobijene linije ( Y ) manja od sume


kvadriranih rezidualnih odstupanja od bilo koje druge linije.
Dakle skorovi na standardnom i novom testu modeliraju se linearnom
jednainom.
Pitanje koje se postavlja je koliko dobro ovaj model opisuje empirijsku
situaciju. To znai da se prije upotrebe novog testa u smislu zakljuivanja da
li se on moe preporuiti za dalju upotrebu treba ispitati njegova adekvatnost
za ispitivanu eksperimentalnu situaciju. Ispitivanje adekvatnosti
preporuenog testa vri se procjenom regresione jednaine.
244

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Procjena se sastoji od: testiranja znaajnosti koeficijenta determinacije,


izraunavanjem standardne greke procjene ili reziduala i testiranjem
koeficijenta nagiba regresionog modela.
6.1.4. Evaluacija regresionog modela
Kad se izrauna linearna regresiona jednaina mora biti evaluirana da bi se
odredilo da li ona adekvatno opisuje odnos izmeu dvije varijable i da li se
efektivno moe koristiti u ocjenjivanju i/ili predvianju.
Evaluacija je bazirana na ispitivanju nagiba regresione jednaxbe i na
ispitivanju koeficijenta determinacije.
Nagib regresione jednaine trebao bi biti znaajno razliit od nule, odnosno
treba odbaciti nultu hipotezu H0 da je b=0. U suprotnom, teorijski se
pokazuje da su takvi modeli po pravilu nelinearnog tipa ili su linearni, ali bez
znaaja za predvianje. Ispitivanje ove hipoteze moe se sprovesti
primjenom analize varijanse i F statistike ili primjenom t statistike.
Osim nagiba potrebno je procijeniti i jainu regresione jednaine tako da se
usporedi rasipanje uzorakih taaka oko regresione linije sa njihovim

rasipanjem oko Y , odnosno da se izrauna koeficijent determinacije r2.


Koeficijent determinacije
Procjena regresione
determinacije r2:

(Y Y )
(Y Y )

jednaine

poiva

na

tumaenju

koeficijenta

2
2

uz koritenje oznaka iz analize varijanse (ANOVA) slijedi:


C
x
Cy
Imenilac C y CUKUPNO (Yi Y ) 2 predstavlja totalno variranje, odnosno,
mjeri vertikalno odstupanje bilo koje take Yi od prave Y Y , a brojilac
predstavlja organizovano, faktorsko, variranje tj.

C x C REG (Yi Y ) 2

( X i Yi

X Y )

2
i

n
( X i ) 2

b xy

jer pokazuje koliko se redukuje totalno variranje kada se regresiona linija Y


ocjenjuje prema takama Yi.
245

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjena analize varijanse i F statistike u testiranju znaajnosti razlike


koeficijenta od nule.
Ukoliko bi vrijednost populacionog koeficijenta u jednaini
Yi X i bila jednaka nuli moglo bi se zakljuiti da ne postoji
povezanost izmeu varijable X i Yi, odnosno da na nivou populacije
promjene vrijednosti X ne utiu na promjene vrijednosti Y. Ispitivanje ove
povezanosti moe se sprovesti testiranjem nulte hipoteze (H0: = 0) prema
alternativnoj hipotezi koja govori u prilog tome da je 0 (HA: 0 ).
Ukoliko je vjerovatnoa dobijena u postupku izraunavanja koeficijenta
mala (uobiajene vrijednosti su 0.05 i 0.01 ili manje) tada se odbacuje nulta
H0 a prihvata radna HA hipoteza (uz prihvatanje rizika koji sa sobom nose
greke prvog (a) i drugog (b) reda u statistikom zakljuivanju).
Posmatranjem varijabiliteta na ukupnom, regresionom i rezidualnom nivou,
dolazi se do zakljuka da se na osnovu vrijednosti ukupnog i regresionog
variranja moe izraunati rezidualno variranje CREZ = CUKUPNO CREG.
U tabeli 6.1.4.1. dat je sumarni pregled izraunavanja potrebnih za testiranje
nulte hipoteze H0: = 0 protiv alternativne hipoteze HA: 0 .
Tabela 6.1.4.1:

Variranje

Disperzija (suma

DF (broj

kvadrata

stepeni

odstupanja)

slobode)

CUKUPNO

n-1

CREG

CREZ

n-2

Varijansa
(srednja kvadratna greka)

Ukupno
[Yi - Y ]
Linearna
regresija

2
SDRSEG

[ Yi Y ]
Rezidualno

[Yi - Yi ]

246

2
SDREG

CREG
DFREG

C REZ
SDYX
DFREZ

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Zakljuak o prihvatanju ili odbacivanju nulte hipoteze donosi se na isnovu


usporeivanja empirijske i tabelarne vrijednosti varijansnog omjera., tj
usporeuje se:
2
SDREG
sa tabelarnom vrijednou Fa(1), DF1,DF2, gdje su DF1=1 i
Femp
2
SDREZ
DF2=n-1 odgovarajui stepeni slobode. Zakljuak o prihvatanju nulte
hipoteze donosi se ukoliko je Femp Ftabl, u protivnom se nulta hipoteza
odbacuje.
Za prethodni primjer o testovima na psihijatrijskoj klinici vrijedi:
Disperzija X:

( X i X ) 2 X i2

X
n

64625

825 2
2750000
11

Y
9162
CUKUPNO (Yi Y ) 2 Yi 2 i 80076
3798,182
n
11
( X
Y)
825 * 916
CREG b xy b( X iY i i i 1.123 * (71790
3472,036
n
11

CREZ CUKUPNO CREG (Yi Y i )2 3798,182 3470,036 326,145

C REG
C
REG 3472.036
DFREG
1
C
326,145 326,145
REZ

36,238
DFREZ
n2
9

2
SDREG

2
SDREZ

2
SDREG
3472,036

95,812
2
SDREZ
36,238
Kako je tablina vrijednost Fa(1),1,9=5,12 manja od Femp 95,812 odbacuje se
nulta a prihvata alternativna hipoteza i zakljuuje da se vrijednost
izraunatog nagiba statistiki znaajno razlikuje od nule.
Srednja kvadratna greka reziduala (standardna greka ocjene ili standardna
greka reziduala) oznaava se sa SEXY i izraunava se prema:

Femp

2
SEYX SDREZ
36,238 6,0198
Konano, regresiona jednaina se moe napisati i u obliku:

Y 1.00 1.124 X (6,02)


Standardna greka ocjene (ili standardna greka regresije) je ukupni
pokazatelj tanosti sa kojom izraunati regresioni model predvia zavisnost
Y na X.

247

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Procenat totalnog variranja, koji je objanjen ili izraunat sa regresionom


linijom (u ovom sluaju r2 = 0.91), koristi se za sljedee tumaenje: 91%
variranja zavisne varijable (skor na novom testu) objanjen je nezavisnom
varijablom (skor na starom testu) a samo 9% variranja zavisne varijable
ostaje nerazjanjeno. Znaajnost r2 odreuje se usporedbom dobijenog i
tablinog r2.
Testiranje znaajnosti nulte hipoteze upotrebom t-testa
Za testiranje nulte hipoteze (H0: = c) moe se koristiti i t-test koji u optem
obliku izgleda:
t

( parametar _ koji _ se _ procjenjuj e) ( parametar _ kojim _ se _ usporedjuje)


s tan dardna _ greska _ parametra _ kojim _ se _ usporedjuje

U naem sluaju je: c=0, a standardna greka je

SEb

2
SEYX

(X

X )2

jer je varijansa od

SE
2
b

2
SEYX

(X

X )2

Uz
2
SEYX
36,238
SEb

0.115
2
2750
(Xi X )

slijedi da je:
t

b c 1,124 0

9,774
SEb
0,115

Za broj stepeni DF=n-2 = 11-2 = 9 i p=0,05 dobije se tablina (granina)


vrijednost za t: t0.05(2);9 = 2,262.
Kako je empirijska vrijednost t-testa t=2,2774 vea od granine vrijednosti
tgr = 2,262 odbacuje se nulta i prihvata alternativna hipoteza, to znai da je
vrijednost koeficijenta b statistiki znaajno razliita od nule.
Interval povjerenja za nagib u regresionoj jednaini
U mnogim sluajevima poznavanje standardne greke statistike omoguava
da se izrauna interval povjerenja parametra koji se procjenjuje, prema
optem obrascu:
Interval povjerenjaje = Statistika (t) (SE statistike).
Interval povjerenja za koeficijent regresije na nivou vjerovatnoe
(1-/2) dat je sa:
b t(1-/2), (n-2) Sb,
pri emu je donja granica povjerenja
L1 = b t(1-a/2), (n-2) Sb,
248

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

a gornja
L2 = b + t(1-a/2), (n-2) Sb,
Kako je tablina vrijednost za t(1-/2),
konano
L1 = 1,1235 2,262x0,115 = 0,8631
L2 = 1,1235 + 2,262x0,115 = 1,38377
odnosno:
[L1 L2] : [0,8631 1,38377]

(n-2)

= 2,262 a Sb = 0,115 onda je

Koritenje regresione jednaine


Ako rezultat evaluacije regresione jednaine ukazuje da postoji povezanost
izmeu varijabli od interesa tada se ta jednaina moe koristiti na dva
naina.
Prvi je predvianje Y vrijednosti koja je najvjerovatnija za odreenu
vrijednost X. Za ovu predvienu vrijednost moe se izraunati i interval
predikcije.
Drugi je ocjenjivanje aritmetike sredine podskupa vrijednosti Y za koje se
pretpostavlja da postoje za bilo koju vrijednost X. I u ovom sluaju moe se
izraunati interval povjerenja ove ocjene. Ovdje e se prikazati samo prvi
nain.
Predvianje Y za dato X
Standardna grea prognoze za neku konkretnu vrijednost data je sljedeom
formulom:

SE
Y YX

(X i X )2
2 1
SE
[

]
YX n
(X i X )2

U sluaju da je Xi = 0 bie Yi a , odnosno odsjeak na osi Y. Zamjenom Xi


= 0 sljedi da je:
2

1
X
SE a SE [
]
n ( X i X )2
2
YX

Za X = 70 Yi 1.000 1.123 * 70.00 77.655 uz odgovarajui interval


povjerenja za predvianje koji iznosi:

y t (1 / 2) SEYX

( X p X )2
1

n ( X i X )2
249

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

gdje je t tablina vrijednost za DF=n-2=11-2=9 i p=0.05, koja iznosi t(1a/2);0.05 = 2.262. SEYZ je standardna greka predikcije koja iznosi:

(Y Y ) 2
326,145
SEYZ i

36,238 6,020
n2
11 2
Odavde slijedi da je interval povjerenja za predvianje dat sa
1 (70 75) 2
Y 77.655 2.262 * 6.020

77.655 4.306
11
2750

odnosno, interval povjerenja za predvianje za x=70 [73,35 81,96].


Inverzno predvianje
U sluaju kada na osnovu odreene vrijednosti Yu treba predvidjeti
vrijednost Xi koristi se jednaina

Y a
X i
b
Na osnovu ove jednaine je
y = 73,35 x=x0.
Poreenje dvije linije regresije
Poreenje dvije (ili vie) linija regresije est je problem, bilo da su u pitanju
odnosi istih varijabli u dvije razliite populacije (ee) ili vie razliitih
populacija (rjee). Pri tome se mogu porediti samo odsjeci (a), nagibi (b) ili
zajedno i jedni i drugi.

(A)

(B)

(C)

(D)

Slika 6.2. Ilustracija poreenja regresionih linija

250

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Na dijelu A slike 2 prikazana je situacija sa dvije regresione linije koje imaju


iste nagibe a razliite odsjeke, B predstavlja dvije regresione linije sa istim
odsjecima a razliitim nagibima, C predstavlja regresione linije sa razliitim
odsjecima i razliitim nagibima, D predstavlja dvije regresione linije sa
istim odsjecima i istim nagibima.
Usporedba nagiba
Za usporedbu nagiba primjenjuje se:
b b2
; gdje su b1 i b2 nagibi dvije regresione jednaine a
t 1
SEb1 b2
SEb1 b2

2
( SDYX
)p

( ( X i X ) 2 )1

2
( SDYX
)2

( ( X i X ) 2 ) 2

je standardna greka, dok je zajednika rezidualna prosjena suma


odstupanja
(C REZ )1 (C REZ ) 2
2
( SDYX
)p
( DFREZ )1 ( DFREZ ) 2
sa (n1 + n2 4) stepena slobode.
Primjer 1.
U tabeli 4 prikazani su rezultati dobijeni na dva uzorka iz dvije razliite
populacije, pri emu je H0: b1 = b2 i H1: b1 b2
Tabela 4. Sumarni podaci dva uzorka iz dvije razliite populacije
Parametar

Uzorak 2

1579,86

2138,71

4413,42

3245,68

13325,3

5981,25

N
B
CREZ

26
2,79
996,51

30
1,52
1055,65

DFREZ

24

28

(X i X )

xy ( X
y

Uzorak 1

X )(Yi Y )

(Yi Y ) 2

251

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Na osnovu vrijednosti u Tabeli 4 mogue je izraunati:


4413,42
3245,68
1,52
2,79 b2
2139,71
1579,86
(4413.42)2
C1 13325,63
996,51
1579,86

b1

(3245,68)2
1055,65
2138,71
996,51 1055,65
2
SDYX

39,46
24 28
39,46
39,46
2,79 1,52
SEb1 b2

0,21 t
6,05
1579,86 2138,71
0,21
(SDyx)2p = 39,46
SEb1-b2 = 0,2
t = 6,05
Za DF = 52 tablina vrijednost t0.05;52 = 2,007. Na osnovu svega odbacuje se
H0 jer je p < 0,001, to znai da se vrijednosti regresionih koeficijenata
statistiki znaajno razlikuju jedna od druge.
C2 5981,25

Primjer 2.
U tabeli 5 prikazani su rezultati dovijeni primjenom dvije metode mjerenja I
i II. Usporedbom nagiba b1 i b2 i odsjeaka a1 i a2 donijeti zakljuak o
mogunosti zamjene jedne metode mjerenja drugom.
Tabela 5. Dvije metode mjerenja
n
1
2
3
4
5
6
7
8
9
10
11
12
13

X1
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
3,25
3,5

Y1
10
8
12
12
14
12
14
18
17
20
18
20
21

X1Y1
5
6
12
15
21
21
32
40,5
42,5
55
54
65
73,5

X2
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
3,25
3,5

252

Y2
15
14
15
12
13
15
16
17
20
19
20
21
22

X2Y2
7,5
10,5
15
15
19,5
26,25
32
38,25
50
52,25
60
68,25
77

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Parametar

Metod I

Metod II

13

13

Suma X

26.00

26.00

Suma X2

63.375

63.375

Suma Y

198.000

219.000

Suma Y

3.226.000

3.815.000

Suma XY

442.500

471.500

Xsr

2.000

2.000

Ysr

15.231

16.846

( X i X )2

Primjer 3.
Eksperiment je tako planiran da daje podatke o uinku odreenog lijeka na
smanjenje broja otkucaja srca u minuti. U njemu je uestvovalo 6 odraslih
ispitanika. Nezavisno promjenjiva veliina je doza lijeka u miligramima, a
zavisno promjenjiva veliina je razlika izmeu broja otkucaja poslije i prije
davanja (istog) lijeka:
Doza X

Redukcija broja

(mg)

otkucaja srcaY

10

12

12

14

16

Prvi korak ka otkrivanju oblika povezanosti izmeu ova dva obiljeja je


dijagram rasturanja koji u ovoj situaciji ima sljedei izgled:

253

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Redukcija broja otkucaja srca (min)

Redukcija broja otkucaja srca Y (min)


18
16
14
12
10
8
6
4
2
0
0

Doza (mg)

Dijagram rasturanja ukazuje na prirodni oblik povezanosti izmeu


ispitivanih obiljeja. Dijagram rasturanja moe se aproksimirati pomou
neke funkcije. Uopteno, funkcija aproksimacije moe imati linearan i
nelinearan oblik. Najee su u upotrebi linearne funkcije. Zbog toga emo
se i mi u ovom sluaju pozabaviti takvom funkcijom.
Na slici se vidi da se take dijagrama rasturanja grupiu oko prave linije
(y=a+bx), i da porast doze lijeka prati i porast redukcije broja otkucaja srca u
minutu ( b 0 ). Pitanje je koja je od svih pravih linija najbolje prilagoena
svim podacima. Na ovo pitanje odgovor daje metoda najmanjih kvadrata.
Ona omoguava izraunavanje konstanti u jednaini regresije y=a+bx, gdje
je:

SD xy
b
a y b x
SD x2
dok su:

y
y
n

x
x
n

xy
SDxy
xy
n

x2 2
SD
x
n
2
x

Podaci za izraunavanje ovih konstanti dati su u radnoj tabeli:


x
1
2
3
4
5
6
21

y
10
8
12
12
14
16
72

x2
1
4
9
16
25
36
91

254

y2
100
64
144
144
196
256
904

xy
10
16
36
48
70
96
276

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

x 2 =3,5; y 2 =12; SDx 1,71 ; SD y 2,58 ; SDxy 4 ; b=1,37; a=7,205;

r=0,907; r 2 0,822
Zamjenom izraunatih vrijednosti konstanti a=7,205 i b= 1,37, dobijamo da
je: y=7,205+1,37x
Ovo je linearna jednaina koja opisuje povezanost izmeu ispitivanih
obiljeja. Da bi smo ovu pravu linju ucrtali u dijagram rasturanja potrebne su
dvije koordinate, koje emo dobiti ako za dvije proizvoljno odabrane
vrijednosti nezavisno promjenjive (tj. doze ispitivanog lijeka), izraunamo
vrijednost redukcije broja otkucaja srca u minuti:

REDUKCIJA BROJA OTKUCAJA SRCA U MINUTI

za x=1 y=8,575

za

x=3 z=11,315

y=7,205+1,37*x

1
6

y 12

1
2

1
6

Doza
lijeka
(mg)

Slika 6.3. Regresiona zavisnost otkucaja srca i doze lijeka


Sa slike vidimo da prava linija ne prolazi kroz sve take iz dijagrama
rasturanja, tj. take razliito odstupaju od ucrtane prave linije. Meutim, zbir
kvadrata ovih odstupanja je manji od zbira kvadrata odstupanja istih taaka u
odnosu na bilo koju drugu pravu liniju.

255

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Zadaci za vjebu:
Zadatak 1.
Nacrtati dijagram rasturanja i izraunati parametre prave linije koja najbolje
odgovara sljedeim podacima:
Godine X

s. k. p. Y

30

30

30

40

40

40

40

50

50

50

108

110

106

125

120

118

119

132

137

134

60

60

60

60

60

70

70

70

70

70

148

145

146

147

144

162

156

164

158

159

s. k. p. = sistolni krvni pritisak


Rjeenje:

y 68,78 1,3 * x

Zadatak 2.
Sljedei podaci pokazuju optiku gustinu odreene supstance na razliitim
nivoima koncentracije:
Nivo konc. X 80

120

160 200 240

280 320 360

400 440 480

520

Op. gustina Y 0,08 0,12 0,18 0,21 0,28 0,28 0,38 0,4

0,42 0,52 0,52

0,6

Odrediti oblik povezanosti ovih podataka.


Rjeenje:

y 0,012 0,0011* x

6. 1.5. Procjena linije regresije


Kada smo konstruisali liniju regresije treba procijeniti da li ona adekvatno
opisuje povezanost izmeu dva obiljeja. Takva objektivna mjera za
procjenu adekvatnosti naene prave linije je koeficjent determinacije.
Oznaavamo ga sa r 2 , a nalazimo ga iz sljedeeg izraza:
2

y c y

2
r
2

y i y

256

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Oznake u ovoj formuli potiu sa slike:

yi

y
yi y c

yc

yc y

yi y

x
Slika 6.4. Ilustracija uz procjenu linije regresije
Bliskost ovog koeficjenta jedinici oznaava adekvatnost opisivanja
prikupljenih podataka ba tom pravom linijom, a bliskost izraunatog
koeficjenta determinacije nuli znai da je ova prava linija potpuno
neprikladna. Tada je vjerovatno rije o nekom drugom tipu povezanosti koji
nije linearan.
U primjeru 6.1.2.1. izraunaemo i koeficjent determinacije. Da bi olakali
izraunavanje formuliemo radnu tabelu:

yc 7,205 1,37 x

yi y

( yi y) 2

yc y

( yc y) 2

10

8,575

-2

-3,425

11,731

9,945

-4

16

-2,055

4,223

12

11,315

-0,685

0,469

12

12,685

0,685

0,469

14

14,055

2,055

4,223

16

15,425

16

3,425

11,731

40
257

32,846

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

32,846
0,82
40
Rezultat koji smo dobili znai da linija regresije dobro opisuje prikupljene
podatke. Dobijena vrijednost koeficjenta determinacije tumai se pomou
tablica na strani 196/7. Detaljna upotreba tablice bie objanjena u 6.1.6.
r2

6. 1.6. Predvianje pomou regresije


Kao to je u uvodu reeno, linija regresije moe nam posluiti i za
prognoziranje vrijednosti zavisno promenljive veliine ukoliko su poznate
vrijednosti za nezavisno promjenjivu veliinu.
Pretpostavimo da nismo bili u mogunosti da provjerimo dozu od 7,00 mg
lijeka (zadatak 6.1.2.1.), ali nas zanima do koje redukcije broja otkucaja srca
u minuti bi ona dovela. Ovaj problem mogue je rijeiti na osnovu poznate
linije regresije:
z=7,205+1,37x
zamenjujui vrijednost x sa 7,00. Znai, y=7,205+1,37*7,00=16,795 17
6. 1.7. Linearni trend
Linearni trend predstavlja poseban sluaj linearne regresije u kojoj je
nezavisno promjenjiva veliina vrijeme; npr. dani (ponedeljak, utorak,...),
mjeseci (januar, februar,...), godine (1969,1970,...), itd. Iz navedenih
primjera vidimo da je nezavisno promjenjivu veliinu potrebno numeriki
predstaviti, tj. kodirati. Da bi smo to uradili potrebno je uzeti u obzir dvije
stvari: a) zbir novih numerikih vrijednosti jednak je nuli, i b) razmaci
izmeu kodova su jednaki. Po izvrenom kodiranju postupamo kao i kod
nalaenja linije regresije.
Primjer
Data je vremenska serija saobraajnih nesrea za posljednjih devet godina u
jednom mjestu:
Godina (X)

1969 1970 1971 1972 1973 1974 1975 1976 1977

Broj nesrea (Y) 132

136 143 146

154 158 160

162 168

Prognozirati, na osnovu linije trenda, broj saobraajnih nesrea za 1978. i


1979.god.

258

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Numerike vrijednosti za X, po prethodno utvrenom postupku, bie


sljedee: -4, -3,-2,-1, 0 , 1, 2, 3, 4.
Formirajmo radnu tabelu:
x

x2

xy

-4

132

16

-528

-3

136

-408

-2

143

-286

-1

146

-146

154

158

158

160

320

162

486

168

16

672

1359

60

268

x0

y 151
SD x2 6,67
SD xy 29,78
b 4,46
a 151

Znai, linija trenda ima oblik: y 151 4,46 * x


Prognoza broja saobraajnih nesrea za 1978. godinu bie:
y 151 4,46 * 5 173,3 173
a za 1979.god.:
y 151 4,46 * 6 177,76 178
Nacrtajmo jo dijagram rasturanja i ucrtajmo dobijenu liniju trenda:

259

Broj saobra}ajnih nezgoda

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

165
162
160
158
156
154
146
143
136
132

Godine
1969 1970 1971 1972 1973 1974 1975 1976 1977

Slika 6.5. Linija trenda saobraajnih nezgoda


6.2. Korelacija
Obe promjenjive veliine su sluajne, a posmatranja su dobijene na istim
jedinicama (ispitanicima) posmatranja. Mjera jaine povezanosti izmeu
takvih sluajnih promjenjivih veliina je koeficjent linearne korelacije:
r r2
ili alternativna formula:
SDxy
r
SD x SD y
Pozitivni predznak oznaava isti smjer ponaanja ispitivanih obiljeja, a
negativan oznaava suprotan smjer.

Primjer
Podaci se odnose na vrijednosti krvnog pritiska, itane pomou dvije metode
kod ispitanika sa esencijalnom hipertenzijom. U ispitianju je uestvovalo 8
ispitanika.
Ispitiva je elio utvrditi jainu veze izmeu ova dva naina mjerenja
(oznaeni su sa metoda 1 i metoda 2):

260

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Sistolni krvni pritisak 8 ispitanika u mmHg itan


pomou dvije metode
Redni broj
ispitanika
1

Metoda 1.

Metoda 2.

132

130

138

134

144

132

146

140

152

144

158

150

130

122

162

160

Prije svega odreuje se jednaina regresije, tj. prava linija koja najbolje
odgovara dobijenim podacima:
y 6,25 x
Koeficjent determinacije
2

y c y

951,5 0,922
r2
2
103,2

y i y

dobijen je iz radne tabele:

y1 y

yc y

x2

y2

xy

yc

132

130

17424

16900

17160

125.75

81

175.5625

138

134

19044

17956

18492

131.75

25

52.5625

144

132

20736

17424

19008

137.75

49

1.5625

146

140

21316

19600

20440

139.75

0.5625

152

144

23104

20736

21888

145.75

25

45.5625

158

150

24964

22500

23700

151.75

121

162.5625

130

122

16900

14884

15860

123.75

289

232.5625

162

160

26244

25600

25920

155.75

441

280.5625

1162

1112

169726

155600

162468

1032

951.5

261

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Pri tome su:


SDx =10,87 SDy = 11,36 ;
x 145,25 ; y 139 ;
SDxy = 118,75 ;
a = - 6,25 ;
b=1
Znai, koeficjent linearne korelacije je r r 2 0,922 0,96 .
Alternativnu formulu za izraunavanje koeficjenta linearne korelacije,
koristiemo u situacijama kada nije potrebno izraunati liniju regresije.
Potrebno je na kraju protumaiti dobijenu vrijednost koeficjenta linearne
korelacije. Ovo tumaenje se obavlja pomou tablica za granine vrijednosti
koeficijenta linearne korelacije. U presjeku odreenog broja stepena slobode
(broj ispitanika umanjen za dva) i izabrane vjerovatnoe nulte hipoteze
nalazimo teorijsku vrijednost koeficjenta linearne korelacije.
Sve empirijski dobijene vrijednosti, koje su vee od one proitane u tablici
ukazuju na postojanje znaajno visoke (jake) povezanosti meu ispitivanim
obiljejima. Nasuprot tome, izraunata vrijednost koeficjenta linearne
korelacije, koja je jednaka ili manja od one iz tablice, ukazuje na
nepostojanje jake linearne korelacije meu obiljejima.
U naem primjeru broj stepeni slobode je 8-2=6 te u tablici itamo vrijednost
teorijskog koeficjenta linearne korelacije od 0,834 za p 0,01 , koja je
manja od izraunate. To znai da je kod naih podataka utvrena jaka
povezanost. Drugim rijeima, obe metode jednako dobro mjere sistolni krvni
pritisak. Izbor metode za mjerenje sistolnog pritiska zavisi sada od drugih
faktora. Na primjer, jednostavnosti izvoenja, pristupanosti, itd.
6. 3. Opte napomene o upotrebi metoda regresije i korelacije
Obe metode, veoma su mona statistika orua, pod uslovom da se ispravno
primjene. Da bi smo jo jedom ukazali na ispravnu upotrebu ovih metoda
upuujemo na sljedee momente:
1. Detaljna analiza prikupljenih podataka u odnosu na izabrani model (misli
se na regresiju, odnosno korelaciju).
2. Sva mjerenja obiljeja, iju vezu ispitujemo, moraju biti obavljena na
istom ispitaniku.
3. Ma kako jaka bila veza izmeu dva objljeja, ona nam ne daje podatak o
tome ta je uzrok, a ta posljedica. O ovom ljekar sam donosi zakljuak.
4. Ekstrapolacija, tj. predvianje izvan granica datih podataka, moe biti
riskantno, jer veza koju smo uoili na odreenom intervalu moe da mijenja
ovaj oblik izvan njega.

262

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

6. 4. Zakljuak
a) Upoznali smo se sa linearnom regresijom i korelacijom.
b) Naglasili smo metod identifikovanja modela, tj. oznaili smo u kojim
situacijama regresija, a u kojim korelacija daje odgovor na pitanje koje nas
interesuje.
c) Opisali smo proces dobijanja jednaine regresije.
d) Uoli smo postupak za procjenu dobijene linearne regresije pomou
koeficjenta determinacije.
e) Upoznali smo se sa linearnim trendom, koji predstavlja poseban sluaj
linije regresije.
f) Na kraju smo otkrili jainu veze meu ispitivanim obiljejima pomou
koeficjenta linearne korelacije.
6. 5. Korelacija ranga
U neparametarske analitike metode ubraja se i korelacija ranga. Ovo je
jednostavan ali manje pouzdan metod ispitivanja paralelizma a upotrebljava
se u onim situacijama kad se ne smije koristiti odgovarajui parametarski
korelacioni metod.
Primjena neparametarskih metoda analize, od kojih je jedna i
neparametarska korelacija, karakteristina je za slijedee sluajeve:
a) Kada su klasni intervali naglaeno nejednaki;
b) Kada postoje suvie veliki ekstremi;
v) Kada mjerno-numeriki nisu potpuno definisani (zna se samo da je jedan
lan vei ili manji od prethodnih).
Metod korelacije ranga sastoji se u procjeni jaine povezanosti dvije
distribucije rangova empirijskih podataka. Procedura ispitivanja stepena
povezanosti primjenom ovog metoda sastoji se od:
- formiranje distribucije rangova promjenjivih veliina;
- odreivanje koeficijenta korelacije ranga;
- procjena vrijednosti koeficijenta korelacije ranga.
Prvi korak u ovom metodu ispitivanja jaine povezanosti je formiranje
distribucije ranga posebno za svaku promjenjivu veliinu. To znai da
podatke jedne promjenjive veliine treba transformisati u rang (numeriki
izraz rastueg ili opadajueg redoslijeda).
Pri rangiranju, mora se voditi rauna o:
a) broj rangova mora biti jednak broju podataka;
b) jedinice posmatranja koje imaju vrijednost obiljeja moraju imati i isti
rang. Rang istih vrijednosti obiljeja posmatranja (vezani rang) predstavlja
263

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

prosjenu vrijednost broja mjesta koje odgovarajue jedinice posmatranja


zauzimaju u ureenom nizu podataka. Kontrola tanosti rangiranja u jednoj
statistikoj seriji vri se primjenom izraza:
n(n 1)
R 2
Nakon rangiranja odreuje se jaina i smjer povezanosti rangova. Mjera
povezanosti je koeficijent korelacije ranga. Najee koriten je Spirmanov
(Spearman) koeficijent korelacije ranga koji se dobija pomou izraza:
n

6 * * d i2
i 1
2

n(n 1)
Spirmanov koeficijent dobija se na slijedei nain:
1. Rangiraju se vrijednosti i jednog i drugog obiljeja od 1 do n (n-broj
podataka);
2. Uspostavi se razlika u rangovima d za isti par podataka oduzimanjem
ranga za Y od ranga X;
3. Tako dobijena razlika kvadrira se, a potom se svi kvadrati saberu;
4. Izrauna se ;
5. Protumai se dobijeni koeficjent korelacije ranga pomou tablice.
Kada je broj parova n 10 znaajnost dobijenog koeficjenta korelacije
ocjenjuje se pomou kriterijuma t-testa. Vrijednost t izraunava se iz izraza:
n2
t *
1 2
Znaajnost veze procjenjuje se pomou t-tablica za n-2 stepeni sloboda. to
je vjerovatnoa nulte hipoteze p manja, veza izmeu obiljeja je jaa.
Zapravo, nulta hipoteza podrazumijeva da izmeu rangova dva poreena
obiljeja nema veze (korelacije). Kada je empirijska t-vrijednost vea od
tabline t-vrijednosti za odabranu vjerovatnou nulte hipoteze (0,05 ili 0,01)
kod n-2 stepena slobode, veza (korelacija) je ubjedljiva.

264

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 1.
U ispitivanju povezanosti izmeu godina starosti i nalaza EEG-a uestvovalo
je 20 ispitanika, podaci su dati u tabeli:
godine X 20 21 22 24 27 30 31 33 35 38 40 42 44 46 48 51 53 55 58 60
EEG Y 98 75 95 100 99 65 64 70 85 74 68 66 71 62 69 54 63 52 67 55

Formiramo radnu tabelu:


Red.br.

rang X

rang Y

d2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

20
21
22
24
27
30
31
33
35
38
40
42
44
46
48
51
53
55
58
60

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

98
75
95
100
99
65
64
70
85
74
68
66
71
62
69
54
63
52
67
55

18
15
17
20
19
7
6
12
16
14
10
8
13
4
11
2
5
1
9
3

-17
-13
-14
-16
-14
-1
1
-4
-7
-4
1
4
0
10
4
14
12
17
10
17

289
169
196
256
196
1
1
16
49
16
1
16
0
100
16
196
144
289
100
289

0,76 * a * t 4,99
Kako je empirijska t-vrijednost t=4,99 vea od tabline t-vrijednosti tj.
t=2,88 za vjerovatnou nulte hipoteze od 0,01 kod DF = 18 (stepen slobode)
zakljuujemo da je veza (korelacija) vrlo jaka. Negativan predznak oznaava
da je povezanost obrnutog smjera izmeu ispitivanih obiljeja.

265

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Primjer 2.
Grupa od 9 ispitanika odgovarala je na testove inteligencije i kreativnosti.
Rezultati ovih testova dati su u sledeoj tabeli:
Skor 1 (X)

100

110

102

101

115

118

120

119

119

Skor 2 (Y)

30

28

20

20

20

18

35

32

26

Utvrditi da li postoji povezanost izmeu inteligencije i kreativnosti.


Formirajmo radnu tabelu:

Rx

Ry

d2

100

30

-6

36

110

28

-2

102

20

101

20

-1

115

20

118

18

25

120

35

119

7,5

32

-0,5

0,25

119

7,5

26

2,5

6,25

76,5

Iz tablice se proita teorijska vrijednost 0,6000. To znai da ne postoji


linearna povezanost izmeu inteligencije i kreativnosti.

266

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

7. Statistike tablice
4758
5754
9994
7267
5134
7896
7830
1855
1356
5375
2906
1971
6479
8110
6890

0945
6726
9288
0906
8775
5508
4999
4812
0878
0535
9790
3983
8425
8431
8883

9604
9072
1920
2759
8051
6200
3010
3679
2751
8289
0916
9107
6683
1756
2524

Mala tablica sluajnih brojeva


3616
1421
0721
1673
2374
1030
0378
2761
8520
0349
1821
8418
6140
8121
3074
4679
6649
2107
5481
4746
3908
1217
1608
2540
5073
2524
6085
1031
6018
7195
1581
4643
0041
9256
4721
4484
2565
8963
6535
0851
0142
0560
1123
2042
0353
3643
5616
3609
7973
0708
1225
5952
7940
6734
3452
8983
6375
3907
6618
9681

7824
4745
5967
1713
3804
4892
8484
6266
9469
6207
0274
2925
2702
4350
0864

6848
5851
5106
7657
9569
6196
9499
4098
6790
0362
4139
4224
4331
8034
4650

0739
7321
2113
0121
1719
0106
7201
4001
8964
0829
3103
5434
8935
1712
6168

7508

6079

2041

4531

1073

8268

3539

9093

8375

3746

1615

3030

3704

4347

6537

5031

8994

5461

6463

6895

1692

8330

8062

3962

6743

0442

7792

4714

7347

4709

4941

9217

3767

9192

7094

9855

3893

1148

3515

7037

3518

8577

8248

0113

7401

3926

0368

2170

2034

1785

3070

8418

5587

0712

5105

3590

1707

7531

4151

8954

8296

5103

5984

6151

8180

4965

5725

4171

3593

6849

1696

2761

5678

5603

1671

4242

2302

7598

5258

0292

0302

0155

1081

1778

5302

2424

5724

5719

4820

3355

3053

8665

2925

1271

2724

3419

4943

0807

7271

7074

5009

7585

6212

4947

4855

5593

8272

6790

0234

8753

8154

7178

7049

9839

4306

6560

6096

6538

2487

5856

6813

5228

8793

7847

1075

7697

0102

7837

0157

4974

2897

9309

9018

8991

5729

7620

9393

8785

4526

4640

4111

3714

6987

3020

0295

6763

9750

0321

5142

2945

3339

2352

9766

6702

0823

2681

2052

1702

0121

6423

8991

2735

3357

9100

3143

7632

2955

0107

1464

0726

7381

7001

5046

8143

2495

9797

5873

9153

2452

4981

6124

4499

2866

7380

6590

9123

6247

9842

7847

1803

4833

5038

6916

4253

3601

4665

8768

8916

5475

7361

7401

8915

3255

6930

8691

8186

2581

5589

8970

5202

0091

2920

3771

3214

9387

5193

9793

6861

5774

9595

8051

2323

6138

6525

9071

2150

2760

6896

8398

1271

3944

0446

4409

8050

7337

5601

1527

3207

7271

6274

2023

0942

3580

0705

5522

0638

9572

8665

9892

4813

267

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Povrine ispod krive normalne distribucije


z

xx
SD

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9

0000
0398
0793
1179
1554
1915
2257
2580
2881
3159
3413
3643
3849
4032
4192
4332
4452
4554
4641
4713

0040
0438
0832
1217
1519
1950
2291
2611
2910
3186
3438
3665
3869
4049
4207
4345
4463
4564
4649
4719

0080
0478
0871
1255
1628
1985
2324
2642
2939
3212
3461
3686
3888
4066
4222
4357
4474
4573
4656
4726

0120
0517
0910
1293
1664
2019
2357
2673
2967
3238
3485
3708
3907
4082
4236
4370
4484
4582
4664
4732

0160
0557
0948
1331
1700
2054
2389
2704
2995
3264
3508
3729
3925
4099
4251
4382
4495
4591
4671
4738

0199
0596
0987
1368
1736
2088
2422
2734
3023
3289
3531
3749
3944
4115
4265
4394
4505
4599
4678
4744

0239
0636
1026
1406
1772
2123
2454
2764
3051
3315
3554
3770
3962
4131
4279
4406
4515
4608
4686
4750

0279
0675
1064
1443
1808
2157
2486
2794
3078
3340
3577
3790
3980
4147
4292
4418
4525
4611
4693
4756

0319
0714
1103
1480
1844
2190
2517
2823
3106
3365
3599
3810
3997
4162
4306
4429
4335
4625
4699
4761

0359
0753
1141
1517
1879
2224
2549
2852
3133
3389
3621
3830
4015
4177
4319
4441
4545
4633
4706
4767

2,0

4772 4778 4783 4788 4793 4708 4803 4808 4812 4817

2,1

4821 4826 4830 4834 4838 4842 4846 4850 4854 4857

2,2

4861 4864 4868 4871 4875 4878 4881 4884 4887 4890

2,3

4893 4896 4898 4901 4904 4906 4909 4911 4913 4916

2,4

4918 4920 4922 4925 4927 4929 4931 4932 4934 4936

2,5

4938 4940 4941 4943 4945 4946 4948 4949 4951 4952

2,6

4953 4955 4956 4957 4959 4960 4961 4962 4963 4964

2,7

4965 4966 4967 4968 4969 4970 4971 4972 4973 4974

2,8

4974 4975 4976 4977 4977 4978 4979 4979 4980 4981

2,9

4981 4982 4982 4983 4984 4984 4985 4985 4986 4986

3,0

4987 4987 4987 4988 4988 4989 4989 4989 4990 4990

3,1

4900 4991 4991 4991 4992 4992 4992 4992 4993 4993

3,2

4993 4993 4994 4994 4994 4994 4994 4995 4995 4995

3,3

4995 4995 4995 4996 4996 4996 4996 4996 4996 4997

3,4

4997 4997 4997 4997 4997 4997 4997 4997 4997 4998

3,6

4998 4998 4999 4999 4999 4999 4999 4999 4999 4999

3,9

4999

4,0

49997

4,5

4999966

5,0

499999713

268

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Studentova t-distribucija
Stepen

slobode

1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
22
24
26
28
30
40
60
80
100
120

0,10
6,31
2,92
2,35
2,13
2,02
1,94
1,90
1,86
1,83
1,81
1,78
1,76
1,75
1,73
1,72
1,72
1,71
1,71
1,70
1,70
1,68
1,67
1,66
1,66
1,66
1,645

nivo greke = p
0,05
0,01
0,001
12,70 63,70 637,00
4,30
9,92
31,60
3,18
5,84
12,90
2,78
4,60
8,61
2,57
4,03
6,86
2,45
3,71
5,96
2,36
3,50
5,40
2,31
3,36
5,04
2,26
3,25
4,78
2,23
3,17
4,59
2,18
3,06
4,32
2,14
2,98
4,14
2,12
2,92
4,02
2,10
2,88
3,92
2,09
2,84
3,85
2,07
2,82
3,79
2,06
2,80
3,74
2,06
2,78
3,71
2,05
2,76
3,67
2,04
2,75
3,65
2,02
2,70
3,55
2,00
2,66
3,46
1,99
2,64
3,42
1,98
2,63
3,39
1,98
2,62
3,77
1,96
2,576
3,291

269

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Hi-kvadrat distribucija
Stepeni slobode

p=0,10

p= 0,05

p=0,01

p=0,001

2.706

3.841

6.635

10.827

4.605

5.991

9.210

13.815

6.251

7.815

11.341

16.268

7.779

9.488

13.277

18.465

9.236

11.070

15.086

20.517

10.645

12.592

16.812

22.457

12.017

14.067

18.475

24.322

13.362

15.507

20.090

26.125

14.684

16.919

21.666

27.877

10

15.987

18.307

23.209

29.588

11

17.275

19.675

24.725

31.264

12

18.549

21.026

26.217

32.909

13

19.812

22.362

27.688

34.528

14

21.064

23.685

29.141

36.123

15

22.307

24.996

30.578

37.697

16

23.542

26.296

32.000

39.252

17

24.769

27.587

33.409

40.790

18

25.989

28.869

34.805

42.312

19

27.204

30.144

36.191

43.820

20

28.412

31.410

37.566

45.315

21

29.615

32.671

38.932

46.797

22

30.813

33.924

40.289

48.268

23

32.007

35.172

41.638

49.728

24

33.196

36.415

42.980

51.179

25

34.382

37.652

44.314

52.620

26

35.563

38.885

45.642

54.052

27

36.741

40.113

46.963

55.476

28

37.916

41.337

48.278

56.893

29

39.087

42.557

49.588

58.302

30

40.256

43.773

50.892

59.703

270

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1
161,45
18.512
10.129
7,71
6.607
5.987
5.591
5.317
5.117
4.965
4.844
4.747
4.667
4.600
4.543
4.494
4.451
4.414
4.381
4.351
4.325
4.301
4.279
4.260
4.242
4.225
4.210
4.196
4.183
4.183
4.085
4.001
3.946

24
249,04
19.453
8.638
5.774
4.527
3.841
3.410
3.116
2.900
2.737
2.609
2.505
2.420
2.349
2.288
2.235
2.190
2.150
2.114
2.083
2.054
2.028
2.005
1.984
1.965
1.947
1.930
1.915
1.901
1.901
1.793
1.700
1.608

254,32
19.496
8.527
5.628
4.365
3.669
3.230
2.928
2.707
2.538
2.405
2.296
2.207
2.131
2.066
2.010
1.961
1.917
1.878
1.843
1.812
1.783
1.757
1.733
1.711
1.691
1.672
1.654
1.638
1.638
1.509
1.389
1.254

3.841

2.996

1.517

1.000

2.605

2.372

2.214

2.098

271

1.938

1.752

n-k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

Izvod iz Snedecorove F-distribucije (za analizu varijanse)


Granine vrijednosti F na nivou signifikantnosti od 5%
k-1
2
3
4
5
6
8
12
199,5
215,72 224,57 230,17 233,97 238,89 243,91
18.999 19.163 19.248 19.298 19.329 19.371 19.414
9.552
9.276
9.118
9.014
8.941
8.844
8.744
6.945
6.591
6.388
6.257
6.164
6.041
5.912
5.786
5.410
5.192
5.050
4.950
4.818
4.678
5.143
4.756
4.534
4.388
4.284
4.147
4.000
4.737
4.347
4.121
3.972
3.866
3.725
3.574
4.457
4.067
3.838
3.688
3.580
3.438
3.284
4.256
3.863
3.633
3.482
3.374
3.230
3.073
4.103
3.708
3.478
3.326
3.217
3.072
2.913
3.982
3.587
3.357
3.204
3.094
2.948
2.788
3.885
3.490
3.259
3.106
2.999
2.848
2.686
3.805
3.410
3.179
3.025
2.915
2.767
2.604
3.739
3.344
3.112
2.958
2.848
2.699
2.534
3.683
3.287
3.056
2.901
2.790
2.641
2.475
3.634
3.239
3.007
2.853
2.741
2.591
2.424
3.592
3.197
2.965
2.810
2.699
2.548
2.381
3.555
3.160
2.928
2.773
2.661
2.510
2.342
3.522
3.127
2.895
2.740
2.629
2.477
2.308
3.493
3.098
2.866
2.711
2.599
2.447
2.278
3.467
3.072
2.840
2.685
2.573
2.421
2.250
3.443
3.049
2.817
2.661
2.549
2.397
2.226
3.422
3.028
2.795
2.640
2.528
2.375
2.203
3.403
3.009
2.777
2.621
2.508
2.355
2.183
3.385
2.991
2.759
2.603
2.490
2.337
2.165
3.369
2.975
2.743
2.587
2.474
2.321
2.148
3.354
2.961
2.728
2.572
2.459
2.305
2.132
3.340
2.947
2.714
2.558
2.445
2.292
2.118
3.328
2.934
2.702
2.545
2.432
2.278
2.104
3.328
2.934
2.702
2.545
2.432
2.278
2.104
3.238
2.839
2.606
2.449
2.336
2.180
2.004
3.151
2.758
2.525
2.368
2.254
2.097
1.918
3.072
2.680
2.447
2.290
2.175
2.016
1.834

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

1
4052,1
98.495
34.117
21.200
16.258
13.744
12.346
11.295
10.561
10.044
9.647
9.330
9.074
8.862
8.683
8.532
8.400
8.285
8.184
8.096
8.017
7.944
7.881
7.823
7.770
7.722
7.677
7.636
7.597
7.563
7.314
7.077
6.851

24
6234,2
99.464
26.597
13.930
9.467
7.313
6.074
5.279
4.730
4.327
4.021
3.780
3.586
3.427
3.294
3.181
3.083
2.999
2.925
2.859
2.801
2.749
2.702
2.659
2.620
2.585
2.551
2.522
2.494
2.469
2.287
2.115
1.950

6366,5
99.504
26.122
13.464
9.019
6.880
5.650
4.859
4.311
3.909
3.602
3.361
3.165
3.005
2.869
2.753
2.653
2.566
2.489
2.421
2.360
2.305
2.256
2.210
2.169
2.132
2.096
2.064
2.034
2.006
1.805
1.601
1.380

6.635

4.605

1.791

1.000

3.782

3.320

3.017

2.802

272

2.511

2.182

n-k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

Izvod iz Snedecorove F-distribucije (za analizu varijanse)


Granine vrednosti F na nivou signifikantnosti od 1%
k-1
2
3
4
5
6
8
12
4999,0 5403,5 5625,1 5764,1 5859,4 5981,4 6105,8
99.008 99.167 99.247 99.305 99.325 99.365 99.425
30.815 29.459 28.709 28.236 27.910 27.489 27.053
18.001 16.693 15.978 15.521 15.208 14.800 14.374
13.274 12.059 11.391 10.966 10.672 10.266
9.888
10.924
9.779
9.149
8.746
8.465
8.101
7.718
9.546
8.452
7.846
7.460
7.191
6.840
6.469
8.649
7.591
7.006
6.631
6.371
6.029
5.667
8.022
6.992
6.423
6.057
5.802
5.467
5.111
7.560
6.552
5.994
5.636
5.386
5.057
4.706
7.205
6.217
5.668
5.317
5.069
4.745
4.397
6.927
5.953
5.412
5.064
4.820
4.500
4.156
6.701
5.740
5.205
4.862
4.620
4.302
3.961
6.514
5.563
5.035
4.695
4.456
4.140
3.800
6.359
5.417
4.893
4.556
4.318
4.004
3.668
6.227
5.292
4.772
4.437
4.201
3.889
3.553
6.112
5.185
4.669
4.336
4.102
3.791
3.455
6.013
5.092
4.579
4.248
4.015
3.706
3.370
5.926
5.010
4.501
4.170
3.939
3.631
3.296
5.849
4.938
4.431
4.103
3.871
3.565
3.231
5.780
4.875
4.368
4.042
3.811
3.506
3.173
5.719
4.816
4.314
3.988
3.759
3.453
3.121
5.663
4.765
4.264
3.939
3.718
3.406
3.074
5.614
4.718
4.218
3.895
3.666
3.363
3.031
5.568
4.676
4.177
3.855
3.627
3.324
2.993
5.527
4.637
4.140
3.818
3.591
3.288
2.958
5.488
4.601
4.106
3.785
3.558
3.256
2.925
5.453
4.568
4.074
3.754
3.528
3.226
2.896
5.421
4.538
4.045
3.726
3.599
3.198
2.869
5.390
4.510
4.018
3.699
3.474
3.173
2.843
5.179
4.312
3.828
3.513
3.291
2.993
2.665
4.978
4.126
3.649
3.339
3.119
2.823
2.496
4.786
3.949
3.479
3.173
2.956
2.663
2.336

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Stepeni
slobode
2
3
1
18,00 26,70
2
6,09 8,28
3
4,50 5,88
4
3,93 5,00
5
3,61 4,54
6
3,46 4,34
7
3,34 4,16
8
3,26 4,04
9
3,20 3,95
10
3,15 3,88
11
3,11 3,82
12
3,08 3,77
13
3,06 3,73
14
3,03 3,70
15
3,01 3,67
16
3,00 3,65
17
2,98 3,62
18
2,97 3,61
19
2,96 3,59
20
2,95 3,58
24
2,92 3,53
30
2,89 3,48
40
2,86 3,44
60
2,83 3,40
120
2,80 3,36
2,77 3,32

Vrijednosti Q za p=0,05
Broj grupa
4
5
6
7
32,80 37,20 40,50 43,10
9,80 10,89 11,73 12,43
6,83 7,51 8,04 8,47
5,76 6,31 6,73 7,06
5,18 5,64 5,99 6,28
4,90 5,31 5,63 5,89
4,68 5,06 5,35 5,59
4,53 4,89 5,17 5,40
4,42 4,76 5,02 5,24
4,33 4,66 4,91 5,12
4,26 4,58 4,82 5,03
4,20 4,51 4,75 4,95
4,15 4,46 4,69 4,88
4,11 4,41 4,64 4,83
4,08 4,37 4,59 4,78
4,05 4,34 4,56 4,74
4,02 4,31 4,52 4,70
4,00 4,28 4,49 4,67
3,98 4,26 4,47 4,64
3,96 4,24 4,45 4,62
3,90 4,17 4,37 4,54
3,84 4,11 4,30 4,46
3,79 4,04 4,23 4,39
3,74 3,98 4,16 4,31
3,69 3,92 4,10 4,24
3,63 3,86 4,03 4,17

273

8
45,40
13,03
8,85
7,35
6,52
6,12
5,80
5,60
5,43
5,30
5,20
5,12
5,05
4,99
4,94
4,90
4,86
4,83
4,79
4,77
4,68
4,60
4,52
4,44
4,36
4,29

9
47,30
13,54
9,18
7,60
6,74
6,32
5,99
5,77
5,60
5,46
5,35
5,27
5,19
5,13
5,08
5,03
4,99
4,96
4,92
4,90
4,81
4,72
4,63
4,55
4,47
4,39

10
49,10
13,99
9,46
7,83
6,93
6,49
6,15
5,92
5,74
5,60
5,49
5,40
5,32
5,25
5,20
5,15
5,11
5,07
5,04
5,01
4,92
4,83
4,74
4,65
4,56
4,47

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Granine vrijednosti koeficijenta linearne


korelacije
Vjerovatnoa
Stepeni
nulte hipoteze
Slobode
p=0.05
p=0.01
1
0,997
1,000
2
0,950
0,990
3
0,878
0,959
4
0,811
0,917
5
0,755
0,875
6
0,707
0,834
7
0,666
0,798
8
0,632
0,765
9
0,602
0,735
10
0,576
0,708
11
0,553
0,684
12
0,532
0,661
13
0,514
0,641
14
0,497
0,623
15
0,482
0,606
16
0,468
0,590
17
0,456
0,575
18
0,444
0,561
19
0,433
0,549
20
0,423
0,537
21
0,413
0,526
22
0,404
0,515
23
0,396
0,505
24
0,388
0,496
25
0,381
0,487
26
0,374
0,479
27
0,367
0,471
28
0,361
0,463
29
0,355
0,456
30
0,349
0,449
31
0,344
0,442
32
0,339
0,436
33
0,334
0,430
34
0,329
0,424
35
0,325
0,418
36
0,32
0,413
37
0,316
0,408
38
0,312
0,403
39
0,308
0,398
40
0,304
0,393
41
0,301
0,389
42
0,297
0,384
43
0,294
0,380
44
0,981
0,376
45
0,288
0,372
46
0,285
0,368
47
0,282
0,365
48
0,279
0,361
49
0,276
0,358
50
0,273
0,354

274

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________
52
54
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
100
105
110
115
120
125
130
135
140
145
150
160
170
180
190
200
250
300
350
400
450
500
600
700
800
900
1000

0,268
0,263
0,259
0,254
0,25
0,246
0,242
0,239
0,235
0,232
0,229
0,226
0,223
0,22
0,217
0,215
0,212
0,21
0,207
0,205
0,203
0,201
0,199
0,197
0,195
0,19
0,186
0,182
0,178
0,174
0,171
0,168
0,165
0,162
0,159
0,154
0,15
0,145
0,142
0,138
0,124
0,113
0,105
0,098
0,092
0,088
0,08
0,074
0,069
0,065
0,062

0,348
0,341
0,336
0,330
0,325
0,320
0,315
0,310
0,306
0,302
0,298
0,294
0,290
0,286
0,283
0,280
0,276
0,270
0,273
0,267
0,264
0,262
0,259
0,256
0,254
0,248
0,242
0,237
0,232
0,228
0,223
0,219
0,215
0,212
0,208
0,202
0,196
0,190
0,185
0,181
0,162
0,148
0,137
0,128
0,121
0,115
0,105
0,097
0,091
0,086
0,081

275

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Granine vrijednosti koeficijenta linearne


korelacije
Vjerovatnoa nulte hipoteze
Stepeni slobode
p=0,05
p=0,01
1
0,997
1.000
2
0,950
0,990
3
0,878
0,959
4
0,811
0,917
5
0,755
0,875
6
0,707
0,834
7
0,666
0,798
8
0,632
0,765
9
0,602
0,735
10
0,576
0,708
11
0,553
0,684
12
0,532
0,661
13
0,514
0,641
14
0,497
0,623
15
0,482
0,606
16
0,468
0,590
17
0,456
0,575
18
0,444
0,561
19
0,433
0,549
20
0,423
0,537
21
0,413
0,526
22
0,404
0,515
23
0,396
0,505
24
0,388
0,496
25
0,381
0,487
30
0,349
0,449
40
0,304
0,393
50
0,273
0,354
60
0,250
0,325
120
0,173
0,227
S.S.=N-2 N=broj parova

276

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

Granine vrijednosti koeficijenta Rang


korelacije
Nivo znaajnosti
Broj parova N
0,05
0,01
5
1.000
6
0,886
1.000
7
0,786
0,929
8
0,738
0,881
9
0,683
0,833
10
0,648
0,794
12
0,591
0,777
14
0,544
0,715
16
0,506
0,665
18
0,475
0,625
20
0,450
0,591
22
0,428
0,562
24
0,409
0,537
26
0,392
0,515
28
0,377
0,496
30
0,364
0,478

277

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

8. Literatura
1.
2.
3.
4.

Aczel A., 1989, Complete Business Statistics, Homewood


Besag F.P., Besag P.L., 1985, Statistics for the helping professions
Bowers D., 1982, Statistics for Economists, London
Clayton K.N., 1984, An introdustion to statistics for psychology and
education, Charles E. Merrill Publ. Co.
5. Clegg F., 1987, Simple Statistics, Cambridge University Press
6. Graham A., 1994, Statistics, Teach Yourself Books
7. Conover W.I., 1980, Practical Nonparametric Statistics, nenj York
8. Daniel W.W., 1995, Biostatistics: A Foundation for Analysis in the
Health Sciencies, Wiley, New York
9. Eri-Marinkovi J. i sar., 2001, Statistika za istraivae u oblasti
medicinskih nauka, Beograd
10. Freund J., Williams F., Perles b., 1988, Elementary Business Statistics The Modern Approach, Englewood Cliffs
11. Fulgosi A., 1984, Faktorska analiza, kolska knjiga, Zagreb
12. Ivankovi D. i sarad., 1988, Osnove statistike analize za medicinare,
Zagreb
13. Ivkovi Z., Banjevi D., 1986, Vjerovatnoa i matematika statistika,
Nauna knjiga, Beograd
14. Janoevi S., Dotli R., Eri-Marinkovi J., 1996, Medicinska statistika,
Beograd
15. Jarret J., Kraft A., 1989, Statistical Analysis for Decision Making,
Boston
16. Jevtovi I., 1996, Medicinska statistika, Medicinski fakultet, Kragujevac
17. Jevtovi I., Devi M., 1999, Medicinska statistika sa uvodom u
multivarijacionu analizu, Beograd
18. Jovii M., 1986, Ekonometrijski metodi, Beograd
19. Koutsoyianis A., 1984, Theory of Econometrics, Hong Kong
20. Komi J., 1996, Metodi statistike analize kroz primjene (zbirka
zadataka), Kiz "Centar", Beograd
21. Lovri, M., Komi, J., Stevi, S., 2006, Statistika analiza: Metodi i
primjena, Ekonomski fakultet, Banja Luka
22. Miloevi R., 1983, Teorija statistikog zakljuivanja, Beograd
23. Njegri R., ii M., 1985, Osnovi statistike analize, Beograd
24. Njegri R., ii M., Lovri M., Pavlii D., 1991, Osnovi statistike
analize, Beograd
25. Petz B., 1997, Osnovne statistike metode za nematamatiare, Naklada
Slap, Jastrebarsko
26. Pfaffenberger P., Patterson J., 1987, Statistical Methods, Homewood
278

Statistika Banjaluka College


Rade Tanjga
_________________________________________________________________________________________________________

27. Schlesseman J., 1982, Case-Control Studies: Design, Conduct and


Analysis, Oxford-New York
28. Shott S., 1990, Statistics for Health Professionals, W.B. Saunders Co.,
Philadelphia
29. Skaki N., 2001, Teorija vjerovatnoe i matematika statistika, Nauna
knjiga, Beograd
30. Stanii D., 1995, Osnovne statistike metode za medicinare, Ni
31. Stanii V., Rani V., 1996, Praktikum i repetitorijum statistike
metodologije za medicinare sa zadacima za vebanje, Ni
32. Stojakovi M., 1997, Verovatnoa i matematika statistika, Novi Sad
33. Vukovi N., 1983, Modeli statistikog zakljuivanja, Beograd
34. Williamson J.W., Goldschmidt P.G., Colton T., 1986, The Quality of
Medical Literature - An Analysis of Validation Assessments In: Medical
Uses of Statistics, Massachusets Medical Society
35. Zeevi T., Kovaevi M., Kovaevi M., 1991, Teorija uzoraka i
planiranje eksperimenata, Beograd
36. ii M., Lovri M., Pavlii D., 2002, Metodi statistike analize,
Beograd

279

You might also like