You are on page 1of 173

Zoran Miloevi

Dragan Bogdanovi











STATISTIKA
I INFORMATIKA


u oblasti medicinskih nauka
















Ni, 2012.
Autori:
Zoran Miloevi, vanredni profesor Medicinskog fakulteta Univerziteta u Niu
Dragan Bogdanovi, docent Dravnog univerziteta u Novom Pazaru

Izdava:
GALAKSIJA

Za izdavaa:
Mlaan Ranelovi

Recenzenti:
Prof. dr Vera Gruji, Medicinski fakultet u Novom Sadu
Prof. dr Erebet A Nikoli, Medicinski fakultet u Novom Sadu
Prof. dr Tatjana Ille, Medicinski fakultet u Beogradu

Tehniki urednik:
Dipl. ing. Stefan Bogdanovi

tampa:
GALAKSIJA - Lukovo

Tira: 500

ISBN 978-86-6233-010-9

Zabranjeno pretampavanje i kopiranje bez saglasnosti autora i izdavaa.

Odlukom Nastavno-naunog vea Medicinskog fakulteta Univerziteta u Niu
broj 14-7454-5/2-1 od 01.10.2012. godine odobreno je tampanje ove knjige u
vidu udbenika.

CIP -
,














PREDGOVOR

Udbenik je rezultat viegodinjeg rada autora i njihovih saradnika sa
Instituta za javno zdravlje i Medicinskog fakulteta Univerziteta u Niu. Studenti
e u njemu pronai potreban materijal da se savladaju osnove medicinske
statistike i informatike.

Autori su uloili veliki napor kako bi u ovom udbeniku studenti na
jednom mestu mogli pronai materijal za sticanje znanja i razumevanje
statistike metodologije u oblasti biomedicinskih nauka. Uz svako poglavlje dati
su i odgovarajui primeri za praktinu primenu. Obradjena su sva znaajna
poglavlja deskriptivne i analitike statistike. Udbenik je napisan tako da
studentima daje smernice za nauno istraivaki rad i upuuje ih u osnove
primene raunarskih statistikih paketa u biomedicinskim naukama.

Udbenik je namenjen studentima osnovnih studija medicine,
stomatologije, farmacije i strukovnih studija. Pored njih udbenik mogu koristiti
i studenti svih poslediplomskih studija i zdravstveni radnici i saradnici za
obnavljanje steenih znanja i njihovo unapredjivanje i reavanje praktinih
nauno istraivakih problema.

Na savetima korisnim za pisanje ovog udbenika autori duguju
zahvalnost recenzentima: prof. dr Veri Gruji i prof. dr Erebet A Nikoli sa
Medicinskog fakulteta Univerziteta u Novom Sadu, kao i prof. dr Tatjani Ille sa
Medicinskog fakulteta Univerziteta u Beogradu.

Autori su zainteresovani za sve predloge i primedbe na rukopis koji je u
udbeniku sa eljom da u sledeem izdanju on bude jo kvalitetniji i sadrajniji.


Ni, oktobar 2012. godine Autori








Izvod iz recenzija


Knjiga je napisana razumljivo, smisleno i u skladu je sa nastavnim
planom i potrebama za razumevanje i prihvatanje biostatistike i informatike koji
se realizuje na Medicinskom i srodnim fakultetima.
Poglavlja su koncipirana tako da lagano uvode itaoca u biostatistiku,
njene mogunosti i upuuju na korienje SPSS.

Prof. dr Tatjana Ille

Svako poglavlje je ilustrovano primerima, a na kraju svakog poglavlja su
zadaci za vebu. Posebna vrednost knjige je to sadri uputstvo i nain primene
statistikog programa SPSS za sve prezentovane statistike analize.
Koncepcija i redosled poglavlja su logini, knjiga je napisana struno i
razumljivim jezikom za korisnike ije bazino obrazovanje nije iz matematike i
nauka baziranih na matematici.

Prof. dr Erebet A Nikoli


Knjiga autora Zorana Miloevia i Dragana Bogdanovia predstavlja
celinu u kojoj autori izlau sloenu problematiku precizno, struno, kritiki i
analitiki, vodei organizaciju sadraja postepeno i logino od optih ka
konkretnim pitanjima.
Ova knjiga je namenjena studentima medicine, farmacije, stomatologije,
ali ne samo njima. Ona moe posluiti i studentima drugih fakulteta i svima
onima koji koriste statistiku u svom radu.
Stoga, knjigu Statistika i informatika u oblasti medicinskih nauka
preporuujem kao univerzitetski udbenik i predlaem njeno tampanje, kako bi
se omoguilo njeno korienje i u najiroj strunoj javnosti.

Prof. dr Vera Gruji

5


1. MEDICINSKA STATISTIKA


1.1. Definicija i predmet prouavanja

Statistika nije nauka koja prouava zakone po kojima se odvijaju razne pojave
u ivoj prirodi i drutvu, nego nauna metodologija kojom se ove pojave istrauju.
Kako se ova metodologija zasniva na merenju, brojanju i raunanju, odnosno
na primenjenoj matematici, najprimerenija definicija bi bila:
Statistika je nauni metod kvantitativnog prouavanja masovnih pojava u
prirodi i drutvu.
Izraz statistika se u poetku odnosio na prikupljanje i korienje podataka koji
su bili od znaaja za dravu, kao to su evidencije o stanovnitvu, posedima i
prihodima, a vodi poreklo od italijanske rei state to znai drava.
Potreba za efikasnijom dravnom administracijom, kao i osnivanje prvih
osiguravajuih drutava uticali su na razvoj vitalne statistike (praenje i analiza raanja
i umiranja) u imperijalnoj Engleskoj XVII veka, a pioniri u ovoj oblasti bili su Don
Graunt (1620-1674. g.) i Vilijam Peti (1623-1687. g.). Gotovo u isto vreme Blejz
Paskal (1623-1662. g.) i Pjer de Fermat (1601-1665. g.) postavili su osnove teorije
verovatnoe, a u svrhu poveanja uspeha u igrama na sreu, koje su bile popularne u
visokim drutvenim krugovima u Francuskoj.
Dalji podsticaj za razvoj statistike metodologije dala je astronomija, gde je
rezultate mnogih pojedinanih posmatranja bilo potrebno objediniti u jedinstvenu
teoriju. Vodee linosti u ovoj oblasti bili su Pjer Simon Laplas (1749-1827. g.) u
Francuskoj i Karl Fridrih Gaus (1777-1855. g.) u Nemakoj.
Belgijski astronom i matematiar Adolfo Katlet (1796-1874. g.) je prvi poeo
da primenjuje statistiku metodologiju u biolokim, medicinskim i sociolokim
istaivanjima, dok je englez Fransis Galton (1822-1911. g.) uveo analizu varijabilnosti i
meuzavisnosti izmeu vrednosti razliitih obeleja (regresije i korelacije) u biolokim
merenjima. Karl Pirson (1857-1936. g.) i Rafael Veldon (1860-1906. g.), profesori
Univerzitetskog Koleda u Londonu, nastavili su dalji razvoj primene statistike
metodologije u biologiji i uveli pojam biometrije za vrstu studija kojima su se bavili.
Dominantna linost u razvoju statistike i biometrije u XX veku bio je Ronald Fier
(1890-1962. g.), statistiar, biolog i genetiar iz Engleske.
iroka primena raunarske tehnologije od osamdesetih godina XX veka
doprinela je da statistika postane jedna od naunih oblasti sa najveim stepenom
razvoja.

Predmet prouavanja statistike su masovne pojave u prirodi i drutvu. One
se sastoje iz mase pojedinanih elemenata, koji kao nosioci prirode tih pojava u
statistikom smislu predstavljaju statistike jedinice.
Masovna pojava definisana pojmovno, prostorno i vremenski predstavlja
osnovni skup ili populaciju.


6
Definisanje osnovnog skupa:
Pojmovno odreivanje elemenata skupa npr. starost stanovnika, sadraj
knjige, vrste telesnih povreda...
Prostorno odreivanje prostora npr. Ni, Niavski okrug...
Vremensko odreivanje vremenskog trenutka ili razdoblja

Statistike jedinice osnovnog skupa su sve istovrsne, ali ne i istovetne.
Obeleja statitistikih jedinica koja ih ine neistovetnima predstavljaju
predmet statistikih istraivanja.
Nejednakost nekog obeleja izmeu jedinica naziva se varijabilnost.
Najee prouavani osnovni skup u medicinskim istraivanjima je
stanovnitvo ili populacija.
Ljudi u ovom skupu predstavljaju statistike jedinice, a obeleja koja ih ine
neistovetnim su brojna: pol, uzrast, obrazovanje, zanimanje, zdravstveno stanje,
vakcinalni status i dr.


1.2. Razlike u prouavanju ive i neive prirode

NEIVA PRIRODA IVA PRIRODA
Jedna pojava se identifikuje kao uzrok,
a druga kao posledica.
esto nije mogue izvriti identifikaciju
uzroka i posledice.
Izmeu pojava postoji striktna
uzrono - posledina veza.
Izmeu pojava ne postoji striktna
uzrono - posledina veza.
Jedan isti uzrok daje uvek istu
posledicu.
Nije 100% sigurno. Prodiranje virusa u
organizam ne znai obavezno oboljevanje.
Srazmerno dejstvu uzroka menja se i
posledica.
Promena posledice nije srazmerna dejstvu
uzroka.
Mogu da se iskljue svi sporedni
faktori.
Na posledicu utiu i sporedni faktori koji
se ne mogu iskljuiti.
Izmeu pojava postoji matematika ili
funkcionalna veza.
Izmeu pojava postoji stohastika ili
statistika veza.
Ispitivanjem jednog elementa donosi
se zakljuak o celoj masi jer su
elementi meusobno istovetni i
istorodni.
Pojave ispoljavaju svoje zakonitosti tek na
masi elemenata, a elementi su meusobno
istorodni ali nisu istovetni.
Hipoteza se proverava klasinim
eksperimentom - ogledom.
Hipoteza se proverava posebnim
statistikim testovima.


1.3. Teorija verovatnoe i zakon velikih brojeva

Statistika je kao nauno istraivaki metod zasnovan na teoriji verovatnoe i
njenom postulatu zakonu velikih brojeva.

TEORIJA VEROVATNOE se bavi utvrdjivanjem mogunosti za nastajanje
dogaaja ili dobijanja nekih vrednosti.
7
Verovatnoa javljanja nekog dogaaja jednaka je:
N
n
P =
Gde je:
n broj oekivanih (eljenih) dogaaja, a
N ukupan broj moguih dogaaja.

Verovatnoa se kree u intervalu od 0 do 1 (0 do 100%).
0 - potpuno odsustvo verovatnoe
1 - puna verovatnoa

Potpuno odsustvo verovatnoe (0) ne moe nastati ako postoji bar jedna
oekivana eventualnost, kao to i puna, totalna verovatnoa (1) nije mogua im postoje
vie moguih dogaaja od jednog.
Kod statistike (stohastike) veze verovatnoa je uvek manja od 1.
Kod matematike veze verovatnoa moe da bude i 1.

P=1 dogaaj je nuan
P>0,5 dogaaj je verovatan
P=0,5 dogaaj je neizvestan
P<0,5 dogaaj nije verovatan
P=0 dogaaj je nemogu

Oekivani dogaaj uvek ima svoju suprotnost, a to je neoekivani,
komplementarni dogaaj. Verovatnoa javljanja neoekivanog dogaaja jednaka je
razlici izmeu pune verovatnoe i verovatnoe oekivanog dogaaja, odnosno 1 - P.

U matematikom smislu verovatnoa predstavlja odnos izmeu jednog ili vie
oekivanih dogaaja i svih moguih dogaaja. Na primer, verovatnoa da e pri jednom
bacanju novia pasti pismo (jedan od dva mogua ishoda) iznosi:
( )
1
0, 5
2
pismo
P = =
a verovatnoa da e pri jednom bacanju kocke pasti estica (jedan od est moguih
ishoda) iznosi:
( )
1
0,17
6
estica
P = =

Pravila verovatnoe:
- Pravilo sabiranja (adicije): ako se dva dogaaja (A i B) meusobno iskljuuju,
verovatnoa da se dogodi jedan od njih (A ili B) jednaka je zbiru njihovih verovatnoa:
P
(A ili B)
= P
(A)
+ P
(B)

Primer: verovatnoa da e pri jednom bacanju kocke pasti petica ili estica
iznosi:
P
(petica ili estica)
= P
(petica)
+ P
(estica)
=0,17+0,17=0,34

8
- Pravilo mnoenja (multiplikacije): ako su dva dogaaja (A i B) meusobno
nezavisni, verovatnoa da se dogode oba dogaaja (A i B) jednaka je proizvodu
njihovih verovatnoa:
P
(A i B)
= P
(A)
P
(B)

Primer: verovatnoa da e pri dva bacanja kocke pasti prvo petica pa estica
iznosi:
P
(petica i estica)
= P
(petica)
P
(estica)
=0,170,17=0,03

Sluajno promenljivo obeleje je obeleje koje poprima pojedinane modalitete
ili vrednosti sa odreenom verovatnoom. Distribucija (raspodela) verovatnoe
prikazuje nain na koji je ukupna verovatnoa (koja je jednaka 1) raspodeljena na
pojedine vrednosti sluajno promenljivog obeleja.
Svaku distribuciju verovatnoe odreuju neki od statistikih parametara (npr.
aritmetika sredina, standardna devijacija).
Distribucije verovatnoa delimo na diskontinuirane i kontinuirane.
Postoje razliiti pristupi u raunanju verovatnoe:
subjektivan pristup podrazumeva lini stepen verovanja (npr. da e svet
propasti 2050. godine);
frekvencijski pristup temelji se na brojanju dogaaja pri ponavljanju
eksperimenta (npr. koliko puta e novi pasti na glavu ako ga 1000 puta
bacimo);
a priori pristup pretpostavlja poznavanje teorijskog modela, tj. distribucije svih
moguih verovatnosti nekog dogaaja (npr. boja oiju deteta majke s plavim i
oca sa smeim oima).


1.3.1. Verovatnoa a priori

Pre nego to bacimo kocku, teorijska a priori verovatnoa da emo iz jednog
bacanja baciti broj 6 iznosi:
P = 1/6 = 0,17 = 17%
Verovatnoa da emo jednim bacanjem novia dobiti ,,glavu'' (ili ,,pismo'') je
P = 1/2 = 0,5 = 50%
Ako smo tri puta bacali novi i sva tri puta dobili pismo da li to znai da je
verovatnoa da u etvrtom bacanju dobijemo glavu sada vea?
Ona i dalje iznosi 50%!
Teorija verovatnoe vai samo na velikom broju sluajeva i tek ako se on
pribliava beskonanosti, verovatnoa se manifestuje u pravom odnosu.
Ovakva deavanja prouavao je u 17. veku vajcarski matematiar ak Bernuli,
a u 18. veku teoriju su dalje razvili francuski matematiari Laplas i Puason.


1.3.2. Verovatnoa a posteriori

Prikaimo jedan ogled u duhu Bernulija:
U kutiji imamo veliki, ali nepoznat broj crnih i belih kuglica. elimo da
saznamo udeo belih kuglica, odnosno verovatnou da emo izvlaenjem samo jedne
kuglice iz kutije izvui ba belu.
9
Ovakva verovatnoa naziva se a posteriori.
Verovatnoa izvlaenja bele kuglice je:



gde je:
n broj izvuenih belih kuglica, a
N broj ukupno izvuenih kuglica

Posle 10 izvlaenja dobili smo 5 belih i 5 crnih kuglica.
Na osnovu samo ovih ponavljanja moemo predpostaviti da je verovatnoa
izvlaenja bele kuglice:



Verovatnoa izvlaenja crne kuglice je odatle:


Posle 100 izvlaenja dobili smo 55 belih i 45 crnih kuglica.
Sada predpostavljamo da je verovatnoa izvlaenja bele kuglice:




Ali posle 1000 izvlaenja dobili smo 600 belih i 400 crnih kuglica.
Tek sada sa veom sigurnou moemo tvrditi da je verovatnoa izvlaenja
bele kuglice:




a da je odnos belih i crnih kuglica: 6:4

Pravi odnos se manifestovao tek posle velikog broja izvlaenja.


1.3.3. Puasonov zakon velikih brojeva

Pri prouavanju masovnih pojava dobijae se sve taniji rezultati ukoliko se
prouavanje primenjuje na to vie posebnih javljanja prouavane pojave.
Ako bi bilo mogue obuhvatiti i prouiti sve posebne manifestacije, rezultati
prouavanja bi verno i istinito objasnili pojavu.
Zakon velikih brojeva predstavlja postulat teorije verovatnoe i tek njegovom
primenom u prouavanju masovnih pojava dokazano je da se one ne ponaaju haotino
ve da i u njihovom javljanju postoje odreeni odnosi i zakonitosti.

N
n
P =
% 50 5 , 0
10
5
= = = P
5 , 0 5 , 0 1 1 = = P
% 55 55 , 0
100
55
= = = P
% 60 6 , 0
1000
600
= = = P
10

2. STATISTIKO SREIVANJE I PRIKAZIVANJE
PODATAKA


2.1. Tipovi podataka

Na poetku bilo kakvog istraivakog procesa potrebno je definisati statistiku
masu tj. skup jedinica na kojima treba izvriti planirano istraivanje. Ovako definisan
skup naziva se u statistici osnovni skup, koji se sastoji od statistikih jedinica.
Statistike jedinice su istovrsne, tj. imaju odreene iste osobine ili bar jednu
osobinu na osnovu koje se svrstavaju u osnovni skup. Osobine po kojima se statistike
jedinice meusobno razlikuju nazivaju se obeleja i ona su predmet prouavanja tokom
istraivanja. Razliiti vidovi u kojima se obeleja mogu javiti nazivaju se modaliteti ili
kategorije obeleja.
Obeleja u statistici mogu se podeliti na prosta i sloena.
Prosta obeleja imaju jasne granice izmeu modaliteta npr. pol, brano stanje.
Kod sloenih obeleja ne postoji mogunost da se uspostavi jasna granica izmeu
modaliteta ili postoji veliki broj modaliteta npr. uzrok smrti, zdravstveno stanje i dr.
Obeleja se prema obliku u kome se iskazuju dele na numerika i atributivna.
Sa statistikog aspekta najvanije je da li se obeleja mogu izraziti
kvantitativno ili ne. Sva obeleja koja se mogu izraziti brojano nazivaju se numerika
obeleja, npr. telesna teina, nivo holesterola, koncentracija hemoglobina, broj
bolesnika.
Numerika obeleja se dalje mogu podeliti na neprekidna (kontinuirana) i
prekidna (diskontinuirana).
Neprekidna numerika obeleja dobijaju se u procesu merenja i njihova
karakterisitka je da ona mogu da uzmu bilo koju vrednost. Telesna teina
novoroeneta moe biti izmerena na vagi koja pokazuje jednu decimalu, pa e i
telesna teina nekog novoroeneta biti npr. 3,3kg, ali ako imamo vagu koja meri na 4
decimale teina e biti prikazana kao 3,3482kg. To znai da kod neprekidnih
numerikih obeleja brojane vrednosti koje se dobiju zavise od tehnikih mogunosti
mernih instrumenata. Ova obeleja se izraavaju u odreenim jedinicama mere.
Nasuprot neprekidnim obelejima, prekidna nastaju u procesu brojanja i
predstavljaju se u vidu celih brojeva. Primer ovakvog obeleja je broj bolesnika, ocena
na ispitu, broj novoroenadi i dr.
Postoje obeleja koja se ne mogu meriti i ne mogu izraziti brojano. Takva
obeleja se nazivaju opisna ili atributivna i njihove osobine se opisuju: pol, brano
stanje, zdravstveno stanje (oboleli, nisu oboleli) i dr. Po svom karakteru ova obeleja su
diskontinuirana.







11
2.2. Merne skale

Mere svojstva obeleja pridruivanjem brojeva ili oznaka
Postoji etiri nivoa merenja i etiri merne skale vrednosti obeleja:

Nominalna skala (a = b)
Zasniva se na atributivnim karakteristikama.
Obeleja se klasifikuju u jedan od moguih modaliteta.
Ova skala pokazuje da se jedan modalitet razlikuje od drugog, ali ne daje
informaciju o smeru i veliini te razlike.
Primeri su: pol, brano stanje, dijagnoza bolesti i dr.
Podaci koji se na ovoj skali prikazuju su po svojoj prirodi razliiti. Neka
svojstva (obeleja, atributi, varijable) nabrajamo, neka merimo. Pol biva oznaen
reima ili simbolom m/ ili sa 1 za muko 2 za ensko ili binarno (tako e pol biti
pretvoren u dve varijable: muko 1 0, a ensko 0 1). Pol kao varijabla ne moe primiti
drugu vrednost.
Boja oiju moe biti zelena, plava ili smea. Na ovaj nain prikazali smo tri
kategorije, ali se za njih ne moe rei da predstavljaju skalu sreenog intenziteta.
Takva svojstva kao to su pol ili boja oiju zovemo nominalno merenim
svojstvima (lat. nomen, nominis = ime).

Ordinarna skala (a<b, a>b, a=b)
Rangira modalitete obeleja prema unapred usvojenim kriterijumima njihovog
znaaja. Rangiranje moe biti opisno ili brojano, ali nema informacije o veliini
razlike izmeu rangova.
Na primer, obeleje ishod leenja moemo rangirati u 5 modaliteta, opisno,
ali i brojano:
1- izleen,
2- stanje poboljano,
3- stanje nepromenjeno,
4- stanje pogorano i
5- umro.
Prvi rang je bolji od drugog, drugi od treeg i td.
Ilustrativni primer ove merne skale je i prikaz intenziteta opekotina, njih
moemo rangirati u etiri stepena.
Pojedinano svaki stepen predstavlja u stvari dogovornu kategoriju intenziteta
opekotina. Takvo svojstvo zovemo ordinalno merenim svojstvom (lat. ordo, ordinis =
red, vrsta).
Uobiajeno je da se ocene na ispitu kreu u rasponu 5-10, to je takoe
ordinalno mereno svojstvo.

Intervalna skala (a-b)
Koristi merne jedinice koje predstavljaju identine intervale i zbog toga nam
mogu pruiti informacije o apsolutnim razlikama izmeu izmerenih vrednosti.
Formirane su tako da nemaju stvarnu nultu vrednost i zbog toga nam ne daju
obavetenje o relativnim razlikama izmeu izmerenih vrednosti.
12
Kao najbolji primer moe posluiti temperatura izmerena u stepenima
Celzijusove skale. Ukoliko telesna temperatura kod jednog bolesnika pre primene leka
iznosi 39C, a sat vremena posle primene je 37C, moemo zakljuiti:
- da je telesna temperatura opala,
- da apsolutna razlika izmeu ovih vrednosti iznosi 39-37=2C.
Meutim, ne moemo tvrditi da je temperatura opala za 2/39*100=5% jer se
apsolutna nula kod ove skale nalazi na -272C, a ne na 0C.

Skala odnosa (a-b i a/b) omoguava najvii nivo merenja.
Obezbeuje uvid u sve odnose izmeu izmerenih vrednosti: redosled, apsolutnu
i relativnu razliku izmeu njih. Ovo je mogue jer moe da se izmeri i nulta vrednost.
Primer su: teina, visina i dr.
Ako je osoba pre dijete bila teka 100kg, a posle nje 84kg, moemo zakljuiti:
- da je osoba izgubila na telesnoj teini,
- da je apsolutna razlika u teini 100-84=16kg i
- da je osoba umanjila teinu za 16/100*100=16%.


2.3. Metode prikupljanja podataka

Tokom istraivakog procesa ispitivana pojava moe biti posmatrana u celoj
populaciji (potpuno posmatranje) ili na delu populacije (delimino posmatranje).
Metode potpunog posmatranja su metod popisa i metod registracije i
izvetaja.
Metod popisa snima stanje neke masovne pojave u tano odreenom trenutku.
Popis je odreen kritinim momentom pojave koji predstavlja trenutak koji odreuje
koje e statistike jedinice ui u popis, kao i vremenom trajanja popisa.
Metod registracije i izvetaja, za razliku od metode popisa, registruje podatke
za odreeni vremenski period.
Medicinska dokumentacija predstavlja grupu sredstava za usklaeno
evidentiranje i prikupljanje podataka o dogaajima i aktivnostima u sistemu
zdravstvene zatite.
Funkcije medicinske dokumentacije:
- Daje uvid u zdravstveno stanje bolesnika
- Omoguava postavljanje dijagnoze i odabir terapije
- Olakava komunikaciju izmeu lekara i bolesnika
- Predstavlja temelj za razliite zdravstveno-statistike analize
- Sudsko-medicinski dokaz sprovedinih postupaka
- Indikator kvaliteta rada zdravstvene slube
- Baza podataka za nauna istraivanja

Osnovnu medicinsku dokumentaciju ine: zdravstveni karton, istorija bolesti,
temperaturno-terapijsko-dijetetska lista, karton o potronji lekova, karton vakcinacije,
otpusna lista sa epikrizom, protokol bolesnika, protokol za registrovanje rezultata
medicinskog rada, protokol operisanih i umrlih, matina knjiga lica smetenih u
stacionarnoj zdravstvenoj ustanovi, lista anestezije.
13
Postoje i pomona sredstva za voenje evidencija, a to su: registar kartoteke,
dnevna evidencija o posetama i radu, tekua evidencija o utvrenim stanjima i
oboljenjima, dnevna evidencija o kretanju bolesnika u stacionaru.

Metode deliminog posmatranja su anketa i statistiki eksperiment.
Anketa (upitnik) je izvor podataka ili merni instrument sainjen od pitanja koja
su odtampana na papiru ili na drugom pogodnom medijumu, najee raunaru.
Upitnik je namenjen prikupljanju podataka, ispitivanju stavova i ponaanja kod manje
grupe ispitanika. U pripremi ankete potrebno je izvriti dobru selekciju ispitanika koji
e biti anketirani.
Na poetku upitnika mora da se naglasi svrha anketiranja, ko sprovodi anketu,
da li je anonimna ili nije. Pitanja koja se postavljaju mogu biti otvorenog ili zatvorenog
tipa. Kod otvorenog tipa pitanja ispitanik sam pie svoj odgovor, a kod zatvorenog tipa
ispitanik zaokruuje ili na neki drugi nain oznaava jedan od ponuenih odgovora. Na
kraju ankete potrebno je ostaviti prostor za primedbe i sugestije ispitanika.
Pravila prilikom formiranja ankete su sledea: pitanja treba da budu kratka,
jasna, precizna, da nisu dvosmislena, da ne navode na odgovor. Aneketa treba da bude
primerena intelektualnom nivou ispitanika i ne sme da bude predugaka.
Anketa moe biti sprovedena lino, slanjem putem pote ili elektronske pote,
postavljena na veb sajtu.


2.4. Metode sreivanja podataka

Prikupljeni podaci predstavljaju sirov materijal koji se ne moe podvrgnuti
statistikoj analizi. Ovako prikazani podaci predstavljaju osnovnu empirijsku seriju, gde
su vrednosti obeleja prikazane redom kako su prikupljane. Potrebno je ove nesreene
podatke urediti po nekom kriterijumu ime se formira osnovna serija, najee se
podaci sreuju po veliini.
Institut za javno zdravlje sproveo je anketu meu enama starosti 3040 godina
koliko puta godinje odlaze na kontrolne ginekoloke preglede. Dobijeni su sledei
podaci:

0 0 3 4 2 2 4 3 1 0 1 3 2 4 4 3 2 0 1 2 2 4 3 0 2
1 4 2 3 1 0 2 2 1 2 3 2 1 0 1 2 1 3 1 0 2 4 3 3 1

Na osnovu ovako prikazanih podataka nismo u mogunosti da formiramo sliku
o navikama ena odreenog uzrasta da poseuju ginekologa. Kako bi zakljuili kakve
su navike ena potrebno je prvo srediti podatke po veliini.

0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2
2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4

Nakon sreivanja podataka po veliini potrebno je saeti podatke u vidu proste
(osnovne) distribucije frekvencije. Distribucija frekvencije predstavlja takvu statistiku
seriju gde se vrednosti obeleja upisuju u jednu kolonu, a uestalost tj. frekvencije tih
vrednosti u drugu kolonu. Dakle, distribucija frekvencije pokazuje kako je rasporeen
14
broj jedinica posmatranja po pojedinim vrednostima obeleja. Za gore pomenute
podatke formirana je prosta distribucija frekvencije.

broj poseta f
0 8
1 11
2 14
3 10
4 7
50

Na osnovu ovako sreenih podataka moe se zakljuiti da najvei broj ena
poseuje ginekologa dva puta godinje.
Nain sreivanja podataka zavisi od tipa obeleja. Atributivna i numerika
diskontinuirana obeleja predstavljaju se prostom distribucijom frekvencije, a
numerika kontinuirana obeleja se predstavljaju distribucijom frekvencije sa klasnim
(grupnim) intrevalima.
Distribucija frekvencije sa klasnim (grupnim) intervalima odreena je brojem
intervala, veliinom intervala i granicama intervala. Osim toga, potrebno je voditi
rauna o tome da intervali budu meusobno jednaki, jer se time omoguava meusobno
uporeivanje grupa.
Broj intervala oznaava se sa K i odreuje se Sturgesovom formulom.

K = 1+3,32192 log
10
N,

log
10
N predstavlja logaritam ukupnog broja jedinica posmatranja (N) za osnovu
10. Podsetimo, logaritam nekog broja (u ovom sluaju N) predstavlja vrednost kojom
treba stepenovati osnovu (u ovom sluaju 10) da bi se dobio taj broj.

Veliina intervala odreuje se po formuli:

Veliina intervala =
K
X X
min max



Treba voditi rauna da granice intervala budu jasne i precizne, ime se jasno
pokazuje kom intervalu pripada vrednost posmatranog obeleja, zatim, mora se voditi
rauna da kraj jednog intervala ne bude i poetak drugog, jer se time izbegava situacija
da se ne zna kom intervalu pripada ispitivana vrednost.
Kod 30 bolesnika odreivane su vrednosti glikemije (eera u krvi) u mmol/L i
dobijene su sledee vrednosti:

8,6 7,7 6,2 6,6 8,0 9,3 7,3 8,5 10,9 11,1
8,4 9,4 6,9 12,3 13,1 11,9 10,5 9,2 12,6 11,4
13,7 9,0 6,6 11,4 11,0 8,1 7,3 13,9 12,1 8,0

15
Na osnovu prikupljenih podataka nije mogue doneti zakljuak o vrednosti
glikemije kod ispitivanih bolesnika. Stoga je potrebno srediti i saeti podatke u vidu
ditribucije frekvenicije sa klasnim (grupnim) intervalima.

Potrebno je odrediti broj intervala:
K = 1+3,32192 log
10
N
K = 1+3,32192 log
10
30 = 1+3,321921,48 = 5,91 6

Veliina intervala =
K
X X
min max

=
6
2 , 6 9 , 13
=1,28 1,3

Za gore prikazane podatke potrebno je formirati distribuciju frekvencije sa 6
intervala, gde je veliina intervala 1,3.



Ovakav nain formiranja intervala nije ispravan, jer dolazi do preklapanja
vrednosti. U datom primeru, postavlja se pitanje u koji interval uvrstiti vrednost od
11,4?










Ovako formirana distribucija frekvencije sa klasnim intervalima je ispravna i
pokazuje da najvei broj bolesnika ima vrednost glikemije izmeu 7,5 8,79 mmol/L.







Glikemija f
6,2 7,5 ....
7,5 8,8 ....
8,8 10,1 ....
10,1 11,4 ....
11,4 12,7 ....
12,7 14,0 ....
....
Glikemija f
6,20 7,49 6
7,50 8,79 7
8,80 10,09 4
10,10 11,39 4
11,40 12,69 6
12,70 13,99 3
30
16

2.5. Prikazivanje podataka

Nakon sreivanja podataka potrebno je iste prikazati to jasnije i preciznije.
Prikazivanje podatka moe biti tabelarno i grafiki.


2.5.1. Tabelarno prikazivanje podataka

Tabela je prikaz podataka sastavljen od redova i kolona. Svaka tabela mora da
ima naslov, zaglavlje i predkolonu.

Naslov tabele



Tabele mogu biti proste, sloene i kombinovane.
Proste tabele prikazuju samo jednu statistiku seriju. U tabeli 1 je prikazan broj
stanovnika u periodu od 2003. do 2007. godine.

Tabela 1. Broj stanovnika u Srbiji u periodu 2003-2007. godine

Godina Br. stanovnika
2003. 7532613
2004. 7463157
2005. 7440769
2006. 7411569
2007. 7381579

Sloene tabele prikazuju vie statistikih serija. U tabeli 2 prikazani su podaci o
broju stanovnika, broju ivoroenih i broju mrtvoroenih u Niavskom regionu u
periodu od 2003. do 2007. godine, to predstavlja prikazivanje tri statistike serije u
odreenom periodu.

Tabela 2. Vitalna statistika u Niavskom regionu u periodu 2003-2007. godine

Godina Br. stanovnika ivoroeni Mrtvoroeni
2007. 376946 3425 21
2006. 378059 3558 23
2005. 379076 3550 23
2004. 379829 3691 24
2003. 380976 3603 19

ZAGLAVLJE
SUMA
REDOVA

Polje
PREDKOLONA

SUMA
KOLONA

17

Kombinovane tabele prikazuju serije podataka dobijenih ukrtanjem dva ili vie
obeleja.

Tabela 3. Broj obolelih kod vakcinisanih i nevakcinisanih mukaraca i ena

Oboleli Zdravi
Mukarci ene Mukarci ene

Vakcinisani 345 273 567 534 1719
Nevakcinisani 673 652 321 283 1929
1018 925 888 817 3648


2.5.2. Grafiko prikazivanje podataka

Grafiko prikazivanje podataka nudi upadljivije i jasnije utvrivanje razlika
meu prikazanim serijama podataka. Grafikoni predstavljaju vizuelnu ilustraciju tabela,
ali nisu njihova zamena, ve dopuna. Nedostatak grafikona je to njihova konstrukcija
zavisi od postavljene srazmere, drugi nedostatak to ponekad u istoj razmeri nije
mogue prikazati sve vrednosti, npr. najmanje i najvee vrednosti.

Grafikoni se dele na takaste, linijske i povrinske.

Kod takastog dijagrama take predstavljaju parove vrednosti dva obeleja u
pravouglom koordinatnom sistemu kako bi se prikazao odnos izmeu ovih obeleja kod
svih jedinica posmatranja. Na x-osu (apscisu) moemo naneti kako razliite modalitete
(kategorije) nekog atributivnog obeleja, tako i razliite vrednosti nekog numerikog
obeleja. Na y-osu (ordinatu) nanosimo numerike vrednosti drugog obeleja. Osim
podataka u vidu taaka, na ovom dijagramu se moe prikazati i regresiona linija tj.
prava koja najbolje odraava meusobni odnos izmeu posmatranih obeleja.

0
20
40
60
80
100
155 160 165 170 175 180 185 190 195
Telesna visina (cm)
T
e
l
e
s
n
a

m
a
s
a

(
k
g
)

Meuzavisnost izmeu telesne visine i telesne mase kod 20 ispitanika

Linijski dijagrami se dele na: poligon i kriva frekvencije, vremenski linijski
dijagram, kumulativni i polarni dijagram.
18
Kriva frekvencije koristi se za kontinuirana obeleja, na apscisu se nanose
mali intervali obeleja, formira se niz taaka, ijim spajanjem se formira kriva. U
statistici je najpoznatija i najvie se primenjuje Gausova kriva.

Gausova kriva

Vremenski linijski dijagram prati jedno ili vie obeleja kroz vreme. Na
apscisu se nanosi vreme, a na ordinatu vrednosti obeleja. Upotrebljava se za praenje
trenda.
374000
375000
376000
377000
378000
379000
380000
381000
382000
2003 2004 2005 2006 2007

Broj stanovnika u Niavskom regionu u periodu 2003-2007. godine

Povrinski dijagrami se dele na: tapiasti dijagram, histogram, kruni
dijagram i kartogram.
tapiasti dijagram se sastoji od stubia iste irine ija visina predstavlja
frekvenciju razliitih modaliteta atributivnih obeleja ili razliitih vrednosti
diskontinuiranih numerikih obeleja. Izmeu susednih stubia ostavlja se malo
rastojanje.

19

Nivo uhranjenosti 100 studenata medicine

Histogram je tip povrinskog dijagrama kojim se prikazuju numerika
kontinuirana obeleja. Sastoji se od spojenih stubia, gde irina stubia predstavlja
irinu klasnog intervala, a visina frekvenciju. Ukoliko se spoje sredine stubia formira
se poligon frekvencije.


Histogram frekvencija za visinu 100 studentkinja

Kruni dijagrami se koriste za prikazivanje delova neke strukture. Ceo krug
predstavlja 100% strukture.

Zastupljenost puenja kod odraslog stanovnitva Srbije

Kartogrami su dijagrami po geografskoj karti, gde se za svaki region ili
podruje upisuje vrednost ispitivane pojave.
20
2.6. Primenjena statistika u MS Excelu

Unos statistikih podataka

Unos podataka, tj formiranje datoteke, prvi je korak u radu s podacima
dobijenim u nekom istraivanju. Ispravno formiranje datoteke, nuan je korak za dalju
analizu unetih podataka.
Kada se pokrene program Excel, na ekranu se pojavi radni list (Sheet ili
Spreadsheet), u obliku tabele. Svaki radni list se sastoji od redova oznaenih brojevima
i kolona oznaenih slovima. Radni listovi ine radnu knjigu (Book), unutar koje se
smeta celokupna datoteka. Najmanja jedinica, definisana presekom reda i kolone,
naziva se elija (Cell).

Pri unosu podataka u Excel, treba imati na umu sledee:
1. U jedan red se unose podaci za jednog ispitanika;
2. U jednu kolonu se unose podaci za jednu varijablu (obeleje). U prvi red se
unose nazivi varijabli.
3. Kod atributivnih varijabli, modalitete (kategorije) je potrebno obeleavati
brojevima (npr. muki pol=1, enski pol=2)
4. Ako je vrednost numerikog obeleja 0 ne ostavljati praznu eliju, ve
upisati 0.
5. Kod unoenja decimalnih brojeva, potrebno je koristiti zarez za razdvajanje
decimala, a ne taku. Dokaz da je broj pravilno uneen je da se on po
automatizmu ravna desno u eliji. Podaci koji se automatski ravnaju levo u
eliji tretiraju se kao tekst i izuzimaju se iz prorauna.

Grupisanje atributivnih obeleja

Grupisanje atributivnih (kategorijskih) varijabli vri se prikazivanjem u
tabelama, preko apsolutnih i relativnih frekvencija. Najbolje objanjenje emo prikazati
kroz primer:
Primer: U ambulantama u gradu Niu je analizirano kojim se danima najvei
broj pacijenata javlja lekaru. Sakupljene su informacije iz 20 ambulanti i dobijeni
sledei podaci:

Ambulanta Dan Ambulanta Dan
1 Pon 11 Petak
2 Uto 12 Subota
3 Sreda 13 Nedelja
4 etvrtak 14 Ponedeljak
5 Sreda 15 sreda
6 Petak 16 Sreda
7 Subota 17 etvrtak
8 Nedelja 18 Sreda
9 Ponedeljak 19 Sreda
10 sreda 20 sreda


21
Reenje: Dobijene podatke unesemo u list MS Excela na sledei nain:



Procedura koja se koristi za grupisanje podataka se naziva Histogram i ona
pored grupisanja omoguava i grafiko prikazivanje podataka. Postupak je sledei: U
glavnom meniju kliknemo na Tools, iz padajueg menija izaberemo opciju Data
Analysis, u radnom prozoru oznaimo Histogram i kliknemo na OK.
Napomena: Ukoliko se opcija Data Analyse ne nalazi u Tools, treba je ukljuiti
tako to se klikne na Tools/Add-Ins i oznai Analysis ToolPak-VBA.
Na ekranu se dobija sledei prozor:



U okvir Input Range unosimo adrese elija u kojima se nalaze sirovi podaci
(B1:B21), a u Bin Range unosimo adrese elija sa oznakama modaliteta obeleja koje
22
smo sami upisali (C1:C8). Oznaimo opciju Labels, jer smo uneli i adrese elija u
kojima se nalaze naslovi (B1 i C1).
Kliknemo na OK i dobijemo sledei ispis:

Dani Frequency Cumulative %
1 3 15.00%
2 1 20.00%
3 8 60.00%
4 2 70.00%
5 2 80.00%
6 2 90.00%
7 2 100.00%
More 0 100.00%


Dani su prikazani brojevima od 1 do 7, gde je ponedeljak=1, a nedelja=7.
Sledea kolona predstavlja apsolutne frekvencije, a trea kolona kumulativni procenat.
Ukoliko je potrebno da pored apsolutnih frekvencija izraunamo i relativne potrebno je
uraditi sledee:
U eliji ispod druge kolone izraunamo sumu. Novu kolonu oznaimo sa %, to
nam ukazuje na procentualnu (relativnu) strukturu. U eliju ispod toga zadamo formulu
za izraunavanje =F13/$F$21*100, ime zapravo apsolutnu vrednost frekvencije,
delimo sa sumom i mnoimo sa 100. Znak $ unosimo kako bismo fiksirali eliju sa
kojom delimo. Zadatu formulu u prvoj eliji kopiramo do poslednje i tako zadamo
izraunavanje relativne strukture za sve vrednosti.





Grafiko prikazivanje statistikih podataka

Grafiko prikazivanje rezultata je jako bitan element statistike analize, jer
izmeu ostalog prua najeksplicitniji uvid u rezultate rada, i omoguava nam brzu i
lako razumljivu sliku o analiziranim pojavama.
Excel je svakako jedan od najboljih i najlakih za korienje programa za
grafiko prikazivanje.


23
Primer: U decembarskom ispitnom roku statistiku je polagalo 200 studenata i
rezultati su bili sledei:

Ocena iz statistike Broj studenata
5 10
6 20
7 40
8 60
9 35
10 35

Potrebno je dobijene podatke predstavi grafiki (krunim dijagramom).

Reenje:
Podatke iz tabele unesemo u Excel kao na slici. Kliknemo na ikonu Chart
Wizard na liniji sa alatima i otvara se sledei radni prozor:



Izaberemo Pie (pitica) iz menija Chart Type i kliknemo Next. Otvara se sledei
prozor:

24


Oznaimo Columns i u Data Range unesemo opseg elija koje sadre potrebne
podatke. Klikom na Next dobili bi dijaloge za definisanje naslova tabele i drugih ispisa,
ali se mi zadravamo na ovom koraku i klikom na Finish dobijamo krajnji oblik
krunog dijagrama:



Na isti nain je mogue kreirati i druge vrste grafika, tapiaste, histograme itd,
izabirom tipa grafika u prozoru Chart Type, to e praktino i biti demonstrirano na
vebama iz medicinske statistike i informatike.





25
Zadaci za vebanje


1. Kod 30 ena odreivan je nivo jednog hormona. Dobijena su sledee
vrednosti:

25,3 18,6 20,4 15,0 27,8 19,4 11,0 19,4 18,6 12,5
23,5 14,0 19,8 16,7 17,2 22,4 23,5 20,0 18,7 26,6
18,8 15,4 19,5 27,0 16,8 21,0 22,4 14,7 19,5 21,4

Srediti podatke u vidu distribucije frekvencije sa klasnim intervalima i
prikazati grafiki.

2. Na klinici za plastinu hirurgiju registrovane su opekotine razliitog
stepana u toku jedne godine. Dobijeni su sledei podaci:

I III II IV I I II III II II III IV IV I I I II III I II II
II II III III I I I I I II III I I II I I I III II II I
II I I I II I I II II I I III II II II I I I II III I

Podatke srediti u vidu proste distribucije frekvencija, grafiki prikazati
podatke u vidu tapiastog i krunog dijagrama.

3. Dati su podaci o starosti pacijenata obelelih od hepatitisa A u Nikom
regionu u toku 2008. godine.

33 31 37 24 32 43 34 39 27 37
34 43 19 47 30 27 34 29 33 38
29 35 41 19 48 37 28 38 41 33

Podatke srediti u distribuciju frekvencije sa klasnim intervalima, prikazati
podatke tabelarno i grafiki.

4. U tabeli je prikazan broj prekida trudnoe u Srbiji u periodu od 2000. do
2007. godine.

Godina 2000. 2001. 2002. 2003. 2004. 2005. 2006. 2007.
Broj prekida
trudnoe
23749 22356 24897 23678 25603 26645 25665 24273

Prikazati podatke grafiki i ocenite trend prekida trudnoe u datom periodu.

5. U mikrobiolokoj laboratoriji praen je broj deca kolskog uzrasta sa
urednim nalazom brisa grla. Utvreno je da je 130 devojica imalo
uredan nalaz od ukupno 200 pregledanih. Od 250 deaka 176 imalo je
uredan nalaz. Prikazi podatke u vidu tabela kontigencije i konstruii
grafikon.
26
3. RELATIVNI BROJEVI


U procesu prikupljanja podataka i njihovog tumaenja esto dolazi do
nemogunosti poreenja podataka i pravilnog zakluivanja ukoliko su podaci prikazani
u vidu apsolutnih brojeva. Apsolutni brojevi se dobijaju kao osnovni izvorni podaci, a
do njih se dolazi prebrojavanjem ili merenjem jedinica posmatranja, odnosno
grupisanjem prikupljenih vrednosti numerikih obeleja neke masovne pojave. Obino
su dovoljni za neku manje optu analazu, ali za savremenu statistiku analizu potrebno
je apsolutne brojeve prevesti u relativne. Apsolutnim brojevima se prikazuje neka
pojava i njena struktura, ali ne postoji mogunost adekvatnog vremenskog i prostornog
poreenja. Za takav vid statistike analize koriste se relativni brojevi. Relativni broj
predstavlja odnos dva apsolutna broja, odnosno kolinik dva apsolutna broja.

Relativni broj =
A B
ili
B


Relativnim brojevima je apsolutni broj samo poetna, odnosno polazna
vrednost. Relativni brojevi su pogodniji u statistikoj analizi jer se njima mogu vriti
poreenja dve razliite pojave bez obzira na apsolutne vrednosti iz kojih su apsolutni
brojevi izvedeni. Uz pomo relativnih brojeva moemo porediti dve pojave koje su
rasporeene kroz vreme ili na razliitim prostorima. Npr. natalitet bez obzira na broj
stanovnika odreenog podruja ili natalitet u razliitim regionima u zemlji ili izmeu
razliitih zemalja. Relativni brojevi nisu zamena apsolutnim, ve su njihova dopuna.
Priroda ispitivane pojave, kao i logika povezanost pojava odreuje koja e se
vrednost nai u brojitelju, a koja u imenitelju. Brojitelj je vrednost pojave koju
uporeujemo, a imenitelj vrednost pojave na osnovu koje vrimo poreenje.
Relativni brojevi se dele na:
1. Indekse strukture
2. Koeficijente intenziteta
3. Indekse dinamike


3.1. Indeksi strukture

Indeksi strukture pokazuju relativni odnos neke pojave u odnosu na celinu. Ovi
relativni brojevi se prikazuju procentualno (0 100%) ili u vidu proporcije (0 1).
Pokazuju sastav jedne celine, odnosno iz kojih i kavih delova se sastoji statistika masa
ili posmatrani skup, ili kakvi su koliinski odnosi pojedinih delova statistike mase u
odnosu na celinu ili posmatrani osnovni skup. Indeks strukture se izraunava na sledei
nain:

Indeks strukture = 100
celina
mase deo

27
Tabela 1. Stanovnitvo u Republici Srbiji po dobnim grupama i polu prema
proceni za 2007. godinu

Starost (godine)
Pol Svega
s19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-64 >65
Muko 3588957 815288 255127 260965 255674 237651 238686 256981 292754 438775 537056
ensko 3792622 773802 245415 252413 253124 239408 244762 265481 301678 482291 734249
Ukupno 7381579 1589090 500542 513378 508798 477059 483448 522462 594432 921066 1271304

Tabela 1 pokazuje broj stanovnika u Srbiji po dobnim grupama prema proceni
iz 2007. godine. Ova tabela je puna podataka koji su teki za interpretaciju i iz nje se ne
mogu doneti vani zakljuci. Zato se prelazi na izraunavanje relativnih brojeva koji e
pokazati udeo stanovnika prema starosnoj strukturi i prema polu.

s19
1589090
0, 2153 100 21, 53%
7381579
= =
20-24
500542
0, 0678 100 6, 78%
7381579
= =
25-29
513378
0, 0695 100 6, 95%
7381579
= =
30-34
508798
0, 0689 100 6,89%
7381579
= =
35-39
477059
0, 0646 100 6, 46%
7381579
= =
40-44
483448
0, 0655 100 6, 55%
7381579
= =
45-49
522462
0, 0708 100 7, 08%
7381579
= =
50-54
594432
0, 0805 100 8, 05%
7381579
= =
55-64
921066
0,1248 100 12, 48%
7381579
= =
>65
1271304
0,1722 100 17, 22%
7381579
= =
100%


Tabela 2. Starosna struktura stanovnitva Srbije (procentualno izraena)

Starost
Pol
s19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-64 >65
Muko
11,04 3,46 3,54 3,46 3,22 3,23 3,48 3,97 5,94 7,28
ensko
10,48 3,32 3,42 3,43 3,24 3,32 3,60 4,09 6,53 9,95
Ukupno
21,53 6,78 6,95 6,89 6,46 6,55 7,08 8,05 12,48 17,22
28
Na osnovu izraunatih indeksa strukture moe se zakljuiti da je procentualno
najzastupljenije stanovnitvo starosti do 19 godina, dok je najmanje zastupljena
starosna kategorija od 35-39 godina.
Na ovaj nain odreena dobna struktura stanovnitva moe biti prikazana
tabelarno (tabela 2) i grafiki. Grafiki se najee struktura neke pojave prikazuje
povrinskim krunim dijagramom. Jedan procenat strukture na grafiku predstavlja 3,6
ugla, to znai da se dobijeni procenti mnoe sa 3,6 i dobijaju se vrednosti ugla koji
predstavlja deo odreene strukture na krunom dijagramu.

21,53%
6,78%
6,95%
6,89%
6,46%
6,55%
7,08%
8,05%
12,48%
17,22%
<19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55-64
>65

Grafikon 1. Dobna struktura stanovnitva u Srbiji



3.2. Koeficijenti intenziteta

Koeficijent intenziteta (stopa) je relativni broj koji predstavlja odnos dve
masovne pojave, koje su na neki nain meusobno povezane. U takozvanoj vitalnoj
statistici masovna pojava koja predstavlja baznu vrednost uglavnom je ukupan broj
stanovnika Srbije u odreenom vremenskom trenutku. Stope u epidemiologiji i
socijalnoj medicini imaju iroku primenu jer se njima iskazuje kretanje broja
stanovnika, rasprostranjenost i uestalost oboljenja, invalidnost, povreivanje itd.
Relativni odnos, tj. broj koji se dobije poreenjem dve masovne pojave mnoi
se odreenim koeficijentom. Vrednost koeficijenta zavisi od veliine dobijenog
relativnog broja. to je brojana vrednost manja koeficijent je vei.
Koeficijenti:
- x 100 = procenti
- x 1000 = promili
- x 10000 = decili
- x 100000 = decimili




29
Pokazatelji raanja i umiranja

Osnovni pokazatelji raanja i umiranja populacije su:

br. ivoroene dece
Natalitet = 1000
br. stanovnika


ukupan br. umrlih
Mortalitet = 1000
br. stanovnika


Prirodni prirataj = Natalitet Mortalitet

br. ivoroenih - br. umrlih
Prirodni prirataj = 1000
br. stanovnika


br. ivoroene dece
Fertilitet = 1000
br. ena starosti 15-45 godina


br. umrlih od neke bolesti
Specifini mortalitet = 1000
br. stanovnika


br. umrle odojadi u toku godine
Mortalitet odojadi = 1000
br. ivoroene dece u istoj godini


br. umrlih od odreene bolesti
Letalitet = 100
ukupan br. obolelih od iste bolesti



Pokazatelji oboljevanja stanovitva

Analiza zdravstvenog stanja stanovnitva neke drave ili nekog regiona, pored
pokazatelja umiranja, uglavnom se bazira na pokazateljima oboljevanja stanovnitva.
Na osnovu ovih podataka vri se organizacija i unapreenje zdravstvene zatite.
Morbiditet predstavlja oboljevanje stanovnika od neke bolesti u datom
trenutku. Morbiditet moe biti opti i specifini kada se rauna za neku odreenu bolest.
Radi se o stopi koja nije precizno definisana. Zato se danas najee koriste incidencija
i prevalencija.
Incidencija je mera uestalosti nekog oboljenja. Ona pokazuje broj
novootkrivenih sluajeva odreene bolesti u toku godine u odnosu na ukupan broj
stanovnika sredinom te godine.

br. novoregistrovanih od nekog oboljenja u toku godine
Incidencija = 1000 ili 10.000 ili 100.000
br. stanovnika sredinom godine


30
Prevalencija se smatra stopom rasprostranjenosti neke bolesti. Ona predstavlja
ukupan broj obolelih na nekom podruju od odreene bolesti u odnosu na ukupan broj
stanovnika sredinom godine.

br. ukupno obolelih od neke bolesti na dan 31.12.
Prevalencija = 1000 ili 10.000 ili 100.000
br. stanovnika sredinom godine



3.3. Indeksi dinamike

Obzirom da veina pojava vezanih za zdravstveno stanje stanovnitva pokazuje
izrazitu varijabilnost, za praenje promena neke pojave koje nastaju kroz vreme koriste
se indeksi dinamike. U zavisnosti da li je bazna vrednost tj. vrednost u odnosu na koju
se prati dinamika neke promene stalna ili promenljiva, ovi indeksi se dele na bazine i
lanane. Bazna vrednost se izjednaava sa 100%. Vrednosti indeksa dinamike manje od
100% pokazuju da se pojava smanjuje, a ako su vee od 100% pokazuju da se promena
poveava.
Bazini indeksi imaju stalnu baznu vrednost u odnosu na koju se porede sve
ostale vrednosti u uzastopnim vremenskim intervalima. Bazini indeksi pokazuju razvoj
neke pojave kroz vreme. Kao stalna baza ne mora se uvek uzeti stanje pojave iz prvog
vremenskog perioda, ve bi trebalo uzeti stanje iz onog perioda kada pojava pokazuje
normalnost i stabilnost.
Lanani indeksi nemaju stalnu bazu, tj. bazna vrednost je uvek vrednost neke
pojave iz prethodnog vremenskog perioda. Dakle, lanani indeksi pokazuju tempo
razvoja pojave, odnosno brzinu kretanja posmatrane pojave.

ematski je prikazana razlika u izraunavanju baznih i lananih indeksa neke
pojave u periodu od 2000. do 2008. godine.

2
0
0
0
2
0
0
1
2
0
0
2
2
0
0
3
2
0
0
4
2
0
0
5
2
0
0
6
2
0
0
7
2
0
0
8
Bazini indeksi
Lanani indeksi






31
Primer: U tabeli je prikazan broj obolelih od infarkta miokarda u Srbiji u
periodu od 2005. do 2008. godine po polu. Proceniti kakav je razvoj oboljevanja od
infarkta miokarda tokom vremena i kakav je tempo razvoja ove bolesti?


Na osnovu izraunatih bazinih indeksa moe se zakljuiti da je kod mukaraca
oboljevanje od infarkta miokarda bilo u konstantnom opadanju u posmatranom periodu,
da bi u 2008. godini broj obolelih iznosio 49,2% od broja u 2005. godini. Lanani
indeksi pokazuju da je najvei relativni pad broja obolelih nastupio izmeu 2006. i
2007. godine i to za 35,6% (100-64,4=35,6%), a najmanje relativno umanjenje broja
obolelih je nastupilo izmeu 2007. i 2008. godine i to za 3,6%.
Kod ena bazini indeksi pokazuju porast broja obolelih u posmatranom
periodu. Lanani indeksi ukazuju da je relativni porast broja obolelih ena nastupio
izmeu 2005. i 2006. godine i to za 50,4%, a nii porast je evidentiran izmeu 2007. i
2008. godine i to za 3,4%, dok je izmeu 2006. i 2007. godine broj obolelih ena opao
za 31,8%.

God. Mu. Bazini indeks Lanani indeks en. Bazini indeks Lanani indeks
2005 4211 100% - 2871 100% -
2006 3338
3338
100 79, 3%
4211
=
3338
100 79, 3%
4211
= 4317
4317
100 150, 4%
2817
=
4317
100 150, 4%
2817
=
2007 2151
2151
100 51,1%
4211
=
2151
100 64, 4%
3338
= 2946
2946
100 102, 6%
2871
=
2946
100 68, 2%
4317
=
2008 2073
2073
100 49, 2%
4211
=
2073
100 96, 4%
2151
= 3045
3045
100 106,1%
2871
=
3045
100 103, 4%
2946
=
32
Zadaci za vebanje

1. U tabeli 1 su prikazani osnovni podaci vitalne statistike u Srbiji u periodu
od 20032007. godine.

Godina Br. stanovnika ivoroeni Umrli Mrtvoroeni Umrla odojad
2007 7.381.579 68.102 102.805 369 484
2006 7.411.569 70.997 102.884 365 525
2005 7.440.769 72.180 106.771 361 579
2004 7.463.157 78.186 104.320 419 633
2003 7.532.613 79.025 103.964 411 711

- Izraunati natalitet, mortalitet i prirodni prirataj u 2007. godini.
- Izraunati smrtnost odojadi u 2005.
- Odrediti kada je bila najnia stopa smrtnost odojadi u odnosu na 2003.
godinu, i kakav je bio tempo smrtnosti u ispitivanom periodu.

2. Ako je ukupan broj ena u reproduktovnom periodu od 1945 godina
1.235.122 u 2007. godini na osnovu podataka iz tabele 1 odrediti fertilitet.

3. Preme podacima od 31.12.2007. godine u primarnoj zdravstvenoj zatiti u
Niu i Novom Sadu bilo je zapoljeno doktora medicine, stomatologa i
farmaceuta u zdravstvenim ustanovama:

Grad
Opta
medicina
Specijalisti
medicine
Stomatolozi Farmaceuti
Ni 99 1.254 170 93
Novi Sad 180 1.182 133 89

Ako je sredinom 2007. godine broj stanovnika u Niu bio 239.645, a u
Novom Sadu 319.259 izraunati gde su zdravstveni radnici bili optereeniji
brojem potencijalnih korisnika?

4. U Srbiji je u 2007. godini od infarkta miokarda obolelo 5.097, a umrlo
1.139 osoba. Ako je broj stanovnika sredinom godine bio 7.381.579
izraunati specifini mortalitet i letalitet.

5. Prema podacima populacionog registra za dijabetes u Srbiji je u 2007.
godini evidentirano 16.606 novoobolelih osoba svih uzrasta od dijabetesa
tipa 2, dok je ukupan broj obolelih iznosio 398.764. Izraunati incidenciju i
prevalenciju dijabetesa, ako znamo da je broj stanovnika sredinom 2007.
godine bio 7.381.579.






33
4. MERE CENTRALNE TENDENCIJE SREDNJE
VREDNOSTI

Mere centralne tendencije imaju za cilj da odrede centar osnovnog skupa.
Jednostavnije reeno, ove mere treba da daju informaciju o onome to je tipino,
zajedniko za sve elemente (jedinice) jednog skupa. Vrednosti distribucija frekvencija
(serija) saimamo toliko, da ih svodimo na jednu jedinu vrednost. Postoje vie mera
centralne tendencije i svaka ima svoje prednosti i nedostatke. Dele se na:
- potpune (matematike): aritmetika sredina, harmonijska sredina i
geometrijska sredina i
- poloajne: medijana i mod.


4.1. Aritmetika sredina prosek

Najee koriena mera centralne tendencije je aritmetika sredina ili prosek.
Njena definicija je jednostavna: suma vrednosti podataka podeljena brojem podataka.
Matematika definicija aritmetike sredine je:

1 2 3 n
x + x + x + ... + x x
x = =
n n


gde je:
x - aritmetika sredina (x - bar),
1 2 3 n
x , x , x , ... x - vrednosti obeleja kod pojedinih ispitanika,
n - broj podataka ili veliina uzorka i
E - grko veliko slovo sigma, koje oznaava zbir ili sumu (oznaava
sabiranje pojedinanih vrednosti obeleja x).

Primer: Telesna masa petoro sluajno izabrane novorodjenadi iznosila je: 3,2;
4,8; 3,7; 5,0 i 4,3 kg. Kolika je prosena teina ove grupe novoroenadi?
Reenje: Koristei navedenu optu formulu i opte simbole neophodno je prvo
sabrati vrednosti: x
1
=3,2; x
2
=4,8; x
3
=3,7; x
4
=5,0 i x
5
=4,3 kg, pa njihov zbir podeliti sa 5
opservacija u uzorku (veliina uzorka: n=5). Dakle, aritmetika sredina telesne mase
ove grupe novoroenadi je:
3, 2 4,8 3, 7 5, 0 4, 3
4, 2
5
x kg
+ + + +
= =


Prosena telesna masa pri roenju ove grupe novoroenadi iznosi 4,2 kg.
Dati nain izraunavanja aritmetike sredine, kao centralne vrednosti skupa ili
uzroka, moe da se primeni samo kod malih uzoraka i kada su podaci dati u vidu
empirijske serije, odnosno kada nisu sreeni u vidu distribucije frekvencija.

Aritmetika sredina za prostu distribuciju frekvencija izraunava se na taj
nain to se vrednosti distribucije (x) mnoe (ponderiu) svojim odgovarajuim
34
frekvencijama (f), pa se dobijeni zbir proizvoda (Efx), podeli sa ukupnom frek-
vencijom. Matematika definicija ponderisane aritmetike sredine je:

1 1 2 2 3 3 n n
1 2 3 n
f x + f x + f x + ... + f x f x
x = =
f + f + f + ... + f f

E


gde je f - broj elemenata uzorka.

Primer: Izraunajmo prosek lanova po jednom domainstvu u jednoj zgradi,
na osnovu podataka tabele br. 1. Radi pravilnog postupka i dobijanja tanih vrednosti
treba prvo formirati radnu tabelu.

Radna tabela za izraunavanje ponderisane aritmetike sredine
Broj lanova domainstva
x
Broj domainstava
f
fx
1 8 1 8 = 8
2 11 2 11 = 22
3 29 3 29 = 87
4 11 4 11 = 44
5 4 5 4 = 20
E
63 181

Na osnovu podataka iz radne tabele sledi:
fx
181
x = = = 2,87
f 63


Dakle, navedena zgrada sa 63 domainstva u proseku je imala 2,87 lana po
jednom domainstvu. Pri izraunavanju aritmetike sredine, esto se dobijaju apsurdne
vrednosti, kao 2,87 lana po domainstvu (gornji primer), ili 5,6 pregleda po jednom
korisniku, 2,3 dijagnoze po jednom bolesniku itd. Meutim, ove se vrednosti u statis-
tikim izraunavanjima upotrebljavaju kao takve, pa treba izbegavati zaokruivanje na
cele brojeve.

Aritmetika sredina za distribuciju frekvencije sa grupnim intervalima
izraunava se po slinom postupku, s tim to se grupni intervali zamene svojim arit-
metikim sredinama ( i x ), pa se te vrednosti mnoe odgovarajuim frekvencijama.
Aritmetika sredina grupnog intervala se odreuje na taj nain, to se saberu
poetna (donja) vrednost intervala i zavrna (gornja) vrednost intervala, pa se dobijeni
zbir podeli sa 2. Matematika definicija aritmetike sredine za distribuciju frekvencija
sa grupnim intervalima je:
1 2 3 n 1 2 3 n
1 2 3 n
f x + f x + f x + ... + f x f x
x = =
f + f + f + ... + f f
i
E


gde je: i x - aritmetika sredina grupnog intervala.
35
Primer: Teina 32 uenika je data u vidu distribucije frekvencija sa grupnim
intervalima, koja je predstavljena u prve dve kolone sledee tabele. Da bi izraunali
prosenu teinu uenika potrebno je formirati radnu tabelu uvoenjem jo dve kolone.

Radna tabela za izraunavanje aritmetike sredine na osnovu distribucije
frekvencija sa grupnim intervalima

Telesna masa u kg
x
Broj uenika
f
i x i x f
70-74,99 5 (70+74,99)/2=72,5 362,5
75-79,99 8 (75+79,99)/2=77,5 620,0
80-84,99 14 (80+84,99)/2=82,5 1155,0
85-89,99 5 (85+89,99)/2=87,5 437,5
E 32 2575,0

Iz podataka tabele sledi:
47 , 80
32
0 , 2575
= = =

f
x f
x
i

Prosena teina uenika je 80,47 kg.

iroka primena aritmetike sredine kao mere centralne tendencije nije sluajna.
Ona ne samo da je jednostavna, razumljiva i laka za raunanje, ve ima jo mnoge
poeljne osobine:
1. Moe da se izrauna za bilo koji niz intervalnih podataka, to znai da uvek
postoji;
2. Bilo koji niz podataka ima samo jednu aritmetiku sredinu, to znai da je
ona jedinstvena vrednost bilo kog niza;
3. Za njeno izraunavanje uzimaju se u obzir svi podaci, to znai da na njenu
veliinu utiu sve vrednosti niza, od najmanje do najvee;
4. Suma pojedinanih odstupanja lanova statistike serije od aritmetike sre-
dine uvek je jednaka 0. Kao ilustraciju uzmimo pet novoroenadi iju smo
aritmetiku sredinu ve izraunali: x =4,2.

n Vrednost
x x
1 3,2 3,2-4,2=-1,0
2 4,8 4,8-4,2=0,6
3 3,7 3,7-4,2=-0,5
4 5,0 5,0-4,2=0,8
5 4,3 4,3-4,2=0,1


0

5. Zbir kvadrata odstupanja pojedinanih vrednosti od aritmetike sredine
jednak je minimumu:

= min ) (
2
x x
36
Drugim reima, zbir kvadrata odstupanja od bilo koje druge vrednosti niza, pa i
od medijane i moda, kao mera centralne tendencije vei je od zbira kvadrata odstupanja
od aritmetike sredine:



Ovo je veoma vana osobina aritmetike sredine jer ona omoguava primenu
metoda najmanjih kvadrata.
Aritmetiku sredinu nema smisla raunati ako raspodela nije simetrina, kada
imamo mali broj podataka i kada je izraena velika varijabilnost podataka.
Pored aritmetike sredine, koja predstavlja najee korienu meru centralne
tendencije, pomenuemo i harmonijsku i geometrijsku sredinu koje takoe spadaju u
matematike mere centralne tendencije.

Harmonijska sredina upotrebljava se ree i to kod serija u kojima postoje
ekstremne vrednosti ili u situacijama kada su vrednosti kojima raspolaemo izraene u
proporcijama ili kada su obeleja izraena u merama koje predstavljaju proporcije (na
primer km/h). U tim sluajevima je harmonijska sredina tanija mera centralne
tendencije nego aritmetika sredina.
Ona se rauna po formuli:




Iz formule moemo videti da harmonijska sredina predstavlja recipronu
vrednost aritmetike sredine recipronih vrednosti za koje se sredina izraunava.
Harmonijska sredina je uvek manja i od geometrijske i od aritmetike, osim ako
svi lanovi niza nisu jednaki.
Tipian primer, koji nije iz medicine, ali iz koga je najlake razumeti primenu
harmonijske sredine bi bio sledei: Ako udaljenost od 200km voza pree vozei u
jednom smeru prosenom brzinom od 50km/h, a u drugom smeru brzinom od 100km/h,
kolika je prosena brzina tog vozaa tokom celog puta? Ona nije (50+100)/2=75km/h
jer tada u obzir nije uzeto i ukupno vreme putovanja, ve iznosi:




I zaista, vozau je trebalo 4 sata da pree 200km vozei 50km/h u jednom
smeru i jo 2 sata da pree tih 200km vozei 100km/h, prema tome ukupno 6 sati za
400km. Odatle je prosena brzina iznosila 400/6=66,7km/h, to je rezultat isti kao i
kada smo u formuli za harmonijsku sredinu primenili samo vrednosti dve prosene
brzine.

Primer: U tri laboratorije radi se ista vrsta analize. Iz ovih laboratorija smo
dobili podatke da proseno vreme potrebno za jednu analizu u njima iznosi: u prvoj
1,20 minuta, u drugoj 0,96 minuta i u treoj 0,60 minuta. Nismo dobili informaciju o
tome koliko je analiza uraeno u kojoj laboratoriji, niti za koliko dana se navedeni
podaci odnose. Potrebno je da odgovorimo na sledea pitanja:

>
2 2
) ( ) ( X X Me X

>
2 2
) ( ) ( X X Mod X
1 2 3
1 2 3
1
1 1 1 1
1 1 1 1 1
...
...
n
n
n
H
X X X X
n X X X X
= =
| |
+ + + +
+ + + +
|
\ .
2 2 2
66, 7 /
1 1 1 1 3
0, 03
1 2 50 100 100
n
H km h
X X
= = = = =
+ +
37
Kolika je prosena produktivnost sve tri laboratorije izraena utrokom
vremena po jednoj analizi?
Koliko analiza moe da se uradi u sve tri laboratorije za 8 sati (jedan radni
dan)?
Kada bi na ova pitanja odgovorili na osnovu izraunavanja aritmetike sredine,
rezultati bi bili sledei:
(1,20+0,96+0,60)/3=0,92 minuta iznosi prosean utroak vremena po jednoj
analizi i
3x60x8/0,92=1562,22 analize se mogu uraditi u sve 3 laboratorije za jedan dan.

Kada bi na ova pitanja odgovorili na osnovu izraunavanja harmonijske
sredine, rezultati bi bili sledei:
3
0,85
1 1 1
1, 20 0, 96 0, 60
H = =
+ +
minuta je utroak vremena po jednoj analizi i

3x60x8/0,85=1694,12 analiza moe da se uradi za jedan dan.

U situaciji kada ne raspolaemo informacijom o tome koliko je dana koja od
laboratorija pratila svoju produktivnost, odnosno sa koliko su analiza delili koliko
minuta da bi izraunali vrednosti koje smo mi od njih dobili (1,20, 0,96 i 0,60 minuta
po jednoj analizi) sa vie poverenja moemo prihvatiti rezultate dobijene na osnovu
izraunavanja harmonijske sredine.

Geometrijska sredina se primenjuje u analizi vremenskih nizova i pomou nje
se izraunava prosena stopa promene pojave. Kao i svaka srednja vrednost nalazi se
izmeu najvee i najmanje vrednosti niza za koji se izraunava i brojano se razlikuje
od aritmetike sredine, osim ako svi lanovi niza nisu jednaki. Geometrijska sredina je
uvek manja od aritmetike. Izraunava se kao n-ti koren iz proizvoda njegovih lanova:

1 2 3
...
n
n
G X X X X =

Primer: Ako je nakon oralne primene nekog leka njegova koncentracija u
plazmi u prvom satu iznosila 2 g/mL, u drugom 9 g/mL, a u treem satu 18 g/mL,
onda je koncentracija u drugom satu bila 9/2=4,5 puta vea nego u prvom, a u treem
satu je bila 18/9=2 puta vea nego u drugom satu. Pitanje je koliko je puta koncentracija
rasla u svakom satu?
Odgovor:
2
2
4, 5 2 9 3 puta G = = =

Odnos izmeu aritmetike, harmonijske i geometrijske sredine
Date su vrednosti numerike varijable X:
22, 35, 25, 25, 32, 28, 31, 24, 30, 34, 34, 23.
Izraunajte: aritmetiku, harmonijsku i geometrijsku sredinu?

38
343
28, 58
12
x
x
N
= = =


12
22 35 25 ... 23 28, 23 G = =
12
27,87
1
0, 43055
n
H
x
= = =


27,87<28,23<28,58
H<G< x


4.2. Medijana

Medijana spada u poloajne mere centralne tendencije. Medijana je u pravom
smislu centralna vrednost jer ona statistiki niz deli na dva jednaka dela, od kojih jedan
deo sadri 50% vrednosti manjih od nje, a drugi 50% vrednosti veih od medijane.
Uslov je da se podaci niza prvo srede po veliini od najmanje do najvee vrednosti ili
obrnuto.

Osnovne karakteristike medijane su:
1. U svakoj distribuciji postoji samo jedna medijana
2. Nalazi se izmeu najmanje i najvee vrednosti
3. Na vrednost medijane ne utiu ekstremne vrednosti
4. Ona je reprezentativna mera centralne tendencije kod heterogenih skupova
5. Zbir apsolutnih odstupanja pojedinanih vrednosti od medijane je
minimalan

Za neparan broj elemenata jedne serije ureenih po veliini medijana je vred-
nost srednjeg (centralnog) elementa serije. Njegovo mesto matematiki nalazimo prema
formuli:

2
1 + N
= MMe mesto medijane

Primer: Uzmimo ponovo, telesne mase pet sluajno odabrane novoroenadi
ije su telesne mase bile: 3,2; 4,8; 3,7; 5,0 i 4,3. Ako telesne mase uredimo po veliini
dobijamo:

n x
1 3,2 < Me MMe = (5+1)/2=3
2 3,7 < Me
MMe3 4,3Me Me = 4,3 kg
4 4,8 > Me
5 5,0 > Me

Medijanu predstavlja telesna masa treeg novoroeneta, a njegova teina je
4,3 kg, pa je medijana: Me=4,3 kg. Dva novoroeneta imaju manju telesnu masu, a
dva veu telesnu masu od medijane.
39
Za paran niz vrednosti, medijana se odreuje kao aritmetika sredina dva cen-
tralna lana. Mesta centralnih lanova odreuju se prema obrascima:
lana prvog mesto
N
=
2
lana drugog mesto
N
=
+
2
2


Primer: Dodajmo, prethodnom primeru jo jedno novoroene sa telesnom
masom od 5,2 kg. Uslov je da vrednosti sredimo po veliini:

N x
1 3,2
2 3,7
I cen. l.3 4,3 N/2=6/2=3 mesto prvog centralnog lana
Me=(4,3+4,8)/2=9,1/2=4,55kg
II cen. l.4 4,8 (N+2)/2=(6+2)/2=4 mesto drugog centralnog lana
5 5,0
6 5,2

Centralne lanove navedenog niza predstavljaju teine 3. i 4. novoroeneta, a
medijana je aritmetika sredina ovih telesnih masa. Kod parnog niza, 50%
novorenadi imaju manju telesnu masu od medijane, a 50% veu.
Odreivanje mesta medijane i vrednosti medijane za podatke sreene u vidu
distribucije frekvencije, zahteva sloeniji matematiki postupak, pa emo ovde izneti
samo postupak odreivanja medijane za osnovnu distribuciju frekvencija (bez klasnih
intervala).
Kod distribucije frekvencije, takoe, treba voditi rauna da li je ukupna frek-
vencija paran ili neparan broj. Mesto medijane, tj. element ija vrednost predstavlja
medijanu izraunava se na sledei nain:

= broj paran f je ako MeM


f
2

=
+
broj neparan f je ako MeM
f
2
1


Odreeni element ija vrednost predstavlja medijanu pronalazimo pomou
kumulativnog zbira apsolutnih frekvencija.

Primer: Uzmimo ve poznatu distribuciju frekvencija domainstava prema
broju lanova:

X f
Kumulativni zbir
(odozgo)
Kumulativni zbir (odozdo)
1 8 8 63
2 11 19 55
3 29 48 44
4 11 59 15
5 4 63 4
E 63 - -
40

32
2
1 63
2
1
=
+
=
+
=

f
MeM
Broj lanova 32. domainstva predstavljaja mesto medijane. Kumulativni zbir
odozgo pokazuje da se to domainstvo nalazi izmeu 48 domainstava koja imaju tri
lana, pa je Me=3 lana. I u ovom sluaju 50% domainstava imaju manju ili istu
vrednost kao medijana, a 50% domainstava istu ili veu vrednost od medijane.
I da na kraju rezimiramo: Medijana je grublja ocena od aritmetike sredine. Na
nju ne utiu ekstremne vrednosti niza; ona moe da se izrauna i kada minimalna i
maksimalna vrednost serije nisu poznate.
Primenjuje se kao mera centralne tendencije kod izrazito heterogenih skupova.


4.3. Modus

Mod, modus, tipina vrednost, je poloajna mera centralne tendencije i to je
ona vrednost obeleja ili onaj modalitet obeleja, koji ima najveu frekvenciju, najveu
zastupljenost u okviru ukupne frekvencije.
U primeru u kome je data distribucija frekvencija domainstava prema broju
lanova, najveu frekvenciju pokazuju domainstva koja imaju 3 lana. Prema tome,
vrednost moda je 3 lana.
Danas se kae za Centralnu Srbiju i Vojvodinu da su tipina domainstva sa po
3 lana (roditelji i jedno dete). Tuberkuloza i zarazne bolesti su tipine za nerazvijene,
siromane zemlje. Kardiovaskularne bolesti i rak su tipini za razvijene zemlje.
Tipino je ono to preovladava. Neke pojave mogu da imaju i dve modalne
vrednosti, pa kaemo da su bimodalne.
Znai, mod nije jedna jedina vrednost skupa, kao to je to aritmetika sredina.

Primer: Data je distribucija frekvencija sto studenata prema visini ocene iz
statistike.

Ocena Broj studenata
5
6
7
8
9
10
10
28
12
10
30
10
E
100

f
0
10
20
30
5 6 7 8 9 10
12
10
30
28
10 10


41
Tipine ocene na ispitu iz Statistike su estica (studenti koji ne dolaze na
predavanja) i devetka (studenti koji dolaze na predavanja).


4.4. Meusobni odnos mera centralne tendencije

Ako se vrednosti posmatranog obeleja (x) rasporeuju oko svog proseka tako
da je najvei broj manjih i veih vrednosti simetrian u odnosu na centar, onda se
dobija simetrian raspored, koji se grafiki manifestuje kao simetrina zvonasta linija
kao na sledeem grafikonu.


Mod Me x = = Mod Me x > > Mod Me x < <

Kod ovog rasporeda, aritmetika sredina, medijana i mod su meusobno
jednaki (a).
Ako u distribuciji frekvencije preovlauju ekstremno vee vrednosti od centra
onda se dobija kriva, koja je iskrivljena udesno (pozitivna iskrivljenost). Centralne
vrednosti se pomeraju tako da je aritmetika sredina udesno (zbog veeg uea visokih
ekstremnih vrednosti). Ona ima i najveu vrednost u ovom sluaju meu merama
centralne tendencije (b).
Kad distribucije frekvencije gde preovlauju ekstremno niske vrednosti
iskrivljenost je na levoj strani (negativna iskrivljenost) i aritmetika sredina ima manju
vrednost i od medijane i od moda (c) .
Medijana se kod oba navedena rasporeda nalazi izmeu aritmetike sredine i
moda, ali je po vrednosti blia vrednosti aritmetike sredine. Iz ovog odnosa proizilazi i
aproksimativna matematika veza izmeu mera centralne tendencije:
3 2 Mod Me x =
Izbor mere, koja e da predstavlja osnovni skup zavisi od stepena iskrivljenosti,
odnosno od stepena varijabilnosti vrednosti posmatranog obeleja.
42
4.5. Mere centralne tendencije - izraunavanje u MS Excelu

Primer:
Na ispitu iz statistike polagalo je 15 studenata medicine i 15 stomatologije.
Dobili su sledee ocene:
Medicinari: 10, 6, 9, 10, 10, 5, 6, 9, 8, 7, 10, 8, 9, 8, 10
Stomatolozi: 6, 5, 5, 6, 7, 9, 8, 5, 5, 6, 8, 7, 6, 9, 10,
Izraunati prosenu ocenu studenata medicine i studenata stomatologije?
Reenje:
U radni list Excela unesemo podatke u dve kolone. Kliknemo na praznu eliju u
kojoj elimo da se prikae rezultat, na primer A18. Za izraunavanje aritmetike
sredine iz negrupisanih podataka koristimo funkciju =AVERAGE (raspon podataka).
Zadavanje funkcija je mogue na dva naina. Jedan je Insert/Function a drugi
direktnim klikom na f
x
. U oba sluaja otvara se sledei radni prozor:




U prozoru Insert Function, u polje Or select a category izaberemo Statistical.
U polju Select a function, imamo veliki broj statistikih funkcija, od kojih je potrebno
da izaberemo AVERAGE. Kliknemo na OK i otvara se sledei prozor:
43


Kliknemo na polje Number1, a zatim oznaimo elije od A2 do A16 (ocene
studenata medicine). Na desnoj strani prozora ispod polja Number2 ve vidimo
Formula result, odnosno prosenu ocenu studenata medicine. Kliknemo OK i u eliji
A18 dobijamo prosenu ocenu 15 studenata medicine.
Za izraunavanje prosene ocene studenata stomatologije, odnosno statistikog
niza u koloni B, dovoljno je kopirati formulu iz elije A18 u eliju B18. Kliknemo na
A18 i dovedemo kursor na mali crni kvadrat u desnom donjem uglu. Kada veliki krsti
postane manji, pritisnemo levi taster mia i razvuemo u desno, i tako funkciju zadamo
i na polje B18.

Medijana i mod:
Medijanu i mod izraunavamo na slian nain, birajui u polju Select a function
funkcije MEDIAN ili MODE, a zatim ponavljamo postupke prikazane za
izraunavanje aritmetike sredine.














44
5. MERE VARIJABILNOSTI DISPERZIJE


Osnovna karakteristika vrednosti jednog istog obeleja je, da ta vrednost varira
od jedne do druge statistike jedinice osnovnog skupa. Te vrednosti, mere centralne
tendencije, a pre svega aritmetika sredina, saimaju u jednu brojanu vrednost koja je
reprezentativna za sve vrednosti. Njena reprezentativnost zavisi od stepena
varijabilnosti pojedinanih vrednosti u odnosu na centralnu vrednost, konkretno u
odnosu na aritmetiku sredinu. Ukoliko je varijabilnost manja, utoliko su vrednosti
obeleja sabijenije oko aritmetike sredine (manje odstupaju) i ona je reprezentativnija,
a za takav skup kaemo da je homogen. Obrnuto, ako je varijabilnost vea, odstupanje
pojedinanih vrednosti od aritmetike sredine je vee, a reprezentativnost aritmetike
sredine je manja i za takav skup kaemo da je heterogen.
Ako imamo informaciju da je prosek leenja u jednoj bolnici 8 dana, a u drugoj
takoe 8 dana, to navodi na zakljuak da je duina trajanja leenja kod pojedinih
sluajeva u veini jednaka u obe bolnice. Drugim reima, da su rasporedi duine
trajanja leenja po pacijentu, jednaki u obe bolnice. Meutim, to moe ali ne mora da
bude tako. Da bi smo mogli da poredimo dve ili vie serija, pored informacije o
prosenoj vrednosti, moramo da imamo i informaciju o odstupanju pojedinanih
vrednosti od proseka.
Sledi zakljuak da mere varijabilnosti zapravo ukazuju na reprezentativnost
mera centralne tendencije. Manja mera varijabilnosti ukazuje na veu reprezentativnost
srednje vrednosti i obrnuto. Mere varijabilnosti nas opredeljuju koju od mera centralne
tendencije treba da koristimo, aritmetiku sredinu (ukoliko je skup homogen), ili
medijanu (ukoliko je skup heterogen).
Varijabilnost, disperzija, odstupanje pojedinanih vrednosti ispitivanog
obeleja u odnosu na prosek merimo tzv. merama varijabilnosti ili disperzije. One
mogu da budu, prema brojanom izrazu apsolutne i relativne.

Apsolutne mere varijabilnosti:
1) Interval varijacije;
2) Interkvartilna razlika;
3) Varijansa i
4) Standardna devijacija.

Relativne mere varijabilnosti:
1) Koeficijent varijacije i
2) Standardizovano odstupanje ili z-vrednost.








45
5.1. Apsolutne mere disperzije

5.1.1. Interval varijacije rang (opseg) vrednosti

Interval varijacije je gruba i orijentaciona mera varijacije i predstavlja razliku
izmeu maksimalne i minimalne vrednosti serije. Izraunava se po formuli:

Iv=Xmax-Xmin


Primer: U prethodnom primeru, o duini leenja u dve bolnice, najdue leenje
jednog bolesnika je iznosilo 22 dana, a najkrae leenje je bilo 6 dana. U drugoj bolnici
najdue leenje je bilo 18 dana, a najkrae 5 dana. Na osnovu ovih podataka:

Iv =Xmax-Xmin = 22-6=16 dana prva bolnica
Iv = Xmax-Xmin= 18-5=13 dana druga bolnica

Na osnovu dobijenih vrednosti za interval varijacije zakljuujemo:
1. U prvoj bolnici su ekstremne vrednosti udaljenije od centralne vrednosti
serije nego u drugoj bolnici;
2. Vie se sluajeva u drugoj bolnici po duini leenja grupie oko proseka u
odnosu na prvu bolnicu. Manji interval varijabilnosti koincidira sa veom grupisanou
lanova serije oko centralne vrednosti;
3. to je vei interval varijacije to je vea varijabilnost pojedinanih vrednosti
oko proseka, to je prosek manje reprezentativan i obrnuto, manja vrednost, manja
varijabilnost, vea sabijenost, vea reprezentativnost proseka.

Nedostaci:
a) Uzima u obzir samo dve vrednosti, odnosno, samo dva lana serije, sa
najveom i najmanjom vrednou i
b) Obzirom da se radi o ekstremnim vrednostima to one mogu da budu veoma
udaljene od osnovne koncentracije ostalih vrednosti serije.


5.1.2. Interkvartilna razlika

Primer: Izmerena je telesna masa 11 novoroenadi i dobijene vrednosti su
sreene po veliini:
N 1 2 3 4 5 6 7 8 9 10 11
X 2,8 3,2 3,4 3,6 3,7 3,8 4,0 4,4 4,6 4,8 5,0
Q
1
Q
2
Q
3


Medijanu ovog statistikog skupa predstavlja telesna masa estog novoroen-
eta pa je Me=3,8 kg. Kao to nam je ve poznato, medijana deli niz na 50% vrednosti
manje od medijane i na 50% vrednosti vee od medijane. Ako svaku od ove dve
polovine podelimo na jo po pola, dobijamo etiri jednaka dela statistike serije od
kojih svaki sadri po 25% vrednosti serije. Ovako ustrojeni delovi serije nazivaju se
kvartilima (Q), etvrtinama.
46
Kako jedan kvartil predstavlja etvrtinu serije, to se njihova mesta u nizu
vrednosti izraunavaju na sledei nain:

1. Mesto prvog kvartila
1
1 12
3
4 4
N
MQ
+
= = = . Teina treeg novoroeneta
predstavlja vrednost prvog kvartila (Q
1
), pa je Q
1
=3,4 kg.
U intervalu od 2,8 (minimalna vrednost) do 3,4 kg nalazi se 25% svih vrednosti
serije i ovo su 25% najmanjih vrednosti od ukupnog broja vrednosti (od 100%
vrednosti, od svih vrednosti).

2. Mesto drugog kvartila
2
1 12
6
2 2
N
MQ
+
= = = . Telesna masa estog
novoroeneta predstavlja vrednost drugog kvartila, pa je Q
2
=3,8 kg. Medijana
je u stvari drugi kvartil serije, pa je Me=Q
2
. U intervalu izmeu drugog
(medijane) i prvog kvartila nalazi se 25% vrednosti, koje su vee od vrednosti
intervala prvog kvartila, ali su manje od svih ostalih vrednosti. U naem
primeru ovaj interval je izmeu 3,4 i 3,8 kg.

3. Mesto treeg kvartila
3
3 1 36
9
4 4
N
MQ
+
= = = . Telesna masa devetog
novoroeneta predstavlja vrednost treeg kvartila, pa je Q
3
=4,6 kg. U intervalu
izmeu Q
2
(medijane) i Q
3
nalaze se 25% vrednosti serije vee od 50%
prethodnih vrednosti ali manje od ostalih 25% vrednosti serije. Za na primer to
je interval od 3,8 kg (Q
2
=Me) do 4,6 kg (Q
3
).

4. Vrednost etvrtog intervala predstavlja maksimalnu vrednost serije, pa je u
naem primeru Q
4
=5,0 kg.

Osnovni zakljuak je: Izmeu prvog (Q
1
) i treeg (Q
3
) kvartila nalaze se 50%
svih vrednosti serije, a van ovog intervala ostaju jo 50% vrednosti, od kojih 25%
manjih od Q
1
(ekstremno najmanje vrednosti) i 25% vrednosti vee od Q
3
(ekstremno
najvee vrednosti).
Zato se razlika izmeu treeg i prvog kvartila uzima kao mera varijabilnosti jer
ova mera, za razliku od intervala varijacije iskljuuje ekstremno male i ekstremno
velike vrednosti.
1

Dakle, interkvartilnu razliku, moemo da definiemo kao distancu izmeu
prvog i treeg kvartila, pa je formula za njegovo izraunavanje:

3 1
Iq Q Q =
Za na primer:
Iq = Q
3
-Q
1
= 4,6 3,4 = 1,2 kg


U intervalu izmeu 3,4 kg i 4,6 kg, nalazi se telesna masa 50% novoroenadi,
odnosno u intervalu od 1,2 kg.

Za sve izvedene radnje i konstatacije uslov je i da je serija sreena po veliini vrednosti
od najmanje do najvee ili obrnuto. Drugo, izneti primeri se odnose samo na osnovnu
seriju (prost statistiki niz) i sa neparnim brojem podataka u njemu.
47
to je interkvartilna razlika manja to je varijabilnost vrednosti u seriji manja, a
sabijenost oko centra vea i obrnuto.
Interkvartilna razlika i interval varijacije mogu da se uporeuju i ako je inter-
kvartilna razlika znatno manja od intervala varijacije (vie od dva puta), to znai da na
krajevima serije postoje ekstremno niske i ekstremno visoke vrednosti. U naim
primeru za telesnu masu novoroenadi:
a) Iv= X
max
X
min
= 5,0 2,8 = 2,2 kg
b) Iq = Q
3
-Q
1
= 4,6 3,4 = 1,2 kg
c) Iv/Iq = 2,2/1,2 = 1,8
Interval varijacije je manje od dva puta vei od interkvartilne razlike, to znai
da nema novoroenadi sa ekstremnim vrednostima u odnosu na prosek.


5.1.3. Varijansa i standardna devijacija

Dok interval varijacije obuhvata samo dve vrednosti serije, a interkvartilna
razlika 50% vrednosti, dotle varijansa i standardna devijacija obuhvataju distancu svih
vrednosti u odnosu na prosek (centar), odnosno u odnosu na aritmetiku sredinu.
Kako je zbir odstupanja svih lanova serije od aritmetike sredine jednak nuli,
to nije mogue izraunati prosek odstupanja.
2
Da bi se izbegla 0, pristupilo se
kvadriranju razlika pojedinanih vrednosti od aritmetike sredine i iz njihovog zbira se
izraunava proseno kvadratno odstupanje varijansa (SD
2
), ija je matematika
definicija:
( )
2
2
X X
SD
n



Transformacijom gore navedene formule dobija se radna formula za
izraunavanje prosenog kvadratnog odstupanja svih vrednosti serije od aritmetike sre-
dine:
2
2
2
X
SD X
n
=



Primer: Uzmimo telesne mase 11 novoroenadi iz prethodnog poglavlja:

2,9 3,0 3,2 3,4 3,5 3,7 3,9 4,1 4,2 4,5 4,7

Pitanje je: Kolika je vrednost varijanse za datu seriju podataka?






2
Moe da se izrauna i apsolutno proseno odstupanje od proseka, kada se
zanemare plus i minus vrednosti, ali ono ne omoguava dalje statistike
operacije, pa ovde kao takvo nije ni obraeno.
48
Reenje: Radi izraunavanja varijanse po navedenim formulama treba
konstruisati sledeu radnu tabelu:

N X
X X ( )
2
X X
X
2
1 2,9 2,9 - 3,73 = -0,83 0,6889 8,41
2 3,0 3,0 - 3,73 = -0,73 0,5329 9,00
3 3,2 3,2 - 3,73 = -0,53 0,2809 10,24
4 3,4 3,4 - 3,73 = -0,33 0,1089 11,56
5 3,5 3,5 - 3,73 = -0,23 0,0529 12,25
6 3,7 3,7 - 3,73 = -0,03 0,0009 13,69
7 3,9 3,9 - 3,73 = +0,17 0,0289 15,21
8 4,1 4,1 3,73 = +0,37 0,1369 16,81
9 4,2 4,2 - 3,73 = +0,47 0,2209 17,64
10 4,5 4,5 - 3,73 = +0,77 0,5929 20,25
11 4,7 4,7 - 3,73 = +0,97 0,9409 22,09
E 41,1 0,00 3,5859 157,15

Postupak
1. Prvo izraunamo aritmetiku sredinu:
kg
n
X
X 73 , 3
11
1 , 41
= = =


2. Zatim izraunamo razlike izmeu svake vrednosti i vrednosti aritmetike sredine:
X-3,73 kg (trea kolona u radnoj tabeli). Obavezno treba proveriti da li je suma
razlika jednaka 0. Ako nije, onda postoji greka u izraunavanju aritmetike
sredine. Zanemarljiva razlika, kao u naem primeru moe da se javi zbog
zaokruivanja decimala.
3. Dobijene razlike kvadriramo i kvadrate saberemo i na taj nain dobijemo ukupnu
sumu kvadratnog odstupanja (etvrta kolona u radnoj tabeli):
( )
2
3,5859 X X =


4. Na osnovu podataka iz radne tabele, a na osnovu formule, dobijamo:
( )
2
2 2
3, 5858
0,33
11
X X
SD kg
n

= = =



Po drugoj formuli, koja se obino i naziva radnom formulom za varijansu, znatno
je jednostavnije izraunati varijansu, a vrednost je ista. Umesto tree i etvrte kolone iz
predhodne radne tabele, dovoljno je formirati kolonu sa kvadratima svake vrednosti
(X
2
) i dobijene kvadrate sabrati (EX
2
).
Kako je za na primer EX
2
= 157,15 (peta kolona u prikazanoj radnoj tabeli) to je:

2
2 2
157,15
13, 91 0, 33
11
X
SD X kg
n
= = =





I ovim postupkom je dobijena ista vrednost za varijansu, pa ga zbog jednostav-
nosti treba primenjivati u praksi.
49
Treba uoiti da je dobijena vrednost varijanse iskazana kao drugi stepen merne
jedinice, odnosno 0,33 kg
2
, to je apsurdna vrednost i nepogodna je za poreenje.
Izraunavanjem kvadratnog korena iz varijanse dobija se vrednost standardne
devijacije, najee koriene mere varijabilnosti, koja predstavlja proseno odstupanje
od aritmetike sredine izraeno u istim mernim jedinicama u kojima je izraena i
vrednost posmatranog obeleja.
Formule za njeno izraunavanje su:
2 2
2
2 2
( )
ili
X X X
SD SD SD X
n n

= = =



Standardna devijacija za na primer bi imala vrednost:
kg SD SD 57 , 0 33 , 0
2
= = =

Zakljuivanje: to je vrednost standardne devijacije manja, to je sabijenost
vrednosti oko aritmetike sredine vea, pa je i njena reprezentativnost za seriju (uzorak
ili osnovni skup) vea i obrnuto, vea vrednost standardne devijacije - vea
varijabilnost i sve ostalo to sledi iz toga.
Nedostatak: Standardna devijacija omoguava poreenje izmeu varijabilnosti
dve serije ako su vrednosti date u istim mernim jedinicama i ako su aritmetike sredine
serija meusobno jednake. Meutim, i pored ovog nedostatka, kao to emo videti, u
statistikoj metodologiji pored aritmetike sredine, standardna devijacija je odigrala
najznaajniju ulogu.
Varijansa i standardna devijacija za distribuciju frekvencije, kao i aritmetika
sredina, zahtevaju sloenije matematike postupke, mada u principu postoji analogija sa
izraunavanjem kao kod proste statistike serije.

a) Varijansa i standardna devijacija za osnovnu distribuciju frekvencije (bez
grupnih intervala) izraunavaju se po formulama:
( )
2
2
2
2 2
ili
f X X
fX
SD SD X
f f

= =



, a podsetimo se:
fX
X
f
E
=
E


( )
2
2
2
2
ili
f X X
fX
SD SD SD X
f f

= = =





U praksi treba koristiti drugu formulu za koju je sadraj radne tabele:

X f fX fX
2

X
1
f
1
f
1
X
1
(f
1
X
1
)X
1
= f
1
X
1
2

X
2
f
2
f
2
X
2
(f
2
X
2
)X
2
= f
2
X
2
2

X
3
f
3
f
3
X
3
(f
3
X
3
)X
3
= f
3
X
3
2


X
n
f
n
f
n
X
n
(f
n
X
n
)X
n
= f
n
X
n
2

E Ef Ef X EfX
2

50

b) Varijansa i standardna devijacija za distribuciju frekvencije sa grupnim
intervalima izraunavaju se po formulama:
2 2
2 2
2 2
i
i i
fX fX
SD X SD SD X
f f
= = =




Podsetimo se:
1. Aritmetika sredina grupnog intervala izraunava se tako to se poetna
(donja, manja) vrednost i zavrna vrednost (gornja, vea) intervala saberu,
pa se dobijeni zbir podeli sa 2.
2. Formula aritmetike sredine za distribuciju frekvencija sa grupnim
intervalima je:
i
fX
X
f
E
=
E




5.2. Relativne mere disperzije

Osnovni nedostatak apsolutnih mera varijabilnosti, pa i standardne devijacije
kao najrelevantnije, je u tome to se njihove vrednosti moraju da iskazuju u mernim
jedinicama u kojima je iskazano posmatrano obeleje, pa nije mogue poreenje
varijabilnosti dve serije sa razliitim mernim jedinicama. Ovaj problem je razreen
relativnim merama varijabilnosti (1) Koeficijentom varijacije i (2) z -vrednou.


5.2.1. Koeficijent varijacije

Koeficijent varijacije (Cv) je odnos (kolinik) izmeu standardne devijacije i
aritmetike sredine. Obino se iskazuje u procentima, pa je njegova formula:
100
v
SD
C
X
=

Primer: Kod 11 novoroenadi telesna masa je u proseku iznosila X =3,73 kg
sa SD=0,57 kg, dok je njihova telesna duina u proseku bila X =50 cm sa SD=10 cm.
Da li je duina novoroenadi varijabilnija od telesne mase pri roenju?
Za telesnu masu koeficijent varijacije je:
0, 57
100 100 15, 28%
3, 73
SD
Cv
X
= = =
a za telesnu duinu on iznosi:
10
100 100 20, 00%
50
SD
Cv
X
= = =

Zakljuivanje: to je relativna vrednost koeficijenta varijabilnosti manja, to je i
varijabilnost manja, a sabijenost oko proseka vea.
51
Postoji pravilo po kome ako je relativna vrednost koeficijenta varijacije manja
od 30%, statistiki niz (uzorak, osnovni skup) moe se smatrati homogenim, a
aritmetika sredina reprezentativnom centralnom vrednou.

C
v
< 30% - homogeni skup
C
v
> 30% - heterogeni skup

Prema ovom pravilu, i telesna masa i telesna duina 11 novoroenadi pred-
stavljaju homogen uzorak (Cv=15,28%<30% i Cv=20%<30%), pri emu je telesna
masa homogenija jer njena standardna devijacija iznosi 15,28% od prosene vrednosti,
a standardna devijacija za duinu iznosi 20,00% od njene aritmetike sredine.


5.2.2. Standardizovano odstupanje

Sve dosadanje mere varijabilnosti, su mere zajednikog (ukupnog) odstupanja
svih vrednosti od sopstvenog proseka. Meutim, varijacija se moe ocenjivati i sa
gledita individualnih podataka, odnosno svake vrednosti pojedinano.
Odstupanje jedne pojedinane vrednosti od prosene vrednosti nekog obeleja
moemo prikazati apsolutnom razlikom izmeu te vrednosti i aritmetike sredine:
X X
. Meutim, u praksi se ee koristi relativna mera varijabilnosti koja predstavlja
odnos izmeu apsolutne razlike i standardne devijacije, a naziva se standardizovano
odstupanje i obeleava se kao Z vrednost:
X X
Z
SD

=


Standardizovano odstupanje pokazuje koliko iznosi odstupanje vrednosti
numerikog obeleja jednog ispitanika od prosene vrednosti tog obeleja kod svih
ispitanika izraeno u jedinicama standardne devijacije.
Z vrednost moe posluiti za poreenje varijabilnosti istog obeleja kod
razliitih ispitanika. Takoe, standardizovano odstupanje svodi pojedinana odstupanja
svih obeleja na istu mernu jedinicu, tj. standardnu devijaciju i zbog toga se moe
koristiti za poreenje varijabilnosti razliitih obeleja kod jednog ispitanika.
Z vrednosti za razliita obeleja kod jednog ispitanika se mogu sabrati. Na taj
nain se jednom kumulativnom Z vrednou prikazuje varijabilnost razliitih obeleja.
Z-vrednost ima svoju posebnu ulogu kod tzv. standardizovanog normalnog
rasporeda, o emu e biti rei u posebnom poglavlju.

Primer: U grupi od 10 ispitanika koji imaju problema usled skolioze, pored
drugih ispitivanja, izmerene su vrednosti testa stajanja i testa hodanja. Vrednost testa
stajanja (vreme koje ispitanik moe da izdri u stojeem stavu do pojave bola) je kod
svih ispitanika u proseku iznosila 45 minuta sa standardnom devijacijom od 10 minuta.
Prosena vrednost testa hodanja (rastojanje koje pacijent moe da pree do pojave bola)
je iznosila 1500 metara sa standardnom devijacijom od 300 metara. Iz definicija oba
testa jasno je da manje vrednosti ukazuju na nepovoljniji rezultat.
52
Jedan od ispitanika je imao vrednost testa stajanja od 50 minuta, a testa hodanja
od 1300 metara. Drugi ispitanik je imao vrednost testa stajanja od 40 minuta, a testa
hodanja od 1400 metara. Pitanja su:
1. Koliko su vrednosti testova stajanja i hodanja kod svakog od ovih ispitanika
odstupale od prosenih vrednosti kod svih ispitanika?
2. Koje obeleje je iskazalo vee odstupanje od prosene vrednosti kod svakog
od ovih ispitanika?
3. Koji ispitanik je imao povoljnije rezultate, kako po vrednostima svakog od
testova, tako i posmatrajui rezultate oba testa u celini?

I ispitanik II ispitanik
Test stajanja
50 45
0, 50
10
Z

= =

40 45
0, 50
10
Z

= =

Test hodanja
1300 1500
0, 67
300
Z

= =

1400 1500
0, 33
300
Z

= =

Kumulativna vrednost oba testa
(0, 50) ( 0, 67) 0, 50 0, 67 0,17 Z = + = =

( 0, 50) ( 0, 33) 0, 50 0, 33 0,83 Z = + = =



Odgovori:
1. Vrednost testa stajanja je kod prvog ispitanika bila za 0,50 standardnih
devijacija vea (Z=0,50), a kod drugog za 0,50 standardnih devijacija manja (Z=-0,50)
od prosene vrednosti kod svih ispitanika. Vrednosti testa hodanja su kod oba ispitanika
bile manje od prosene vrednosti kod svih ispitanika, kod prvog za 0,67 (Z=-0,67), a
kod drugog za 0,33 standardnih devijacija (Z=-0,33).
2. Kod prvog ispitanika je vrednost testa hodanja pokazala vee odstupanje od
prosene vrednosti, a kod drugog ispitanika vrednost testa stajanja.
3. Na testu stajanja je prvi ispitanik imao povoljniji rezultat jer je njegova
vrednost testa bila vea od prosene, a drugi ispitanik je imao manju vrednost od
prosene. Na testu hodanja su oba ispitanika imala manje vrednosti testa od prosene,
ali je odstupanje bilo manje kod drugog ispitanika to predstavlja povoljniji rezultat.
Zbir odstupanja vrednosti oba testa je kod prvog ispitanika iznosio EZ=-0,17
standardnih devijacija, a kod drugog EZ=-0,83 standardnih devijacija i zakljuujemo da
prvi ispitanik ima povoljniji rezultat u celini.


5.3. Mere varijabiliteta - izraunavanje u MS Excelu

Varijansa i standardna devijacija:

Varijansu iz negrupisanih podataka izraunavamo pomou funkcije:
=VAR(raspon podataka)
Za izraunavanje standardne devijacije koristimo funkciju:
=STDEV(raspon podataka)
53
Za izraunavanje intervala varijacije, interkvartilne razlike, koeficijenta
varijacije i Z vrednosti u MS Excel-u ne postoje direktne funkcije ve se svaka od njih
dobija kroz nekoliko koraka.

U sledeem primeru prikazaemo kako bi izraunali sve prikazane mere
centralne tendencije i varijabiliteta, odnosno kako bi u potpunosti opisali statistiku
seriju podataka za telesnu masu 11 novoroenadi
3
.
Prvo u kolonu A radnog lista, koju smo oznaili sa TELESNA MASA,
unesemo vrednosti telesne mase novoroenadi u elije od A2 do A12.
Zatim u zasebnim elijama, koje smo sa leve strane oznaili nazivima
parametara, unoenjem funkcija i opsega elija sa podacima izraunamo sve statistike
parametre za koje u Excelu postoje definisane funkcije, a to su:

Parametar: Funkcija:
Aritmetika sredina AVERAGE(A2:A12),
Medijana MEDIAN(A2:A12),
Mod MODE(A2:A12),
Maksimalna vrednost MAX(A2:A12),
Minimalna vrednost MIN(A2:A12),
Varijansa VAR(A2:A12),
Standardna devijacija STDEV(A2:A12),
Prvi kvartil QUARTILE(A2:A12;1),
4

Trei kvartil QUARTILE(A2:A12;3)





3
Jednu vrednost od 3,4kg smo zamenili sa 3,5gk kako bi serija imala i Mod.
4
Za kvartile je u posebnom polju radnog prozora funkcije potrebno upisati i koji kvartil zelimo da izracunamo
(1., 2. ili 3.)
54
Interval varijacije izraunavamo tako to u posebnu eliju (u naem primeru
D11, koju smo predhodno oznaili nazivom parametra sa leve strane) ukucamo znak =,
zatim kliknemo na eliju D5 (tu nam se nalazi izraunata maksimalna vrednost), potom
ukucamo znak -, zatim kliknemo na eliju D6 (tu nam se nalazi izraunata maksimalna
vrednost) i na kraju pritisnemo dugme Enter na tastaturi. U eliji D11 se pojavljuje
vrednost intervala varijacije od 1,80, a u formula baru se vidi formula koju smo upisali
u eliju, odnosno =D5-D6.



Za izraunavanje interkvartilne razlike u eliju D12 upiemo znak =, kliknemo
na eliju D10 (tu nam se nalazi izraunata vrednost treeg kvartila), upiemo znak -,
kliknemo na eliju D9 (tu nam se nalazi izraunata vrednost prvog kvartila) i pritisnemo
dugme Enter. U eliji D12 se pojavljuje vrednost interkvartilne razlike od 0,80, a u
formula baru se vidi formula koju smo upisali u eliju, odnosno =D10-D9.

Za izraunavanje koeficijenta varijacije u eliju D13 upiemo znak =, kliknemo
na eliju D8 (tu nam se nalazi izraunata vrednost standardne devijacije), upiemo znak
/, kliknemo na eliju D2 (tu nam se nalazi izraunata vrednost aritmetike sredine),
ukucamo *100 i pritisnemo dugme Enter. U eliji D13 se pojavljuje vrednost
koeficijenta varijacije od 15,86, a u formula baru se vidi formula koju smo upisali u
eliju, odnosno =D8/D2*100.

Ukoliko bi eleli da izraunamo Z vrednost za neku pojedinanu vrednost, na
primer za 3,5 kg, u eliju D14 upiemo =(3,5- zatim kliknemo na eliju D2 (tu nam se
nalazi izraunata vrednost aritmetike sredine), potom upiemo )/, zatim kliknemo na
eliju D8 (tu nam se nalazi izraunata vrednost standardne devijacije) i pritisnemo
dugme Enter. U eliji D14 se pojavljuje Z vrednost od -0,41, a u formula baru se vidi
formula koju smo upisali u eliju, odnosno =(3,5-D2)/D8.

55
































56
Pitanja i zadaci za vebu

1. Definii pojmove: masovna pojava; statistika jedinica; obeleje; osnovni skup
i varijabilnost?
2. U emu je bitna razlika izmeu ive i neive prirode?
3. U emu je razlika izmeu osnovne empirijske serije i distribucije frekvencije?
4. Da li atributivna obeleja mogu da uzmu svaku brojanu vrednost?
5. Saini anketu o nekom problemu i sprovedi je meu licima iz okoline za koja
smatra da su zainteresovana za taj problem. Sredi podatke iz ankete u vidu
serija, tabela i prikai grafiki. Analiziraj dobijene informacije.

6. Dati su originalni podaci o ocenama studenata na ispitu iz Statistike:

5 6 9 9 6 7 6 10 8 6 9 5 6 8
6 6 10 8 6 9 10 7 5 9 10 6 8 10
6 8 8 5 8 9 7 9 6 9 9 6 6 9

Zadatak: 1. Datu osnovnu seriju sredi u vidu distribucije frekvencije; 2. Izraunaj
mere centralne tendencije i varijabilnosti i 3. Konstruii statistiku tabelu i
predstavi grtafiki.

7. Dati su podaci o starosti 10 radnika u godinama i visini zarada u dinarima:

N 1 2 3 4 5 6 7 8 9 10
Starost (godina) 51 47 44 50 56 45 71 38 52 61
Zarada (dinara) 300 400 200 600 500 200 900 300 200 600

Zadatak: Izraunaj koeficijent varijacije i prosudi koji je niz varijabilniji?
8. U jednoj ambulanti, otkriven je po godinama sledei broj zaraznih bolesti:

Godina 1987 1988 1989 1991 1992 1993 1994
Broj obolelih 135 124 104 96 91 140 145

Zadatak: Datu vremensku seriju prikai grafiki. ta zapaa za 1993. i 1994.
godinu?

9. Data je empirijska serija telesne mase 50 regruta:

72 90 70 73 81 81 86 76 87 76
73 70 81 74 70 81 87 77 83 82
78 74 80 75 72 83 90 80 83 83
79 84 80 79 84 84 72 81 84 88
80 88 82 80 85 81 82 91 90 80

Zadatak: 1. Empirijsku seriju sredi u vidu distribucije frekvencije sa veliinom
grupnog intervala od 5 kg; 2. Predstavi grafiki, najmanje na dva naina i 3.
57
Koliko je udaljena od proseka teina regruta od 78 kg, a koliko teina regruta od
90 kg? Zato ove vrednosti imaju suprotne prtedznake: plus i minus?

10. Vreme krvavljenja kod 10 osoba obolelih od esencijalne trombocitopenije
iznosilo je:

Pacijenti 1 2 3 4 5 6 7 8 9 10
Vreme krvavljenja (minuti) 4 8 6 8,2 7 5 4,5 9 7,5 10

Zadatak: 1. Odredi medijanu; 2. Izraunaj interval varijacije i interkvartilnu
razliku i uporedi dobijene vrednosti. ta moe da zakljui?

11. Izmerena je koncentracija SO
2
na 10 mernih mesta:

Merna mesta 1 2 3 4 5 6 7 8 9 10
Vrednosti SO
2
(g/m
3
) 74 5 200 30 40 120 0 50 90 100

Zadatak: 1. Koja mera centralne tendencije moe da reprezentuje datu seriju? 2.
Odredi vrednosti prvog (Q
1
) i treeg (Q
3
) kvartila i interkvartilnu razliku.

12. Odreen je radijalni puls kod 15 odraslih osoba mukog pola i kod 15 osoba
enskog pola i dobijene su sledee vrednosti:

Mukarci 60 62 69 65 74 67 71 73 78 81 83 71 76 75 72
ene 61 72 73 81 86 80 82 79 76 66 78 81 84 67 70

Zadatak: 1. Izraunaj koeficijent varijacije za oba niza i oceni varijabilnost. 2.
Sredi serije u vidu distribucije frekvencije sa veliinom intervala od 3 jedinice i
izraunaj aritmetiku sredinu. Zato se vrednost aritmetike sredine izraunate iz
empirijskog niza razlikuje od aritmetike sredine izraunate iz distribucije
frekvencije sa grupnim intervalima?

13. Broj stanovnika prema popisu iz 1991. godine u sledeim okruzima bio je:
Niki okrug: 395.688; Topliki okrug: 111.706; Pirotski okrug: 116.876;
Jablaniki: 255.091 i Pinjski okrug: 242.369.
Zadatak: Date podatke predstavi u vidu statistike tabele i predstavi grafiki.

14. Izmerene su telesne mase i telesne visine 13 deaka:





Zadatak: 1. Izraunaj mere centralne tendencije za svaku seriju. 2. Predstavi
grafiki i ucrtaj prave za aritmetiku sredinu, medijanu i mod. Nai njihov odnos
i odgovori zato se medijana po vrednosti uvek nalazi izmeu aritmetike sredine
i moda, bilo da je asimetrija rasporeda ulevo ili udesno? 3. Proveri da li se dobija
ista vrednost za mod iz aproksimativne veze: mod = 3 Me -2 x .
N 1 2 3 4 5 6 7 8 9 10 11 12
Masa (kg) 43 48 50 43 46 40 49 41 47 40 39 43
Visina (cm) 140 150 152 140 145 141 145 140 146 135 139 140
58

15. Broj umrle odojadi po mesecima u godini na podruju N, bio je:

Meseci jan feb mar apr maj jun jul avg sep okt nov dec
Umrla odojad 25 15 10 5 12 13 15 30 24 15 10 14

Zadatak: Datu vremensku seriju prikai grafiki najmanje na dva naina. ta
zapaa i kako to objanjava?

16. Data je distribucija domainstava prema broju lanova:

Broj lanova 1 2 3 4 5 6 7
Broj domainstava 14 30 43 38 19 14 12

Zadatak: Odredi medijanu i mod, i predstavi grafiki.

17. Pri upisu u prvi razred osnovne kole vre se sistematski lekarski pregledi. Pored
ostalog meri se i sposobnost dece. Jedne godine, kod jedne generacije dobijeni su
sledei rezultati (poenima od 1-12 ocenjene su sposobnosti dece):

Broj poena 1 4 7 9 10 11 12
Deaci 260 544 660 1200 1800 960 70
Devojice 265 540 600 1200 1850 700 65

Zadatak: 1. Odrediti koeficijent varijacije i za jednu i za drugu grupu i oceniti
varijabilnost. 2. Odredi medijanu i mod i 3. Predstavi grafiki.

18. U jednom domu zdravlja prosean broj dnevne optereenosti lekara iznosio je 25
pregleda sa standardnom devijacijom od 5 pregleda, a u drugom domu zdravlja
prosena dnevna optereenos je bila 30 pregleda sa standardnom devijacijom od
4 pregleda. Ako lekar N u prvom domu zdravlja ima 20 pregleda dnevo, a lekar
M u drugom domu zdravlja 26 pregleda dnevno, koji je od ova dva lekara tee
podnosio svoje dnevno optereenje s obzirom na prosenu optereenost lekara u
odgovarajuem domu zdravlja?














59
6. TEORIJSKE RASPODELE VEROVATNOA


Kod veine pojava sluajno promenljive ne uzimaju vrednosti nasumino i
haotino ve se kod njih mogu uoiti izvesne zakonitosti rasporeda vrednosti, to vie
to je broj jedinica posmatranja vei (prema zakonu velikih brojeva).
Raspodela ili distribucija predstavlja raspored vrednosti nekog numerikog
obeleja ili raspored modaliteta nekog atributivnog obeleja.
Kod veine obeleja njihove vrednosti prate sledeu zakonitost rasporeda:
najvei broj vrednosti se nalazi oko aritmetike sredine, njihov broj postepeno opada
to se vie razlikuju od proseka, bilo da su manje ili vee od njega, tako da su
ekstremno niske ili visoke vrednosti zastupljene u vrlo malom broju.
U prirodi i drutvu postoje dve vrste pojava. U jednu vrstu spadaju one pojave
iji su svi uslovi nastajanja poznati i najee malobrojni, a deavaju se prema tano
definisanim zakonitostima. Ovakve pojave deavaju se uglavnom u neivoj prirodi, a
izuavaju ih fizika i hemija. Kada su svi uslovi ispunjeni, nastajanje ovih pojava je
neminovno ili potpuno izvesno, a veze izmeu uzroka i posledica su konstantne i
nepromenljive i takve veze se nazivaju funkcionalne. Kod funkcionalnih veza jedan isti
uzrok dovodi uvek do iste posledice, u uslovima kada su svi drugi uzroci kontrolisani i
konstantni.
U drugu vrstu spadaju one pojave koje su posledice delovanja niza faktora koji
su najee samo delimino poznati i koji deluju u razliitim kombinacijama, a pojave
ove vrste deavaju se uglavnom u ivoj prirodi i drutvu. Mada i kod njih vae
odreene zakonitosti, pojave u ivoj prirodi i drutvu se ne moraju ispoljiti i uoiti kod
svakog pojedinanog sluaja ve samo na velikom broju, odnosno masi pojava.
Nastajanje ovih pojava pod delovanjem uzronih faktora nije neminovno ve se deava
sa odreenom verovatnoom, a veze izmeu uzroka i posledica nisu nepromenljive, ve
u odreenoj meri variraju i takve veze se nazivaju stohastike ili statistike veze, a same
pojave stohastike pojave. Kod stohastikih pojava jedan isti uzrok ne dovodi uvek do
iste posledice, jer ili nije mogue stvoriti uslove u kojima su i svi drugi uzroci
kontrolisani i konstantni ili svi uzroci jo uvek nisu poznati.
Statistika metodologija je formulisana tako da se primenjuje pri prouavanju
stohastikih pojava, odnosno onih koje se ne deavaju neminovno ve sa odreenom
verovatnoom. U uvodnom delu ovog udbenika je navedeno da se statistika
metodologija zasniva na teoriji verovatnoe i zakonu velikih brojeva. U ovom poglavlju
e biti rei o najee primenjivanim raspodelama verovatnoe.
Za razliku od empirijskih distribucija frekvencija evidentiranih (dobijenih,
opaenih) podataka, teorijske distribucije verovatnoe opisane su matematikim
modelima.
Kada neka empirijska distribucija aproksimira, tj. sledi odreenu teorijsku
distribuciju verovatnoe, moemo upotrijebiti teorijsko znanje o toj distribuciji kako
bismo dobili potrebne odgovore na pitanja o svojim evidentiranim podacima. To
najee zahteva procenu verovatnoe.
Najznaajnije teorijske diskontinuirane distribucije verovatnoa su: binomna i
Puasonova, dok su najvanije kontinuirane distribucije verovatnoa: normalna, t, Hi
kvadrat i F raspodela.
Prema jednainama specifinim za svaku od teorijskih distribucija verovatnoe,
a koje se nazivaju funkcije gustine verovatnoe, sve ove raspodele moemo prikazati
60
grafiki odgovarajuim krivama u koordinatnom sistemu. Pri tome horizontalna osa
predstavlja vrednosti sluajno promenljive X, a vertikalna osa predstavlja verovatnou
tih vrednosti. Ukupna povrina ispod krive iznosi 1 (100%) i predstavlja verovatnou
dobijanja svih moguih vrednosti, odnosno nastupanja svih moguih dogaaja.
Verovatnoa da X lei izmeu neke dve vrednosti jednaka je povrini ispod krive
izmeu te dve vrednosti.


6.1. Binomna distribucija verovatnoe

Binomnu distribuciju definisao je Jacob Bernuolli 1700. godine. To je teorijska
distribucija za diskontinuirana sluajno promenljiva obeleja kada imamo dva mogua
ishoda: da i ne (uspeh i neuspeh) u n moguih dogaaja. Ovakva obeleja nazivaju se
dihotomna.
Jednaina binomne distribucije, odnosno verovatnoa da u seriji od n pokuaja
uspeni dogaaj nastupi tano x puta glasi:
( )
( )
!
(1 )
! !
x n x
x
n
P p p
x n x

=


gde su: x broj uspenih dogaaja, n broj pokuaja, a p verovatnoa uspeha za svaki
pokuaj. Znak interpunkcije ! oznaava faktorijel. Podsetimo se da faktorijel npr. broja
tri iznosi: 3!=321=6, a faktorijel broja pet: 5!=54321=120. Posebno je pravilo
da faktorijel od nule (0!) iznosi 1. Podsetimo se, takoe, da nulti stepen bilo kog broja
(x
0
) iznosi 1.

Primer: Pet studenata izalo je na pismeni deo ispita iz statistike, kod koga
ishod moe biti uspeh (poloio) ili neuspeh (nije poloio). Na osnovu rezultata
predhodnih ispita poznato nam je da je prolaznost na ovom ispitu 50% ili p=0,5. Koje
su verovatnoe svih moguih ishoda na ispitu?

Ishod (broj studenata
koji e poloiti)
Verovatnoa
5 (svi)
( )
5 5 5
(5)
5!
0, 5 (1 0, 5) 0, 03125
5! 5 5 !
P

= =


4
( )
4 5 4
(4)
5!
0, 5 (1 0, 5) 0,15625
4! 5 4 !
P

= =


3
( )
3 5 3
(3)
5!
0, 5 (1 0, 5) 0, 31250
3! 5 3 !
P

= =


2
( )
2 5 2
(2)
5!
0, 5 (1 0, 5) 0, 31250
2! 5 2 !
P

= =


1
( )
1 5 1
(1)
5!
0, 5 (1 0, 5) 0,15625
1! 5 1 !
P

= =


0 (nijedan)
( )
0 5 0
(0)
5!
0, 5 (1 0, 5) 0, 03125
0! 5 0 !
P

= =


Ukupno 1,00000

61
Ovu distribuciju verovatnoa moemo prikazati i grafiki:

0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0 1 2 3 4 5
Broj studenata koji e poloiti
V
e
r
o
v
a
t
n
o

a


Osobine binomne distribucije:
- Zavisi od dva parametra: broja ispitanika u uzorku ili broja ponavljanja
pokuaja - n i stvarne verovatnoe uspeha za svakog ispitanika ili za svaki pokuaj - p;
- to je uzorak (broj pokuaja) n vei distribucija je to vie simetrina, bez
obzira na vrednost p. Kada n ima malu vrednost, distribucija je simetrina u
sluajevima kada je p=0,5, zakrivljena je u desno kada je p<0,5, a ako je p>0,5
distribucija je zakrivljena u levo;
- Binomna distribucija se upotrebljava pri zakljuivanju o proporcijama.


6.2. Puasonova distribucija

Puasonova distribucija verovatnoe postoji kada dogaaji neke vrste nastaju
sluajno u vremenu ili kada se neke estice rasporeuju sluajno u prostoru, a nazvana
je po francuskom matematiaru Simeon Deniz Puasonu.
Predpostavimo da se odreena vrsta dogaaja javlja po sluajnom rasporedu, sa
prosenom uestanou x u nekom vremenskom intervalu T. Broj dogaaja x sluajno
varira u svakoj jedinici vremena n vremenskog intervala T i moe iznositi 0, 1, 2, ... i td.
Koja je verovatnoa da e se odreena vrednost x pojaviti u nekoj jedinici vremena n?
Da predhodno pitanje preformuliemo u razumljiv primer: U nekom gradu se u
toku jedne godine proseno dnevno raa petoro dece. Koja je verovatnoa da e se u
jednom danu u tom gradu roditi desetoro dece?
Formula koja definie verovatnou po Puasonovoj distribuciji glasi:
( )
!
x
x
x
x e
P
x

=
Iz formule je uoljivo da je Puasonova distribucija odreena samo jednim
parametrom i to prosenom uestalou nastupanja dogaaja x . Sa e je oznaena
osnova prirodnog logaritma, koja predstavlja konstantnu vrednost (e = 2,718...).
Uvoenjem svih predpostavljenih vrednosti x u datu formulu izraunavaju se
verovatnoe za njihovo javljanje.
62
Za na primer u kome je x =5 verovatnoe javljanja odreenih vrednosti x
prema Puasonovoj distribuciji date su u sledeoj tabeli i grafikonu:

Puasonova distribucija za x =5
Vrednost
x
Verovatnoa
javljanja
Vrednost
x
Verovatnoa
javljanja
Vrednost
x
Verovatnoa
javljanja
0 0,006737 6 0,146222 12 0,003434
1 0,033689 7 0,104444 13 0,001320
2 0,084224 8 0,065278 14 0,000471
3 0,140373 9 0,036265 15 0,000157
4 0,175467 10 0,018132 16 0,000049
5 0,175467 11 0,008242 17 0,000014




Iz tabele moemo videti da verovatnoa da e se u gradu, u kome se inae u
toku jedne godine proseno dnevno raa petoro dece, u nekom danu n roditi desetoro
dece iznosi 0,018132 ili 1,8132%.


6.3. Normalna distribucija

Normalna distribucija je najvanija distribucija kontinuiranih obeleja. Opisao
ju je nemaki matematiar Karl Fridrih Gaus. Vrednosti veine biolokih obeleja
rasporeuju se po tipu normalne distribucije.

Osobine normalne distribucije:
- U potpunosti je definisana aritmetikom sredinom i standardnom devijacijom;
- Vrednosti obeleja (x) mogu se kretati od minus beskonano do plus
beskonano (,+);
- Formula koja definie verovatnou u normalnoj distribuciji glasi:
( )
2
1
2
1
2
x x
SD
x
P e
SD t
| |
|
|
\ .
=


gde su t i e matematike konstante koje iznose priblino: t ~ 3,14, e ~ 2,72.
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Broj dogaaja
V
e
r
o
v
a
t
n
o

a
.
5 x =
63
- Grafiki se normalna distribucija manifestuje u vidu tzv. Gauss-ove normalne
krive, koja je zvonastogog oblika i simetrina oko aritmetike sredine;
- Aritmetika sredina, medijana i mod imaju istu vrednost.
- Ukoliko se poveava vrednost aritmetike sredine kriva se pomera udesno od
koordinatnog poetka, a ukoliko se vrednost aritmetike sredine smanjuje pomie se
ulevo;

- Ukoliko se vrednost standardne devijacije poveava kriva se sniava i iri, a
ukoliko se vrednost standardne devijacije smanjuje kriva se povisuje i suava;

- Ukupna povrina ispod normalne krive, koju ova ograniava sa x-osom,
jednaka je jedinici, odnosno 100%. Kako je kriva simetrina, 50% povrine nalazi se
levo od normale podignute nad aritmetikom sredinom, a 50% desno od ove normale.
Kako povrina ispod krive predstavlja raspored verovatnoa, postoji 50% verovatnoe
da e sluajno promenljiva x uzeti neku vrednost manju ili veu od aritmetike sredine.

- Posebno znaajna osobina normalnog rasporeda je ta, da za njega vai:

Sigma tri pravilo

Verovatnoa da e vrednost x nekog obeleja biti u intervalu:
1 x SD iznosi 68%;
1,96 x SD iznosi 95%;
2, 58 x SD iznosi 99%.
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
0 5 10 15 20 25 30
x
V
e
r
o
v
a
t
n
o

a
.
( )
15, 3 f x SD = =
( )
15, 4 f x SD = =

0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
0 5 10 15 20 25 30
x
V
e
r
o
v
a
t
n
o

a
.

( )
10, 3 f x SD = = ( )
20, 3 f x SD = =
64
1 SD x 1 SD
68%
95%
1,96 SD x 1,96 SD
2,58 SD x 2,58 SD
99%


Navedena osobina vai za svaku normalnu distribuciju bez obzira na veliinu
aritmetike sredine i standardne devijacije.
U okviru 22,58=5,16 standardnih devijacija nalazi se 99% svih vrednosti
sluajno promenljive, a izvan ovog intervala ostaje samo 1% vrednosti (po 0,5% onih
koje su manje i 0,5% onih koje su vee od prosene vrednosti).

Uvoenjem bilo koje vrednosti obeleja (x) u formulu za izraunavanje
verovatnoe u normalnoj distribuciji moe se ustanoviti verovatnoa za njeno javljanje
u nekoj populaciji. Naravno, u formulu je potrebno uneti i vrednosti aritmetike sredine
i standardne devijacije. Meutim, sam pogled na formulu govori nam da izraunavanje
nee biti lako. Na sreu, umesto mukotrpnog izraunavanja primenom formule, danas
se za odreivanje verovatnoe javljanja neke vrednosti u normalnoj distribuciji moemo
posluiti bilo kojim statistikim raunarskim programom. I pri korienju programa
potrebno je u radni prozor uneti vrednosti x, aritmetike sredine i standardne devijacije.
Verovatnoa da e se vrednost obeleja nalaziti u intervalu izmeu x
1
i x
2

izraunava se tako to se prvo izraunaju kumulativne verovatnoe za vrednosti x
1
i x
2
.
To nisu verovatnoe za pojavu vrednosti x
1
i x
2
, ve verovatnoe da e se vrednost
obeleja nalaziti u intervalu od 0 do x
1
, odnosno od 0 do x
2
. Do njih se dolazi posebnom
formulom, koja ukljuuje integralni raun. Zatim se od vee izraunate kumulativne
verovatnoe oduzme manja. Dobijena razlika predstavlja traenu verovatnou da e se
vrednost obeleja nalaziti u intervalu izmeu x
1
i x
2
. I ovo izraunavanje je relativno
jednostavno korienjem statistikih raunarskih programa.




65
6.4. Standardizivana normalna distribucija

Standardizovana normalna distribucija je normalna distribucija ija aritmetika
sredina iznosi 0, a standardna devijacija je 1. Normalna distribucija se transformie u
standardizovanu normalnu distribuciju korienjem formule:
x x
Z
SD

=
gde su x, x i SD parametri iz normalne distribucije koju transformiemo, odnosno iz
originalne X normalne distribucije.
Standardizovana normalna distribucija se naziva i Z distribucija. Podsetimo se
da Z vrednost odreuje distancu, odstupanje svake individualne vrednosti sluajno
promenljive od aritmetike sredine izraeno u jedinicama standardne devijacije.
Na primer, ako je neki ispitanik na testiranju dobio 70 poena, a aritmetika
sredina skorova svih ispitanika je iznosila 50 poena sa standardnom devijacijom od 10
poena, to znai da je ta osoba dobila za dve standardne devijacije vie poena nego to je
iznosio prosean skor svih ispitanika:
70 50
2
10
x x
Z
SD

= = =

Primena formule za transformaciju e uvek kao rezultat dati distribuciju ija
aritmetika sredina iznosi 0, a standardna devijacija je 1. Ove vrednosti su uprostile
formulu normalne krive i omoguile lake izraunavanje verovatnoe za bilo koju
vrednost obeleja, bez obzira na vrednosti aritmetike sredine i standardne devijacije.
U situaciji kada je 0 x = , a 1 SD = , Z vrednost iznosi:
0
1 1
x x x x
Z x
SD

= = = =
Prema tome, kada se normalan raspored definie kao standardizovani normalni
raspored vrednost x postaje jednaka vrednosti Z, odnosno vrednost obeleja (x) nam
istovremeno pokazuje i odstupanje te iste vrednosti od prosene vrednosti (logino jer
prosena vrednost je 0).

Sve Z vrednosti se oko vrednosti Z=0 rasporeuju u vidu normalnog rasporeda
pa i ovde vai sigma tri pravilo:
- U intervalu od -1 do +1 nalaze se 68% svih Z vrednosti.
- U intervalu od -1,96 do +1,96 nalaze se 95% svih Z vrednosti.
- U intervalu od -2,58 do +2,58 nalaze se 99% svih Z vrednosti.

Na osnovu formule za gustinu normalne raspodele, osobina standardizovane
normalne distribucije i ovih pravila, konstruisana je tabela koja sadri verovatnoe za
udaljenost svake Z vrednosti od nule, a naziva se tabela povrina ispod normalne krive.






66
Deo tabele - Povrina pod normalnom krivom izmeu 0 i Z
Z 0 1 2 3 4 5 6 7 8 9
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

Upotrebu tabele povrina ispod normalne krive moemo objasniti na sledeim
primerima:
Primer I: Potrebno je odrediti verovatnou da Z vrednost uzme neku vrednost u
intervalu od -1,96 do +1,96.
Reenje: U tabeli su date verovatnoe za odstojanje Z vrednosti od nule. Prvo
odredimo verovatnou da e se Z vrednost nai u intervalu od 0 do +1,96. Niz prvu
kolonu tabele traimo vrednost od 1,9, a zatim du reda dolazimo do vrednosti koja
odgovara koloni sa brojem 6 (druga decimala). Ta vrednost je 0,4750 ili 47,5%. Znai,
verovatnoa da e Z imati vrednost u intervalu od 0 do +1,96 iznosi P=0,4750 ili
47,5%. Kako je kriva simetrina, to verovatnoa da se Z vrednost nalazi u suprotnom
smeru tj. u intervalu od -1,96 do 0 iznosi jo 47,5%, tako da verovatnoa da Z uzme
neku vrednost u intervalu od -1,96 do +1,96 iznosi: P = 47,5 + 47,5 = 95%. To isto
znai da se u intervalu od -1,96 do +1,96 nalazi 95% svih vrednosti Z.

Primer II: Ako je zadana verovatnoa P=0,96 u kom intervalu se nalazi Z
vrednost za ovu verovatnou ako je taj interval simetrian u odnosu na nulu?
Reenje: Zadatu verovatnou od P=0,96 podelimo sa 2 i dobijamo P=0,48. U
tabeli naemo ovu vrednost (ili najbliu) i horizontalno, ulevo oitamo u prvoj koloni
vrednost za Z sa jednom decimalom, a vertikalno u prvom redu oitamo drugu
decimalu. Konkretno, za vrednost P=0,48 najblia vrednost u tabeli je 0,4803. Ulevo
oitamo u prvoj koloni vrednost za Z sa jednom decimalom koja iznosi 2,0, a vertikalno
u prvom redu oitamo drugu decimalu koja iznosi 6. Prema tome, za zadanu
verovatnou od P=0,96, uz uslov da je interval simetrian u odnosu na nulu, Z vrednost
se nalazi u intervalu od -2,06 do +2,06.

Primenom formule
x x
Z
SD

= moemo svaku vrednost x nekog obeleja, bez


obzira u kojim je mernim jedinicama izraena, prevesti u Z vrednost. Obrnuto, svaka
vrednost Z se moe prevesti u x vrednost: x Z SD x = + .
67
Iz toga sledi da se vrednosti apscisne ose bilo kog normalnog rasporeda mogu
izraziti pomou dve skale: standardizovane Z skale i merne x skale.

Z skala -2,58 -1,96 -1 0 1 1,96 2,58
x skala x -2,58SD x -1,96SD x -1SD x x +1SD x +1,96SD x +2,58SD


Predhodna dva primera su pokazala kako se tabela povrina ispod normalne
krive moe koristiti za odreivanje verovatnoe ako je poznata Z vrednost ili obrnuto,
za odreivanje Z vrednosti kada je poznata verovatnoa. Praktina primena ove tabele,
odnosno standardizovane normalne skale e biti razumljivija iz sledeeg primera:

Primer: Na pismenom ispitu iz statistike prosean broj postignutih poena je
iznosio 75, sa standardnom devijacijom od 12 poena.
a) Kolika je verovatnoa da e neki, sluajno odabrani student, imati vie od 90
poena, odnosno da e dobiti ocenu 10?
b) Kolika je verovatnoa da e neki, sluajno odabrani student, imati vie od 50
poena, odnosno da e poloiti ispit?
Reenja:
a) U prvom koraku je potrebno izraunati Z vrednost, a prema formuli:
90 63 27
2, 25
12 12
x x
Z
SD

= = = =
Zatim iz tabele oitamo verovatnou da e se Z vrednost nai u intervalu
izmeu 0 i 2,25, a ona iznosi 0,4878. To istovremeno znai da verovatnoa da e
student imati izmeu 63 i 90 poena iznosi 0,4878, odnosno 48,78%.
Kako verovatnoa da e student imati 63 ili vie poena iznosi 50% (podsetimo
se: 50% svih vrednosti je jednako ili manje od aritmetike sredine, a 50% svih vrednosti
je jednako ili vee od aritmetike sredine), to verovatnoa da e imati vie od 90 poena
iznosi: P
(>90)
=50-48,78=1,22%. Ovo istovremeno znai i da e 1,22% studenata imati
vie od 90 poena, odnosno dobiti ocenu 10 na pismenom ispitu iz statistike.
b)
50 63
1, 08
12
x x
Z
SD

= = =
Iz tabele oitamo verovatnou da e se Z vrednost nai u intervalu izmeu -1,08
i 0, a ona iznosi 0,3599. To znai da verovatnoa da e student imati izmeu 50 i 63
poena iznosi 0,3599, odnosno 35,99%.
Kako verovatnoa da e student imati 63 ili vie poena iznosi 50%, to
verovatnoa da e imati vie od 50 poena iznosi: P
(>50)
=50+35,99=85,99%. Ovo znai i
da e 85,99% studenata imati vie od 50 poena, odnosno poloiti ispit.

68
Mere izgleda distribucije: skjunis i kurtozis
U mere izgleda distribucije spadaju skjunis (eng. skewness), odnosno
zakoenost, koja predstavlja meru asimetrije i kurtozis (eng. kurtosis) koja predstavlja
meru visine i otrine distribucije.

Skjunis
Prva stvar na koju bi trebalo obratiti panju kod oblika distribucije je da li
postoji jedan mod (vrh) ili vie njih? Ukoliko je distribucija unimodalna, to je sluaj
kod veine serija podataka, sledee na ta bi trebalo obratiti panju je da li je ona
simetrina ili zakoena u jednu od strana. Kada je veina vrednosti na levoj strani
(veina vrednosti je niska), a desna strana je dua, tada se kae da distribucija ima
desnu ili pozitivnu zakoenost; nasuprot tome, kada je vrh pomeren udesno, a leva
strana je dua, tada se kae da je distribucija zakoena levo ili negativno. Pogledajmo
dva sledea grafikona. Na oba su prikazane distribucije sa istim vrednostima
aritmetikih sredina i standardnih devijacija, ali su njihovi oblici razliiti.

Negativna zakoenost Pozitivna zakoenost
skjunis = - 0,5371 skjunis = 0,5371

Kada numerika mera zakoenosti - skjunis iznosi 0, vrednosti su idealno
simetrino rasporeene, to je gotovo nemogue za bilo koje obeleje mereno u ivom
svetu. Vrednost skjunisa izmeu -1 i +1 ne ukazuje na vee odstupanje od normalne
distribucije, ali se smatra da su i vrednosti od -2 do +2 prihvatljive.

Kurtozis
Ukoliko je distribucija simetrina, sledea stvar na koju bi trebalo obratiti
panju je da li centralni vrh visok i otar ili je kratak i irok? Neke zakljuke moemo
doneti na osnovu histograma, ali je numerika mera visine i otrine - kurtozis mnogo
preciznija. Vie vrednosti kurtozisa ukazuju na vii, otriji vrh; nie vrednosti ukazuju
na nii, manje izraen vrh.
Mezokurtina Leptokurtina Platikurtina


69

Normalna distribucija ima vrednost kurtozisa oko nule. Svaka distribucija sa
vrednou kurtozisa 0 naziva se mezokurtina. Distribucija sa kurtozisom < 0 je
platikurtina i u poreenju sa normalnom distribucijom, njen vrh je nii i iri.
Distribucija sa kurtozisom > 0 je leptokurtina i u poreenju sa normalnom
distribucijom, njen vrh je vii i otriji. Kao i kod skjunisa, vrednost kurtozisa izmeu -1
i +1 ne ukazuje na vee odstupanje od normalne distribucije, ali se smatra da su
vrednosti od -2 do +2 prihvatljive.


6.5. t - distribucija

Ovu vrstu rasporeda je formulisao Vilijam S Goset, poznat pod pseudonimom
Student pa se zove i Studentova t-distribucija.
Njene karakteristike su:
- Ima slian oblik kao normalna distribucija samo to je ira i nia. t-raspored je
isto simetrian u odnosu na svoju aritmetiku sredinu t=0 i zvonastog je oblika, ali se u
intervalu t=01,96SD nalazi manje od 95% t-vrednosti, odnosno ovaj procenat t-
vrednosti se nalazi u irem intervalu;
- irina intervala zavisi od broja ispitanika, odnosno veliine uzorka;
- Kako raste broj ispitanika t-distribucija je sve slinija normalnoj raspodeli;
- Primjenjuje se u raunanju intervala pouzdanosti i testiranju hipoteza o razlici
aritmetikih sredina izmeu dva uzorka.
Razlika izmeu Z i t-rasporeda najbolje moe da se uoi iz grafikona:


Z=-1,96 95% Z=+1,96
t=-3,18 95% t=+3,18
Standardizovana
Z distribucija Studentova t-distribucija
N=4 (ss=N-1=3)


Za krivu t-distribucije ne vai sigma tri pravilo jer irina intervala u kome se
nalazi 95% t-vrednosti zavisi od broja ispitanika, odnosno veliine uzorka. to je
uzorak manji to je irina intervala vea. Tako za se uzorak N=4, 95% t-vrednosti nalazi
u intervalu: t =-3,18 do +3,18.







70

Na osnovu iznetih osobina Studentovog t-rasporeda izraena je tabela za
granine t-vrednosti za odgovarajuu verovatnou i stepen slobode.

Verovatnoa Verovatnoa Stepen
slobode 0,95 0,99 0,999
Stepen
slobode 0,95 0,99 0,999
1 12,706 63,657 636,619 22 2,074 2,819 3,792
2 4,303 9,925 31,599 23 2,069 2,807 3,768
3 3,182 5,841 12,924 24 2,064 2,797 3,745
4 2,776 4,604 8,610 25 2,060 2,787 3,725
5 2,571 4,032 6,869 26 2,056 2,779 3,707
6 2,447 3,707 5,959 27 2,052 2,771 3,690
7 2,365 3,499 5,408 28 2,048 2,763 3,674
8 2,306 3,355 5,041 29 2,045 2,756 3,659
9 2,262 3,250 4,781 30 2,042 2,750 3,646
10 2,228 3,169 4,587 40 2,021 2,704 3,551
11 2,201 3,106 4,437 50 2,009 2,678 3,496
12 2,179 3,055 4,318 60 2,000 2,660 3,460
13 2,160 3,012 4,221 70 1,994 2,648 3,435
14 2,145 2,977 4,140 80 1,990 2,639 3,416
15 2,131 2,947 4,073 90 1,987 2,632 3,402
16 2,120 2,921 4,015 100 1,984 2,626 3,391
17 2,110 2,898 3,965 150 1,976 2,609 3,357
18 2,101 2,878 3,922 200 1,972 2,601 3,340
19 2,093 2,861 3,883 300 1,968 2,592 3,323
20 2,086 2,845 3,850 500 1,965 2,586 3,310
21 2,080 2,831 3,819 1,960 2,576 3,291

Na primer, granina vrednost t za verovatnou od 95% i stepen slobode 6
iznosi: t
(0,95;6)
=2,447.


6.6. Hi kvadrat (2) distribucija

Hi kvadrat distribucija je raspodela zbira kvadrata Z vrednosti. Stepen slobode
u ovoj distribuciji jednak je broju Z vrednosti ije kvadrate vrednosti sabiramo. Prema
tome, Hi kvadrat distribucija sa stepenom slobode 1 je raspodela kvadrata svih
pojedinanih Z vrednosti iz standardizovane normalne distribucije. U ovoj distribuciji bi
povrina ispod krive za
2
_ =4 bila jednaka povrini ispod standardizovane normalne
krive za Z=2 jer je 4=2
2
.
Karakteristike
2
_ distribucije:
- Kriva nije simetrina i zakrivljena je u desno;
- Distribucija uvek ima pozitivne vrednosti;
- Zavisi od broja stepeni slobode: kako raste broj stepeni slobode distribucija
postaje sve vie simetrina i slinija normalnoj distribuciji;
- Aritmetika sredina Hi kvadrat distribucije jednaka je stepenu slobode.
71
Na sledeem grafikonu su prikazane krive Hi kvadrat distribucija za stepene
slobode 2, 4 i 6.


ss=2

ss=4


ss=6


Razmotrimo sledei problem: Kolika je verovatnoa da e zbir kvadrata bilo
koje sluajno odabrane dve Z vrednosti iz standardizovane normalne distribucije biti
jednak 6 ili vei?
Kako se radi o zbiru dve Z vrednosti, odgovor emo traiti u Hi kvadrat
distribuciji sa stepenom slobode 2. U tabeli graninih Hi kvadrat vrednosti za odreeni
broj stepeni slobode i odreenu verovatnou uoavamo da za stepen slobode 2 i
verovatnou od 0,95 (95%) granina tablina Hi kvadrat vrednost iznosi 5,991 to je
gotovo jednako 6. Prema tome, verovatnoa da e zbir kvadrata bilo koje sluajno
odabrane dve Z vrednosti iz standardizovane normalne distribucije biti jednak 6 ili vei
iznosi 100-95=5%.

Deo tabele graninih Hi kvadrat vrednosti

Verovatnoa Verovatnoa Verovatnoa Stepen
slobode 0,95 0,99
Stepen
slobode 0,95 0,99
Stepen
slobode 0,95 0,99
1 3,841 6,635 11 19,675 24,725 21 32,671 38,932
2 5,991 9,210 12 21,026 26,217 22 33,924 40,289
3 7,815 11,345 13 22,362 27,688 23 35,172 41,638
4 9,488 13,277 14 23,685 29,141 24 36,415 42,980
5 11,071 15,086 15 24,996 30,578 25 37,652 44,314
6 12,592 16,812 16 26,296 32,000 26 38,885 45,642
7 14,067 18,475 17 27,587 33,409 27 40,113 46,963
8 15,507 20,090 18 28,869 34,805 28 41,337 48,278
9 16,919 21,666 19 30,144 36,191 29 42,557 49,588
10 18,307 23,209 20 31,410 37,566 30 43,773 50,892

72
Mnogi statistiki testovi zasnivaju se na Hi kvadrat distribuciji, a najpoznatiji
od njih je Hi kvadrat test kojim se porede uestalosti pojedinih modaliteta kategorijskih
(atributivnih) obeleja.


6.7. F distribucija

F distribucija se moe definisati kao odnos izmeu varijansi dve Hi kvadrat
distribucije:
2
( , ) 2
/
/
n
n m
m
n
F
m
_
_
=
Njene karakteristike su:
- Zakrivljena je prema desno;
- Zavisi od broja stepeni slobode obe Hi kvadrat vrednosti;
- Upotrebljava se za poreenje dve varijanse, kao i za poreenje vie od dve
aritmetike sredine analizom varijanse (ANOVA).

Kriva F distribucije kada stepeni slobode obe Hi kvadrat vrednosti iznose po 10
predstavljena je na sledeem grafikonu:


I za ovu vrstu distribucije je kontruisana tabela sa graninim F vrednostima za
odreene verovatnoe i za odreen broj stepeni slobode.

Deo tabele za granine F vrednosti za nivo verovatnoe od 95%
ss
2
/ss
1
1 2 3 4 5 6 7 8 9 10 12
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9
2 18,51 19,00 19,16 19,25 19,3 19,33 19,35 19,37 19,38 19,4 19,41
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69
73
7. TESTIRANJE HIPOTEZA I PROCENA
PARAMETARA POPULACIJE NA OSNOVU
UZORKA


Hipoteza predstavlja pretpostavku koja motivie istraivanje, a testiranje
hipoteze je statistiki postupak kojim se kvantitativno odreuje da li i koliko pouzdano
raspoloivi podaci potvruju tu pretpostavku.
U istraivanjima se formuliu dve meusobne iskljuive, suprotne pretpostavke
o ishodu ispitivanja, a to su nulta hipoteza (Ho) i alternativna ili radna hipoteza (Ha).
Najelementarnije iskazana nulta hipoteza glasi - Izmeu aritmetikih sredina ili
izmeu proporcija nekog obeleja u dva osnovna skupa ne postoji znaajna razlika. Ako
razlika i postoji ona je sluajnog karaktera, a uzorci na kojima je vreno ispitivanje se
ponaaju kao da pripadaju istom osnovnom skupu. Matematiki se definie kao:
1 2 1 2 : ili 0 Ho x x x x = =
Nultoj hipotezi se pridruuje alternativna ili radna hipoteza, koja tvrdi suprotno:
Izmedu aritmetikih sredina ili izmeu proporcija nekog obeleja u dva osnovna skupa
postoji znaajna razlika i ona nije sluajnog karaktera, ve je nastala pod dejstvom
sistemskih ili eksperimentalnih faktora. Matematiki se definie kao:
1 2 1 2 : ili 0 Ho x x x x = =
Naravno, i jedna i druga hipoteza mogu da imaju i iri smisao, zavisno od
konkretnog problema koji se reava. Prema Ronaldu Fieru nulta hipoteza je svaka
pretpostavka koju elimo da proverimo u smislu "nulifikacije", odnosno ponitenja.
Statistikom metodologijom se proverava tvrdnja nulte hipoteze i uvek se
polazi od pretpostavke da je ona tana odnosno istinita i da "neka razlika" nije sta-
tistiki znaajna. Istinitost nulte hipoteze se utvruje specifinim statistikim testovima.
Ako se odgovarajuim statistikim testom, za odgovarajuu verovatnou i prag
znaajnosti, utvrdi da razlika nije statistiki znaajna prihvata se nulta hipoteza kao
tana i istinita, a odbacuje radna hipoteza, kao neistinita i netana. Suprotno, ako
statistiki test pokae da je razlika statistiki znaajna, nulta hipoteza se odbacuje kao
netana i neistinita, a prihvata se radna hipoteza kao istinita i tana.
Prema tome, odgovarajuim specifinim testom, testiramo iskljuivo nultu
hipotezu, a alternativnu prihvatamo ili odbacujemo posredno.
Bilo koji tip testiranja statistikih hipoteza moe da se izvede u pet etapa:
1. Formulisanje nulte i alternativne hipoteze;
2. Odreduje se prag (nivo) znaajnosti. Najee su to p=0,05 ili p=0,01;
3. Odreduje se adekvatan test i
4. Obradi se jedan ili vie uzoraka, ije podatke koristimo za izraunavanje i
5. Na osnovu rezultata testa donosimo odluku o prihvatanju ili odbacivanju
nulte hipoteze (Ho).

Parametrijski testovi
Parametrijske testove primenjujemo kada su vrednosti ispitivanog obeleja date
numeriki, odnosno kada su izmerene intervalnom ili skalom odnosa i kada iz njih
moemo da izraunamo: aritmetiku sredinu, varijansu, standardnu devijaciju i
standardnu greku. Parametrijski testovi polaze od pretpostavke da je raspored unutar
74
skupa, iz koga je dobijen uzorak, normalan ili pak uzorak mora da bude vei od 30
jedinica. Od parametrijskih testova najpoznatiji je Studentov t-test.

Neparametrijski testovi
Pri istraivanjima i eksperimentima mogu da se dobiju podaci koji znatno
odstupaju od normalnog rasporeda, ili su dati opisno pa se iz njih ne mogu da
izraunaju aritmetika sredina i standardna devijacija. U ovim sluajevima, a pogotovu
ako su vrednosti obeleja date opisno te raspolaemo samo frekvencijama pojedinih
modaliteta obeleja, za testiranje nulte hipoteze primenjuju se tzv. neparametrijski
testovi ili testovi nezavisni od rasporeda. Oni trae manje uslova i manje informacija za
primenu (prednost), ali je njihova snaga (power) manja, pa su manje precizni i
pouzdani.


7.1. Uzorak

Osnovni skup ili populacija se sastoji od svih elemenata ili jedinica posmatranja
ije karakteristike ispitujemo pojedinaca (bia), stvari ili predmeta. Osnovni skup koji
se prouava naziva se jo i ciljnom populacijom. Svi elementi osnovnog skupa su
istorodni, ali ne i istovetni.
Kako se sastoji od svih jedinica koje su nosioci odreene karakteristike
(osobine, obeleja), osnovni skup sadri sve vrednosti koje ta sluajno promenljiva
moe imati, a koje se mogu evidentirati merenjem ili brojanjem.
Idealno bi bilo kada bi bili u mogunosti da obeleja koja prouavamo
evidentiramo za svaku jedinicu populacije i na osnovu takve evidencije izvrimo ocenu
i donesemo zakljuke, meutim u praksi to gotovo nikada nije mogue. Zbog toga je u
statistici razraena i racionalno odreena sledea metodologija: Donoenje sudova i
zakljuaka o celini pojave vri se na osnovu prouavanja i poznavanja odreenog broja
statistikih jedinica, odnosno na osnovu dela osnovnog skupa - uzorka.
Jedinica posmatranja ili element uzorka ili osnovnog skupa jeste odreeni
subjekat ili objekat (na primer: osoba, firma, predmet, drava) o kojem se prikupljaju
podaci, odnosno, na kojem se odreena pojava statistiki posmatra.
Adekvatan uzorak mora da ispuni principe nepristrasnosti, reprezentativnosti i
ekonominosti.
Nepristrasnost uzorka se postie nainom i metodama odabiranja uzorka koji su
razraeni u statistikoj praksi, a koji baziraju na teoriji verovatnoe i postavkama
sluajnog kombinovanja elemenata.
Reprezentativnost podrazumeva da uzorak treba da obuhvati one statistike
jedinice koje e u sebi nositi sve karakteristike osnovnog skupa, odnosno one jedinice
ija obeleja kada se izbroje ili izmere i iz njihovih vrednosti izraunaju odgovarajui
parametri (aritmetika sredina, standardna devijacija, uestalost javljanja neke pojave i
td.), oni budu isti ili priblino isti kao i pravi parametri osnovnog skupa. Kvalitet,
tanost i preciznost rezultata istraivanja, tj. tanost procene osnovnog skupa na osnovu
uzorka, su direktno proporcionalni reprezentativnosti uzorka.
Reprezentativnost uzorka zavisi od varijabilnosti vrednosti posmatranog
obeleja unutar skupa i od veliine uzorka. to je uzorak vei to je i njegova
reprezentativnost vea, kao i preciznost i sigurnost ocene parametara osnovnog skupa.
75
to je varijabilnost vrednosti obeleja vea, to je skup manje homogen, pa je za
odgovarajuu preciznost i pouzdanost procene potreban vei uzorak.
Ekonominost je princip koji nameu finansijska i vremenska ogranienja.
Veliki uzorak zahteva vie finansijskih i ljudskih resursa, kao i vremena za ispitivanje.
Princip ekonominosti je sutinski suprotan principu reprezentativnosti.


7.1.1. Jednostavan sluajan uzorak

Kada svaka jedinica iz populacije ima jednaku ansu da bude izabrana, uzorak
je sluajan, randomiziran (engl. random sample). Ranije su najee koriene metode
za izbor sluajnog uzorka bile lutrijska metoda i izbor pomou tablice sluajnih brojeva.
Danas se za izbor sluajnog uzorka preteno koriste raunarski generatori sluajnih
brojeva.
Da bi se mogao izvriti izbor statistikih jedinica, potrebno je odrediti okvir
izbora, odnosno definisati populaciju iz koje se bira. Na primer, ukoliko elimo da
utvrdimo kakav je stav studenata o zakonu o zatiti od duvanskog dima, svi studenti
univerziteta predstavljaju okvir izbora. Zatim je potrebno svakoj statistikoj jedinici
dodeliti identifikacioni broj, u naem primeru to moe biti broj indeksa, a potom se ovi
brojevi koriste da bi se nekom od metoda sluajnog izbora izvrilo izdvajanje uzorka.


7.1.2. Sistematski uzorak

Kada se izbor statistikih jedinica u uzorak vri po nekom sistemu, formira se
sistematski uzorak. Na primer, elimo da utvrdimo neki stav u populaciji telefonskom
anketom, birajui svaki deseti broj telefona iz telefonskog imenika, pri emu samo prvi
broj izaberemo metodom sluajnog izbora. U nekim sluajevima taj nain izbora nosi
rizik da bude pristrasan. U primeru sa telefonskim imenikom, ukoliko anketiranje
vrimo u prepodnevnim satima ispitivanjem e verovatno biti u manjem procentu
obuhvaeno radno aktivno stanovnitvo.
Sistematski izbor je jednostavniji od metode sluajnog uzorka, pa se u praksi
esto primenjuje, ali pri tome valja biti oprezan pri donoenju zakljuaka o populaciji
na osnovu uzorka.


7.1.3. Viestepeni uzorak

Postoje sluajevi kada nije mogue primeniti izbor sluajnog uzorka zbog
veliine i rairenosti populacije. Na primer, elimo da utvrdimo zastupljenost povienog
krvnog pritiska kod odraslog stanovnitva cele drave, koje broji 7 miliona ljudi, na
uzorku od 10000 ispitanika. Mogli bi korienjem raunara iz popisnih podataka
metodom sluajnog izbora izdvojiti potrebne ispitanike. Meutim, bilo bi skupo i
komplikovano poslati ispitivaa da u nekom selu pregleda jednog jedinog ispitanika
koji je izabran u uzorak. Zbog toga je svrsishodno prvo iz liste naselja sluajnim
izborom izdvojiti odreeni broj naselja u kojima e se sprovesti ispitivanje. Zatim se iz
tih naselja prema popisnim podacima izabere sluajnim izborom srazmeran broj
stanovnika.
76
Viestepeni uzorak daje dobre podatke za populaciju u celini, ali ne i za
pojedina naselja jer broj ispitanika u njima ipak nije dovoljan za zakljuivanje.


7.1.4. Stratifikovani uzorak

Kada je potrebno analizirati neku pojavu u celokupnoj populaciji, ali i posebno
po populacionim grupama od posebnog interesa - stratumima, formira se stratifikovani
uzorak. Svaki stratum je podpopulacija koja bi trebalo da je homogena, a izmeu
pojedinih stratuma se oekuju znaajne razlike. Za svaki stratum se odreuje poseban
sluajni uzorak. Veliina uzoraka iz stratuma je obino proporcionalna udelima
stratuma u celokupnoj populaciji, ali to nije pravilo. Kada je neka pojava retko
zastupljena, iz stratuma koji imaju mali broj statistikih jedinica mogu se izabrati vei
uzorci nego to je njihova proporcija u populaciji. Prema tome, stratifikovani uzorci se
mogu podeliti na proporcionalne i neproporcionalne.
Na primer, elimo da utvrdimo prosean dnevni kalorijski unos hranom u
jednoj optini sa 40000 stanovnika, anketirajui uzorak od 1000 ispitanika. Oekujemo
da e kalorijski unos biti znaajno vei kod gradskog stanovnitva. Ako u gradu ivi
30000 (75%), a u selima 10000 (25%) stanovnika, tada e i uzorak sadrati istu
proporciju, odnosno 750 ispitanika iz grada i 250 sa sela.
U drugom primeru elimo da ispitamo psihike efekte estetske hirurgije kod
operisanih osoba, a posebno smo zainteresovani za mogue razlike izmeu mukaraca i
ena. Uvidom u dokumentaciju klinike za plastinu hirurgiju doli smo do podatka da je
na lini zahtev do sada operisano 1900 (95%) ena i 100 (5%) mukaraca. Kada bi
primenili formulu za adekvatnu veliinu uzorka na celokupnu populaciju od 2000
operisanih osoba, utvrdili bi da je potrebno ispitati 330 sluajno izabranih pacijenata. U
proporcionalnom stratifikovanom uzorku to bi iznosilo 313 (94,85%) ena i 17 (5,15%)
mukaraca. Meutim, primena ovakvog uzorka ne bi omoguila objektivno poreenje
izmeu ena i mukaraca zbog malog broja mukaraca. Zbog toga je potrebno primeniti
formulu za adekvatnu veliinu uzorka posebno za ene, a posebno za mukarce.
Primenom ove metode bi broj ena u uzorku iznosio 330 (80,5%), a mukaraca 80
(19,5%). Dobili smo neproporcionalni stratifikovani uzorak koji omoguava objektivno
poreenje izmeu ena i mukaraca. Primeujemo da je ukupan neproporcionalni
uzorak vei za 80 ispitanika nego to bi bio proporcionalni.


7.1.5. Viefazni uzorak

Upotrebljava se kada je komplikovano ili skupo sve elemente istraivanja
sprovesti na svim ispitanicima iz uzorka. Tada deo istraivanja sprovodimo samo na
poduzorku. Na primer, elimo da ispitamo uestalost gojaznosti kod stanovnitva cele
drave na viestepenom uzorku od 20000 ispitanika. Izmeu ostalog, elimo da
utvrdimo i uestalost povienog nivoa masti u serumu kod osoba starijih od 30 godina,
a njih u uzorku ima 12000. Uzimanje krvi od 12000 osoba bi bila komplikovana i skupa
procedura. Zbog toga odluujemo da laboratorijska ispitivanja nivoa masti u serumu
sprovedemo kod svakog desetog (10%) od njih, odnosno 1200 ispitanika starijih od 30
godina.

77

7.1.6. Klaster uzorak

Slian je viestepenom uzorku. Populacija se podeli na klastere, a zatim se za
uzorak prvo sluajno izabere odreen broj klastera, a zatim se iz tih klastera sluajno
bira odreen broj jedinica posmatranja.
Klasteri predstavljaju grupe ili celine koje prirodno i fiziki objedinjuju
jedinice posmatranja. Primeri klastera su kole ili preduzea. Da bi se smanjilo
prostorno rasprenje jedinica posmatranja formiraju se zonski uzorci. Zone su klasteri
koji su definisani geografski - optine, naselja, mesne zajednice.

Kao to smo na primeru ispitivanja uestalosti gojaznosti mogli da vidimo,
pojedine vrste odabira uzoraka se mogu meusobno kombinovati. Ovo vai za sve vrste
izbora, osim za jednostavni sluajni uzorak.


7.2. Distribucija aritmetikih sredina jednakih uzoraka

Zakljuci koji se donose na osnovu podataka u pravilu polaze od uzorka
ispitanika. Na uzorku se izvode merenja, s rezultatima tih merenja se rauna, dobijaju
se informacije o parametrima uzorka, a zatim se vri generalizacija na populaciju iz
koje uzorak potie.
Ako imamo jednu populaciju (osnovni skup) od N jedinica (lanova):
x
1
, x
2
, . . ., x
N


Iz te populacije odaberimo k sluajnih uzoraka od kojih svaki ima n lanova:
1. uzorak x
11
, x
12
, . . ., x
1n


2. uzorak x
21
, x
22
, . . ., x
2n

3. uzorak x
31
, x
32
, . . ., x
3n


k. uzorak x
k1
, x
k2
, . . ., x
kn


Aritmetike sredine tih uzoraka su: 1 2 k , ,.... x x x i one nisu meusobno
jednake, odnosno pokazuju varijabilnost. Iz ovih aritmetikih sredina moemo da
izraunamo jednu zajedniku aritmetiku sredinu svih uzoraka ( x ), kao i njihovu
standardnu devijaciju (
uzoraka
SD ).
Zajednika aritmetika sredina svih uzoraka ( x ) istovremeno predstavlja i
aritmetiku sredinu populacije, odnosno osnovnog skupa ( os x ) prvo pravilo.
Navedena tvrdnja vredi samo ako nainimo sve mogue uzorke sa n lanova iz jedne
populacije.
Distribucija aritmetikih sredina uzoraka iz jedne populacije e biti normalna
ako je distribucija vrednosti posmatranog obileja u populaciji normalna. Meutim, po
centralnoj graninoj teoremi distribucija aritmetikih sredina uzoraka iz jedne
populacije e biti normalna i ako distribucija vrednosti obileja u populaciji nije
normalna ukoliko su uzorci dovoljno veliki i ako je varijansa populacije, odnosno
osnovnog skupa (
2
os
SD ) konaan broj. Obino su za ovaj uslov zadovoljavai uzorci
vei od 30 jedinica (n>30).
78
Aritmetike sredine jednakih malih uzoraka (n<30) dobijenih iz populacije koja
ne pokazuje normalan raspored, rasporeuju se oko aritmetike sredine populacije po
Studentovoj t-distribuciji.

Kriva normalnog raspored aritmetikih sredina jednakih uzoraka
oko zajednike aritmetike sredine

Varijansa osnovnog skupa je vea od varijanse distribucije aritmetikih
sredina svih jednakih uzoraka iz tog skupa onoliko puta, kolika je veliina
uzoraka - drugo pravilo.
2 2
os uz
SD n SD =

Varijanse uzoraka ine takvu distibuciju oko prave varijanse osnovnog
skupa, da njihova aritmetika sredina odgovara varijansi skupa tree pravilo.
2
2
2 uz
SD uzoraka
os
f SD
X SD
f

= =





7.3. Standardna greka aritmetike sredine

Standardna devijacija aritmetikih sredina uzoraka oko aritmetike sredine
populacije naziva se standardna greka aritmetike sredine (engl. Standard Error of the
Mean, SEM).
Standardna greka je mera varijabilnosti aritmetikih sredina uzoraka u odnosu
na aritmetiku sredinu osnovnog skupa i kao takva predstavlja greku kojoj se izlaemo
zakljuujui o populaciji na osnovu uzorka. Ona ima manju vrednost od stvarne
standardne devijacije osnovnog skupa, jer su uzorci svojim aritmetikim sredinama
amortizovali izvestan stepen varijabilnosti i to onih jedinica koje imaju ekstremno male
ili velike vrednosti.
Standardnu devijaciju populacije po pravilu ne poznajemo jer raspolaemo
podacima samo iz uzorka. Ako je uzorak sluajan i dovoljno veliki moe se
pretpostaviti da je standardna devijacija uzorka dobra procena standardne devijacije
populacije, pa standardnu greku aritmetike sredine raunamo kao:
1
uzorka
SD
SG
n
=


Standardna greka je utoliko manja to je uzorak vei i to je varijabilnost
podataka manja.
79
Standardna devijacija opisuje varijabilnost podataka, a standardna greka
aritmetike sredine opisuje preciznost procene aritmetike sredine populacije na osnovu
aritmetike sredine uzorka. Velika standardna greka ukazuje na nepreciznu procenu,
dok mala standardna greka ukazuje na preciznu procenu populacionih parametara na
osnovu uzorka.


7.4. Distribucija proporcija jednakih uzoraka

Proporcija statistikih jedinica u populaciji koje poseduju odreenu
karakteristiku takoe se procenjuje na osnovu proporcije u uzorku.
Ako je n veliina uzorka, a r broj statistikih jedinica u uzorku koje poseduju
odreenu karakteristiku, onda je proporcija u uzorku (p):
r
p
n
=
Distribucija proporcija u uzorcima sledi normalnu distribuciju. Standardna
greka proporcije osnovnog skupa je zapravo standardna devijacija distribucije
proporcija uzoraka. Rauna se kao:
( ) 1 p p
SG
n

=
Mala standardna greka proporcije ukazuje na preciznu procenu.


7.5. Interval pouzdanosti

Statistiki parametri izraunati na osnovu podataka iz uzorka, kao to su
aritmetika sredina ili proporcija, predstavljaju pojedinane procene statistikih
parametara populacije. U anglosaksonskoj literaturi se ovakva procena naziva point
estimate, to pojedini domai autori prevode i kao procena u jednoj taki.
Na osnovu statistikog parametra uzorka, koristei standardnu greku, moemo,
uz odreenu verovatnou proceniti interval u kome se nalazi statistiki parametar
populacije. Ovakva vrsta procene se naziva intervalna, a procenjeni interval u kome se
nalazi statistiki parametar populacije (aritmetika sredina ili proporcija) naziva se
interval pouzdanosti ili interval poverenja IP.
Za izraunanje intervala pouzdanosti koristimo teorijske distribucije
verovatnoe. Interval pouzdanosti proiruje procenu parametra populacije na obe strane
za nekoliko standardnih greaka. Donja i gornja granica pouzdanosti definiu interval.


7.5.1. Interval pouzdanosti (poverenja) za aritmetiku sredinu

Iskazuje se kao:
uzorka os uzorka x z SG x x z SG < < +
pri emu je z standardizovano odstupanje u normalnoj raspodeli.

80
Za nivo verovatnoe od 95% interval pouzdanosti za procenu aritmetike
sredine osnovnog skupa na osnovu aritmetike sredine ispitivanog uzorka iznosi:
1,96 1,96 uzorka os uzorka x SG x x SG < < +

Sa verovatnoom od 95% moemo da tvrdimo da e se na odstojanju od najvie
1,96 standardne greke ispod i iznad aritmetike sredine uzorka nai aritmetika sredina
osnovnog skupa.

Sa verovatnoom od 99% moemo da tvrdimo da e se aritmetika sredina
osnovnog skupa nai u intervalu:
2, 58 2, 58 uzorka os uzorka x SG x x SG < < +



7.5.2. Interval pouzdanosti za proporciju

Iskazuje se kao:
uzorka os uzorka
p z SG p p z SG < < +


Za nivo verovatnoe od 95% interval pouzdanosti za procenu proporcije
osnovnog skupa na osnovu proporcije ispitivanog uzorka iznosi:
1, 96 1, 96
uzorka os uzorka
p SG p p SG < < +
Prema tome, sa verovatnoom od 95% moemo da tvrdimo da e se na
odstojanju od najvie 1,96 standardne greke ispod i iznad proporcije uzorka nai
proporcija osnovnog skupa.

Sa verovatnoom od 99% moemo da tvrdimo da e se proporcija osnovnog
skupa nai u intervalu:
2,58 2, 58
uzorka os uzorka
p SG p p SG < < +


7.5.3. Procena skjunisa i kurtozisa populacije na osnovu uzorka

Ukoliko je u uzorku u umerenoj meri ispoljena asimetrinost to ne znai da
vrednosti u populaciji nisu rasporeene po tipu normalne distribucije. Procena skjunisa
u populaciji vri se na osnovu standardizovanog skjunisa koji se izraunava kao
kolinik izmeu skjunisa dobijenog iz uzorka i standardne greke skjunisa:

Skjunis u uzorku
Standardizovani skjunis =
Standardna greka skjunisa


Kada je standardizovani skjunis < 1,96 sa 95% verovatnoe moemo tvrditi da
u populaciji postoji negativna asimetrinost, a kada je standardizovani skjunis >1,96 sa
95% verovatnoe moemo tvrditi da u populaciji postoji pozitivna asimetrinost.
Napomena: standardizovani skjunis nam ukazuje na verovatnou postojanja
asimetrinosti u populaciji, ali ne i na veliinu te asimetrinosti.
81
Identian princip koristi se i za procenu visine distribucije u populaciji.
Standardizovani kurtozis se izraunava kao kolinik izmeu kurtozisa dobijenog iz
uzorka i standardne greke kurtozisa, a njegova vrednost se tumai na sledei nain:
kada je standardizovani kurtozis < 1,96 sa 95% verovatnoe moemo tvrditi da je
distribucija vrednosti obeleja u populaciji platikurtina, a kada je standardizovani
kurtozis >1,96 sa 95% verovatnoe moemo tvrditi da je distribucija vrednosti obeleja
u populaciji leptokurtina, ali ne i u kolikoj meri.


Zadaci za vebanje

1. Ispitivana je telesna visina deaka i devojica u prvom razredu osnovne kole.
Deaci: n=150, x =154cm, SD=11,3
Devojice: n=160, x =142cm, SD=9,7
Konstruisati interval poveranja za jednu i drugu populaciju za p=0,95, p=0,99.

2. Proseno vreme oporavka nakon povrede ligamenata na Klinici za
rehabilitaciju u Niu je x =33 dana i SD=4,5 dana.
Sa verovatnoom od 95% i 99% odrediti koliko je proseno leenje svih
pacijenata u Niavskom okrugu?

3. U junskom ispitnom roku ispit iz statistike poloilo je 150 studenata medicine i
50 studenata stomatologije. Prosena ocena studenata medicine bila je x =8,5 i
SD=1,5, a studenata stomatologije x =7,5 i SD=1,5.
Proceniti kolika je bila prosena ocena svih studenta medicine i stomatologije u
kolskoj 2009/2010. godini?

4. Koliko se uzoraka veliine n=2, mogu dobiti uz vraanje iz osnovnog skupa
N=6 jedinica, a koliko uzoraka iste veliine bez vraanja?

5. Iz osnovnog skupa od N=6 osoba kojima je izmeren sistolni arterijski pritisak,
odaberi sve mogue uzorke veliine n=2 i konstruii distribuciju njihove frek-
vencije, oko aritmetike sredine osnovnog skupa.

Osobe Krvni pritisak
1 160
2 140
3 130
4 165
5 150
6 155

Na osnovu datih podataka dokai:
- prvo pravilo: uzoraka os x x =
- drugo pravilo:
2 2
os uz
SD n SD =
- da je SD
os
>SD
uz

82
- Koliki se procenat uzoraka nalazi u intervalu: 1, 65 os x SG
- Koliko je uzorak koji ima aritmetiku sredinu od 125mmHg udaljen od
aritmetike sredine osnovnog skupa.

6. Na osnovu podataka o apsentizmu (odsutnost sa posla zbog bolesti i povreda) u
jednom preduzeu izvuen je uzorak od 150 radnika. Na osnovu uzorka izraunato
je proseno godinje odsustvovanje sa posla po jednom radniku od 29 dana sa
standardnom devijacijom od 6 dana. Oceniti sa verovatnoom od P=0,9 proseno
vreme odsustvovanja za sve radnike.

7. Istraiva je eleo da ispita potronju lekova u jednom okrugu u odnosu na
kategoriju osiguranja: radniko, zemljoradniko i neosigurana lica i to na uzorku od
1.400 lica. Navedeni okrug je imao 750000 stanovnika od kojih:
- radniko osiguranje 300.000
- zemljoradniko osiguranje 250.000
- neosigurana lica 200.000
Odredi proporcionalno uee broja jedinica iz svakog stratuma u uzorku od
1.400 lica.

8. Ispitivana je visina holesterola u krvi kod seoske i gradske populacije i to na
osnovu uzoraka:
a) gradsko stanovnitvo: n=800; x =4,3 i SD=0,9
b) seosko stanovnitvo: n=540; x =5,2 i SD=1,0
Konstruii intervale pouzdanosti za jednu i drugu populaciju za P=0,999.

9. Kod 30 dijabetiara na klinici za endokrinologiju u Niu odreivan je nivo
glikemije, dobijene su sledee vrednosti:








Sa verovatnoom od 95% odredi kolika je prosena glikemija kod svih
dijabetiara u Niu.

10. U nikom Klinikom centru proseno leenje bolesnika je 50 dana ( x =50) i
SD=5. Izraunati:
- Koji procenat bolesnika je leen manje od 25 dana?
- Koji procenat bolesnika je leen od 45 do 55 dana?
- Koji procenat bolesnika je leen vie od 70 dana?
- Koji procenat bolesnika je leen od 20 do 30 dana?
- Proceniti kolika je prosena duina leenja u svim klinikim centrima u
Srbiji sa verovatnoom od 95%?
H f
6,2 7,49 6
7,5 8,79 7
8,8 10,09 4
10,1 11,39 4
11,4 12,69 6
12,7 13,99 3
30
83
7.6. Polazne osnove za izraunavanje veliine uzorka

Odreivanje adekvatne veliine uzorka
5
je jedan od najznaajnijih zadataka pri
dizajnu ispitivanja koji moe bitno da utie na donoenje preciznih zakljuaka o
postojanju ili nepostojanju znaajnih razlika izmeu vrednosti numerikih
karakteristika ispitanika, uestalosti atributivnih obeleja, kao i postojanju ili
nepostojanju znaajnih uticaja ili interakcija izmeu ispitivanih faktora. Procedure
kojima se odreuje odgovarajua veliina uzorka baziraju na korienju formula ili
specijalno dizajniranih tabela i dijagrama.


7.6.1. Odreivanje najvanijih obeleja ispitivanja

U svakom istraivanju definiu se pretpostavljeni uzroci (nezavisno
promenljive varijable) i njihove posledice (zavisno promenljive - posledine varijable),
kao i jedan broj nezavisnih varijabli koje se eventualno meaju u odnose izmeu uzroka
i posledica. Kako bi se pristupilo odreivanju odgovarajue veliine uzorka neophodno
je predhodno definisati jedno ili nekoliko najvanih obeleja koje se ispituju. To mogu
biti numerike (teina, visina, broj eritrocita...), ali i atributivne (kategorijske)
promenljive (pol, kolska sprema, zanimanje...). Ukoliko je mogue izdvojiti jedno
najvanije obeleje, tada ono predstavlja osnovu za izraunavanje odgovarajue
veliine uzorka i samo ono e biti ukljueno u formulu. U sluajevima kada je nekoliko
varijabli podjednako ili priblino znaajno u istraivanju, svaka od njih se ukljuuje u
odgovarajuu posebnu formulu, a po pravilu se za adekvatnu veliinu uzorka bira
najvea izraunata vrednost. Izuzetak je situacija u kojoj je prema jednoj od znaajnih
promenljivih potrebna veliina uzorka izrazito vea nego prema svim drugim znaajnim
varijablama. Tada je mogue za odgovarajuu veliinu uzorka uzeti drugu po veliini
izraunatu vrednost.
Kada je najvanije obeleje ispitivanja neka kategorijska promenljiva, a
pogotovo kada je to dihotomno obeleje (muki-enski pol, oboleo-zdrav i slino),
potrebna veliina uzorka je po pravilu vea nego kada je to neka numerika
promenljiva.


7.6.2. Kontrola greke procene

Sve formule koje se koriste za izraunavanje adekvatne veliine uzorka
ukljuuju jedan, dva ili vie kriterijuma za kontrolu greke procene rezultata dobijenih
ispitivanjem uzorka, a ne populacije u celini. Statistiki parametri ije je vrednosti u tu
svrhu potrebno uneti u formule su razliiti, a najee su to: verovatnoa greke tipa I,
verovatnoa greke tipa II, nivo pouzdanosti, snaga studije, margine greke i granina
tablina z ili t vrednost.


5
Izrazi "adekvatna veliina uzorka" i "potrebna veliina uzorka" predstavljaju najmanji broj jedinica
posmatranja koja je potrebno obuhvatiti u ispitivanju, a podrazumeva se da je vei broj jedinica posmatranja
ne samo dozvoljen ve i preporuen ("to vie to bolje").
84
Verovatnoa greke tipa I
Greka tipa I ( greka) nastaje u situaciji kada istraiva vrei procenu na
osnovu uzorka pogreno zakljuuje da postoji znaajna razlika izmeu dve grupe, dok
te razlike u celoj populaciji zaista nema. Drugim reima, nultu hipotezu bi trebalo
prihvatiti, ali je zbog zakljuivanja na osnovu uzorka ona odbaena.
Nivo greke tipa I predstavlja verovatnou da e biti odbaena istinita nulta
hipoteza. Verovatnoa greke tipa I se naziva kriterijum statistike znaajnosti i
obeleava se sa p, a u istraivanjima se najee koriste verovatnoe greke tipa I manje
od 0,05 (5%), 0,01 (1%) i 0,001 (0,1%). Nivo verovatnoe greke manji od 5% je
prihvatljiv u veini istraivanja. Nii nivoi verovatnoe greke se koriste u sluajevima
kada su odluke bazirane na rezultatima ispitivanja kritine, odnosno mogu da uzrokuju
oteenja zdravlja ili vee finansijske gubitke.
Pri korienju svih statistikih testova, pored vrednosti testa izraunava se i p
vrednost. Kada je ona manja od 0,05 istraiva moe da zakljui da razlika koja postoji
izmeu dve grupe ispitanika u uzorku reprezentuje pravu razliku koja postoji i u
populaciji, pri emu je ispunjen kriterijum statistike znaajnosti pri odbacivanju nulte
hipoteze.

Nivo pouzdanosti
Kada je verovatnoa greke procene da razlika koja postoji izmeu dve grupe iz
uzorka odraava pravu razliku u populaciji iz koje je uzorak izabran manja od 0,05
(5%), tada je verovatnoa istinitosti procene vea od 0,95 (95%). Ovo je ujedno
verovatnoa sa kojom e pri ispitivanju na uzorku biti odbaena neistinita nulta
hipoteza, odnosno biti prihvaena istinita radna hipoteza i ona se naziva nivo
pouzdanosti. Zbir nivoa pouzdanosti i dozvoljenog nivoa greke tipa I iznosi 1 (100%).
Prema tome, ukoliko smo se u dizajnu studije opredelili za dozvoljeni nivo greke tipa I
manji od 5%, tada nam je nivo pouzdanosti vei od 95%.

Margina greke procene
Margina greke predstavlja polovinu irine intervala poverenja za izraunatu
vrednost nekog statistikog parametra kojim vrimo procenu osnovnog skupa na
osnovu uzorka. Kohran prihvatljivu marginu greke procene definie kao rizik koji je
istraiva spreman da prihvati pri proceni parametara osnovnog skupa na osnovu
uzorka.
U rezultatima istraivanja esto se prikazuje samo jedan broj, kao to je razlika
izmeu srednjih vrednosti nekog obeleja ili razlika izmeu dve proporcije. Statistikim
testovima zatim se procenjuje znaajnost ove razlike i prihvata ili odbacuje nulta
hipoteza za odreeni nivo verovatnoe procene. Ovakav nain zakljuivanja se naziva
pojedinana procena (procena u jednoj taki). Meutim, ako se pored testiranja
znaajnosti razlike dve vrednosti prikae i interval poverenja (sa odreenim nivoom
verovatnoe, najee 95%) koji okruuje ovu razliku, dobija se uvid u rang moguih
vrednosti za pravu razliku, koja bi se dobila kada bi ispitivanje obuhvatilo ceo osnovni
skup. Ovakav nain zakljuivanja se naziva intervalna procena. Osim za razlike izmeu
srednjih vrednosti i proporcija, intervali poverenja se mogu izraunati i za pojedinane
srednje vrednosti, pojedinane proporcije, koeficijente regresije, vrednosti relativnog
rizika i druge statistike parametre.
Kada se u formulama za izraunavanje veliine uzorka zahteva unos margine
greke procene postoji opte pravilo da je, umesto izraunavanja intervala poverenja,
85
prihvatljivo koristiti margine greke od 5% za kategorijske podatke i od 3% za
numerike podatke. Na konkretnim primerima to bi znailo: 1) u sluaju kada
izraunata razlika telesne mase izmeu dve grupe u uzorku iznosi 1000g, prava razlika
vrednosti u populaciji bi se nala u intervalu: izraunata vrednost 3% ili 100030g
(970 do 1030g); 2) u sluaju kada izraunata proporcija puaa u uzorku iznosi 40%,
prava zastupljenost puaa bi se nala u intervalu: izraunata proporcija 5% ot te
proporcije ili 402% puaa (38 do 42%).

Granine tabline z i t vrednosti
U nekim formulama za izraunavanje veliine uzorka se umesto dozvoljenog
nivoa greke tipa I zahteva unos granine tabline z ili t vrednosti.

Verovatnoa greke tipa II i snaga studije
Greka tipa II ( greka) nastaje u situaciji kada istraiva vrei procenu na
osnovu uzorka pogreno zakljuuje da ne postoji znaajna razlika izmeu dve grupe,
dok bi analiza vrena na celokupnoj populaciji potvrdila da razlika postoji i da je
statistiki znaajna. Drugim reima, nultu hipotezu bi trebalo odbaciti, ali je zbog
zakljuivanja na osnovu uzorka ona prihvaena. Verovatnoa da e prava razlika koja
postoji izmeu dve grupe u populaciji biti potvrena u ispitivanju na uzorku predstavlja
snagu studije. Zbir verovatnoe greke tipa II i snage studije iznosi 1 (100%). Ne
postoji formalni standard za eljenu verovatnou snage studije, ali veina istraivaa
kao adekvatnu vrednost prihvata 0,8 (80%). Prema tome, dozvoljeni nivo greke tipa II
bi tada iznosio 0,2 (20%).
Odreivanje snage pre poetka studije (a priori) je prihvaeno od strane veine
istraivaa i koristi se za izraunavanje adekvatne veliine uzorka. Post-hoc analiza se
ponekad koristi da bi se utvrdila snaga ve sprovedene studije i korist od ovakve analize
je veoma diskutabilna.


7.6.3. Odreivanje varijabilnosti ispitivanih obeleja

Kljuna komponenta svih formula za izraunavanje veliine uzorka je
varijabilnost najvanijeg obeleja ispitivanja. Istraivai pre poetka studije ne
raspolau tanom informacijom o varijabilnosti obeleja koje tek treba da ispituju te su
prinueni da naine procenu, a za tu svrhu mogu posluiti tri metode:
- Korienje dvofaznog uzorka. U prvoj fazi se ispitivanjem obuhvata deo
uzorka, odnosno sprovede se pilot istraivanje. Na osnovu prikupljenih podataka iz prve
faze odredi se varijabilnost najvanijeg obeleja i rezultat se ukljuuje u formulu za
izraunavanje adekvatne veliine uzorka, odnosno odreuje se broj ispitanika koji je
potrebno obuhvatiti studijom u drugoj fazi. Ne postoje preporuke za potrebnu veliinu
uzorka u prvoj fazi ispitivanja, ali statistika logika ukazuje da je 30 ispitanika za svaku
od analiziranih grupa dovoljan broj. To bi znailo da ukoliko istraiva planira da
studijom obuhvati jednu eksperimentalnu i jednu kontrolnu grupu, u prvoj fazi je
potrebno analizirati po 30 ispitanika iz obe grupe, ukupno njih 60. Kada je u planu da
istraivanje poredi obeleja iz 3 grupe, u prvoj fazi bi bilo obuhvaeno 90 ispitanika
6
.

6
U sluajevima kada je u dizajnu studije predvieno da u okviru grupa postoje podgrupe, pri izraunavanju
adekvatne veliine uzorka je svaku od podgrupa potrebno tretirati kao posebnu grupu.
86
- Korienje podataka iz predhodnih istraivanja na istoj ili slinoj populaciji.
- Procena varijabilnosti uz pomo matematikih procedura.
Prve dve metode koriste stvarne podatke i produkuju validne procene
varijabilnosti obeleja. Meutim, u nekim istraivanjima nije mogue primeniti nijednu
od tih metoda. Tada se za procenu varijabilnosti obeleja mora primeniti trei metod,
odnosno sprovesti matematiko izraunavanje. Objasniemo dve najjednostavnije
procedure i to za procenu varijabilnosti dihotomnih kategorijskih obeleja, kao i
numerikih obeleja ija se vrednost dobija na osnovu stepenovanih skala.
Kada je najvanije obeleje ispitivanja dihotomna promenljiva (muki-enski
pol, oboleo-zdrav i sl.) varijansa za svaki od dva modaliteta obeleja izraunava se
jednostavnim kvadriranjem proporcije tog modaliteta. Kako su nam pre ispitivanja
proporcije modaliteta nepoznate, preporuuje se da predpostavljena proporcija svakog
od dva modaliteta obeleja u populaciji bude 0,5 (50%). Time se dobija maksimalna
vrednost varijanse, a samim tim i maksimalna potrebna veliina uzorka, odnosno
izbegava se mogunost da uzorak bude manji od potrebnog. Prema tome, u sluajevima
kada nismo u mogunosti da na drugi nain procenimo varijabilnost dihotomnog
obeleja, kao predpostavljenu varijansu svakog od dva modaliteta koristimo vrednost
od 0,25 (0,5
2
=0,25 ili 25%).
U sluaju kada je najvanije obeleje ispitivanja numeriko obeleje ija se
vrednost dobija na osnovu skale, u proceni varijanse prvo je potrebno definisati broj
stepenova skale. Na primer, ako je najvanije obeleje ispitivanja subjektivno
zdravstveno stanje, a ono se procenjuje na osnovu odgovora datih na pitanje iz upitnika:
"Ocenite svoje zdravlje ocenom od 1 do 10", broj stepenova skale iznosi 10. Zatim se
broj stepenova skale podeli sa 6 jer se predpostavlja da e po 3 standardne devijacije sa
svake strane stvarne srednje vrednosti skale, ma kolika ona bila, obuhvatiti 99%
odgovora koji bi se dobili kada bi cela populacija bila obuhvaena ispitivanjem.
Izraunati kolinik predstavlja standardnu devijaciju skale, a kvadrat kolinika je
varijansa skale. U naem primeru desetostepene skale, procenjena standardna devijacija
skale bi iznosila 10/6=1,67, a varijansa 1,67
2
=2,79.


7.6.4. Obuhvat uzorka istraivanjem

U nekim sluajevima je prilikom izraunavanja adekvatne veliine uzorka
potrebno unapred uzeti u obzir mogunost da sve odabrane osobe nee pristati da
uestvuju u ispitivanju. To se najee dogaa pri anketiranju. Slian problem nastaje i
kada neki ispitanici odustanu u toku samog istraivanja ili iz njega moraju da budu
iskljueni iz raznih razloga (predomisle se, razbole se i td.).
Zbog ovakve mogunosti deo autora pri izraunavanju veliine uzorka dodaje
odreen procenat potrebnih ispitanika (oversampling). Ukoliko se odlui na poveanje
uzorka istraivau stoje na raspolaganju dve logine i prihvatljive metode, koje su u
osnovi sline kao i pri odreivanju varijabilnosti najvanijeg obeleja, a to su: a)
korienje dvofaznog uzorka - pilot studije i b) korienje podataka iz predhodnih
istraivanja na istoj ili slinoj populaciji. Za razliku od procene varijabilnosti uz
primenu matematikih procedura, procena obuhvata nema izgraene egzaktne metode i
nije preporuljiva.


87

7.7. Odreivanje adekvatne veliine uzorka

7.7.1. Aritmetika sredina ili proporcija osnovnog skupa

Postoje brojne formule za izraunavanje adekvatne veliine uzorka na osnovu
ije aritmetike sredine ili proporcije za neko obeleje bi se vrila procena kolika je
stvarna aritmetika sredina ili proporcija tog obeleja u celokupnoj populaciji. One
zahtevaju predhodno izraunavanje standardne devijacije vrednosti obeleja na pilot
uzorku i ovakvo odreivanje varijabilnosti se moe smatrati validnim jer koristi stvarne
podatke. Meutim, u formule je potrebno uneti i procenjeno odstupanje srednje
vrednosti uzorka od stvarne aritmetike sredine u populaciji ili procenjenu proporciju
javljanja neke pojave, a njih ne znamo, odnosno na osnovu uzorka i elimo da ih
odredimo. Ovakav postupak je ve diskutabilan. Zbog toga je od strane mnogih
istraivaa prihvaen jednostavniji nain odreivanja adekvatnog uzorka za procenu
aritmetike sredine ili proporcije osnovnog skupa, a to je korienje tabela i
nomograma.

Tabela za odreivanje veliine uzorka na osnovu veliine populacije predloena od
strane Bartleta, Kotrlika i Higinsa

Veliina uzorka
Numeriki podaci
(margina greke=0,03)
Kategorijski podaci
(margina greke=0,05)
Veliina
populacije
p=0,05
t=1,96
p=0,01
t=2,58
p=0,05
t=1,96
p=0,01
t=2,58
100 55 68 80 87
200 75 102 132 154
300 85 123 169 207
400 92 137 196 250
500 96 147 218 286
600 100 155 235 316
700 102 161 249 341
800 104 166 260 363
900 105 170 270 382
1000 106 173 278 399
1500 110 183 306 461
2000 112 189 323 499
4000 119 209 362 598
6000 119 209 362 598
8000 119 209 367 613
10000 119 209 370 626

Primeri:
a) elimo da utvrdimo prosenu vrednost indeksa radne sposobnosti kod 43
radnika iz neke firme. Kolika je adekvatna veliina uzorka?
88
U tabeli je najmanja veliina populacije 100. Za ovu, kao i za manje populacije
potrebna veliina uzorka za numerike podatke i za nivo greke procene manji od 0,05
iznosi 55, a za nivo greke procene manji od 0,01 adekvatna veliina uzorka je 68
ispitanika. Meutim, kako je broj zaposlenih u firmi manji od 55, ispitivanje je
potrebno sprovesti na svim radnicima.
b) Kolika je adekvatna veliina uzorka za procenu prosenog broja eritrocita
kod 350 uenica jedne srednje kole?
Kako u tabeli nemamo veliinu populacije od 350 koristiemo prvu veu
vrednost, a to je 400. Za numerike podatke i za nivo greke procene manji od 0,05
potrebna veliina uzorka je 92 uenice, a za nivo greke procene manji od 0,01
adekvatna veliina uzorka je 137 uenica.
c) Kolika je adekvatna veliina uzorka za procenu prosene gustine kostiju kod
10450 ena starih od 50 do 54 godine u nekom gradu?
Populacija prevazilazi najveu vrednost u tabeli koja iznosi 10000. Meutim,
uoavamo da se za numerike podatke potrebna veliina uzorka ne menja sa porastom
veliine populacije ve od 4000. Prema tome, za nivo greke procene manji od 0,05
potrebna veliina uzorka je 119 ena, a za nivo greke procene manji od 0,01 adekvatna
veliina uzorka je 209 ena.
d) Koja je potrebna veliina uzorka za procenu zastupljenosti hipertenzije kod
1650 lekara na nekom okrugu?
Kako u tabeli nemamo veliinu populacije od 1650 koristiemo prvu veu
vrednost, a to je 2000. Za kategorijske podatke i za nivo greke procene manji od 0,05
potrebna veliina uzorka je 323 lekara, a za nivo greke procene manji od 0,01
adekvatna veliina uzorka je 499 lekara.


7.7.2. Procena razlike izmeu dve srednje vrednosti

Najjednostavnija formula za izraunavanje potrebne veliine uzorka za procenu
razlike izmeu dve srednje vrednosti glasi:
( )
( )
2 2 2
1 2
2
1 2 -
t SD SD
n
x x
+
= Formula broj 1
gde je:
n - broj statistikih jedinica,
t - granina tablina t vrednost,
2
1
SD - standardna devijacija prvog uzorka,
2
2
SD - standardna devijacija drugog uzorka,
1 x - aritmetika sredina prvog uzorka,
2 x - aritmetika sredina drugog uzorka.

Primer: Potrebno je da uporedimo efikasnost dva leka A i B u leenju
arterijske hipertenzije u studiji koja e trajati 3 meseca. elimo nivo pouzdanosti pri
zakljuivanju vei od 95%, odnosno doputamo nivo greke tipa I manji od 5%. Kao
glavni pokazatelj istraivanja definiemo razliku u visini pritiska pre poetka primene
terapije i na kraju istraivanja. Koja je potrebna veliina uzorka?
89
Reenje:
I Pored vrste terapije, na visinu krvnog pritiska utiu i mnogi drugi faktori,
od kojih su najpoznatiji: starija ivotna dob, gojaznost, pol, konzumiranje alkoholnih
pia, nedovoljna fizika aktivnost, povean unos kuhinjske soli, nizak nivo kalijuma u
ishrani, puenje i pozitivna porodina anamneza. Najjednostavniji nain za kontrolu
uticaja svih navedenih faktora je uparivanje ispitanika poreenih grupa u odnosu na
ispoljenost tih faktora, odnosno primena uparenih uzoraka (matched samples). Na taj
nain e jedina razlika izmeu grupa biti u leku koji e koristiti, a zakljuak o
efikasnosti lekova A i B e biti validan.
II Da bi mogli da primenimo formulu za izraunavanje adekvatne veliine
uzorka neophodne su nam prosene vrednosti najvanijeg obeleja ispitivanja, kao i
njegove standardne devijacije za obe poreene grupe. Kako tim podacima ne
raspolaemo, potrebno je u prvoj fazi sprovesti pilot studiju. Ve je navedeno da je 30
ispitanika za svaku od poreenih grupa dovoljan broj u prvoj fazi ispitivanja.
III Sproveli smo pilot studiju na dve grupe od po 30 ispitanika. U prvoj grupi,
koja je u terapiji koristila lek A, prosena razlika u visini pritiska pre poetka primene
terapije i na kraju istraivanja je iznosila 22mmHg sa standardnom devijacijom od
7mmHg, a u drugoj grupi, koja je dobijala lek B, 25mmHg sa standardnom devijacijom
od 9mmHg.
IV Za verovatnou greke tipa I od 5%, odnosno za nivo pouzdanosti od 95% i
za stepen slobode od 58 (s.s.=n
1
+n
2
-2=30+30-2=58) granina tablina t vrednost je 2,0.
V Sada raspolaemo vrednostima svih parametara potrebnih za izraunavanje
adekvatne veliine uzorka i unesemo ih u formulu:
( )
( )
( )
( )
( )
2 2 2 2 2 2
1 2
2 2
1 2
2 7 9
4 49 81
57,8 58
9
22 - 25
-
t SD SD
n
x x
+ +
+
= = = = ~
Potrebno je ispitati 58 pacijenata iz osnovnog skupa obolelih od hipertenzije
koji u terapiji koriste lek A i 58 pacijenata koji u terapiji koriste lek B, odnosno
adekvatna veliina ukupnog uzorka iznosi 116 statistikih jedinica. Kako smo ve
ispitali po 30 pacijenata, u drugoj fazi istraivanja je neophodno ispitati jo po 28
pacijenata.


7.7.3. Procena razlike izmeu dve proporcije

Najkorieniju formulu za izraunavanje potrebne veliine uzorka za procenu
razlike izmeu dve proporcije predloio je Flejs i ona glasi:
1 1 2 2
2
1 2
1 2
2
2
-
-
p q p q
n C
p p
p p
+
= + + Formula broj 2
gde je:
C konstanta,
p
1
proporcija javljanja neke pojave u prvoj grupi (od 0 do 1),
q
1
proporcija nepojavljivanja te pojave u prvoj grupi (q
1
=1-p
1
),
p
2
proporcija javljanja pojave u drugoj grupi,
q
2
proporcija nepojavljivanja pojave u drugoj grupi (q
2
=1-p
2
),


90
Vrednost konstante C zavisi od dozvoljenog nivoa greaka tipa I i II:
Nivo greke tipa I
Nivo greke tipa II 0,05 0,01
0,20 7,85 11,68
0,10 10,51 14,88

Primer: elimo da uporedimo uestalost gojaznosti kod gradske i seoske dece
starosti od 8 do 11 godina. Doputamo nivo greke tipa I manji od 0,05, a nivo greke
tipa II od 0,20. Potrebno je odrediti adekvatnu veliinu uzorka.
Reenje:
I Da bi mogli da primenimo formulu potrebne su nam uestalosti
prekomerne telesne teine kod gradske i seoske dece. Kako tim podacima ne
raspolaemo, neophodno je u prvoj fazi sprovesti pilot studiju. Kako elimo da
ispitujemo zastupljenost pojave koja nije retka, smatramo da je 30 ispitanika za svaku
od poreenih grupa dovoljan broj u prvoj fazi ispitivanja.
II Sproveli smo pilot studiju na dve grupe od po 30 ispitanika. Kod gradske
dece gojaznost je potvrena u 6 (20,0%), a kod seoske u 4 (13,33%) sluaja. Prema
tome, proporcija kod gradske dece iznosi p
1
=0,20, a kod seoske p
2
=0,13. Odatle: q
1
=1-
p
1
=1-0,20=0,80, a q
2
=1-p
2
=1-0,13=0,87.
III Vrednost konstante C za eljeni nivo greke tipa I manji od 0,05 i nivo
greke tipa II od 0,20 iznosi: C=7,85.
IV Unesemo sve potrebne vrednosti u formulu za izraunavanje veliine
uzorka:
2
0, 20 0,80 0,13 0,87 2
7,85 2 468, 09 468
0, 20 0,13
0, 20 0,13
n
+
= + + = ~


Potrebno je ispitati 468 deteta iz gradske i 468 iz seoske sredine. Kako smo ve
ispitali po 30 deteta, u drugoj fazi istraivanja je neophodno ispitati jo po 438 deteta.


7.7.4. Poreenje vie od dve grupe ispitanika

Najjednostavniji nain za odreivanje potrebne veliine uzorka u sluajevima
kada poredimo tri i vie grupa ispitanika je definisanje dve grupe koje su nam
najvanije u istraivanju. Tada emo za izraunavanje veliine uzorka primeniti jednu
od ve prikazanih metoda kada poredimo dve grupe ispitanika, a u zavisnosti od toga da
li poredimo numerike vrednosti ili proporcije. U formule ukljuujemo vrednosti
parametara dve najvanije grupe, a izraunati broj potrebnog broja ispitanika
primenjujemo za sve poreene grupe.

Primer: elimo da poredimo uestalost gojaznosti kod uenika osnovnih kola,
srednjih kola i studenata.
Reenje:
I Definiemo da su nam rezultati kod uenika osnovnih i srednjih kola
znaajniji nego oni kod studenata i izvrimo pilot studiju sa po 30 ispitanika iz ove dve
grupe.
II Unesemo parametre dobijene iz pilot studije u formulu za izraunavanje
veliine uzorka za procenu razlike izmeu dve proporcije (formula broj 2). Ako je
91
rezultat formule, na primer 50, zakljuujemo da je potreban broj ispitanika za sve tri
grupe po 50, a kako smo ve ispitali po 30 uenika osnovnih i srednjih kola u drugoj
fazi studije emo analizirati 50 studenata i po 20 uenika osnovnih i srednjih kola.
III Kada bi nam glavni pokazatelj istraivanja bio numerika vrednost indeksa
mase tela (BMI), tada bi njene prosene vrednosti i standardne devijacije za uenike
osnovnih i srednjih kola dobijene na osnovu podataka iz pilot studije uneli u formulu
za izraunavanje veliine uzorka za procenu razlike izmeu dve srednje vrednosti
(formula broj 1).


7.7.5. Zavisni uzorci

U situacijama kada ista grupa ispitanika predstavlja i eksperimentalnu i
kontrolnu grupu, odnosno kada se na njoj vri ispitivanje pre i posle protoka odreenog
vremena (najee pre i posle neke intervencije), govorimo o zavisnom uzorku.
Zakljuivanje na osnovu zavisnog uzorka ima veu pouzdanost nego zakljuivanje na
osnovu nezavisnih uzoraka jer se pri tome vri mnogo bolja kontrola svih individualnih
pridruenih faktora, koji se za vreme studije ne menjaju ili su promene neznatne
(naslee, starost, teina, puenje, konzumiranje alkoholnih pia, kolska sprema,
socijalni status...). Zbog toga je i potrebna veliina zavisnih uzoraka manja nego
veliina nezavisnih uzoraka.
7

Snedekor i Kohran su predloili formulu za izraunavanje adekvatne veliine
zavisnog uzorka za sluaj kada je glavno obeleje ispitivanja kontinuirana numerika
promenljiva:
2
2
SD
n C
x
| |
= +
|
\ .
Formula broj 3
gde je:
n - broj statistikih jedinica,
SD - standardna devijacija razlika nastalih izmeu dva merenja,
x - aritmetika sredina razlika nastalih izmeu dva merenja,
C - konstanta (sa vrednostima koje se primenjuju u formuli br. 2).

Primer: elimo da utvrdimo da li e se stepen depresivnosti kod obolelih od
angine pektoris, izraen kroz vrednosti skale za depresivnost, znaajno umanjiti u toku
tri meseca ukoliko se u terapiju uvede lek A. Koja je potrebna veliina uzorka za
dozvoljeni nivo greke tipa I manji od 0,05, a nivo greke tipa II od 0,10?
Reenje:
I Sproveli smo pilot studiju u kojoj je uestvovalo 30 obolelih od angine
pektoris. Izraunali smo da je proseno umanjenje vrednosti skale kod njih posle
uvoenja leka A u terapiju iznosilo 0,81, a standardna devijacija tog umanjenja je bila
1,66.

7
Ova metoda se odnosi na situacije kada je u studijama analizirana samo jedna grupa ispitanika pre i posle neke
intervencije, a cilj ispitivanja je da se utvrdi da li intervencija izaziva znaajne promene vrednosti nekog
obeleja. Metod se ne odnosi na situacije kada studija obuhvata dve ili vie grupa ispitanika, a cilj je da se
utvrdi da li se promene vrednosti nekog obeleja nastale usled intervencije znaajno razlikuju izmeu
poreenih grupa. U takvim sluajevima se adekvatna veliina uzorka odreuje primenom formule broj 1 u
koju se unose prosene razlike vrednosti pre i posle intervencije, kao i standardne devijacije tih razlika, za
svaku od poreenih grupa.
92
II Vrednost konstante C za eljeni nivo greke tipa I manji od 0,05 i nivo
greke tipa II od 0,10 iznosi: C=10,51.
III Unesemo sve potrebne vrednosti u formulu za izraunavanje veliine
uzorka:
2
1, 66
2 10, 51 46,14 46
0,81
n
| |
= + = ~
|
\ .

Prema tome, potrebna veliina uzorka je 46 obolelih. Kako smo ve ispitali 30
pacijenata, neophodno je u drugoj fazi studije ispitati jo njih 16.


7.7.6. Korelaciona i regresiona analiza

Postoje formule za izraunavanje veliine uzorka kada je potrebno ispitati da li
izmeu razliitih numerikih obeleja u jednoj grupi ispitanika postoji znaajna
korelacija. Meutim, u ove formule je potrebno uneti vrednost unapred
predpostavljenog koeficijenta korelacije, to je u velikom broju sluajeva veoma
diskutabilno. Zbog toga je, umesto korienja ovakvih formula, definisano nekoliko
pravila za odreivanje neophodnog broja ispitanika kako bi rezultat korelacione ili
regresione analize bio validan, a u ovom priruniku navodimo ona koja se najee
primenjuju, kako za univarijantnu, tako i za multivarijantnu analizu:
a) Najpoznatije pravilo predlae po 20 ispitanika za svaku nezavisno
promenljivu ukljuenu u analizu. To znai da je za utvrivanje korelacije izmeu dva
obeleja dovoljno 20 ispitanika. Ukoliko pak elimo da procenimo uticaj, na primer 3
nezavisno promenljive na zavisno promenljivu primenom multivarijantne regresione
analize potrebno je istraivanje sprovesti na: n=3x20=60 ispitanika.
b) Prema Tabakniku i Fidelu za regresionu analizu je istraivanje potrebno
sprovesti na: n=104+m ispitanika, gde je m broj nezavisno promenljivih. Prema ovom
pravilu bi za univarijantnu analizu bilo neophodno: n=104+1=105 ispitanika, a za
multivarijantnu sa 3 nezavisno promenljive: n=104+3=107 ispitanika.
c) Kada nam je u regresionoj analizi znaajno i tumaenje vrednosti
koeficijenta determinacije (R
2
), odnosno kada elimo da procenima koliki procenat
varijabilnosti vrednosti zavisno promenljive je uzrokovan promenama vrednosti
nezavisno promenljivih koje su ukljuene u multivarijantni model, potreban broj
ispitanika iznosi: n=50+8m. To bi znailo da je za univarijantnu analizu neophodno:
n=50+8x1=58 ispitanika, a za multivarijantnu sa 3 nezavisno promenljive:
n=50+8x3=74 ispitanika.


7.7.7. Analiza vremena do nastanka dogaaja (analiza preivljavanja)

Analiza vremena do nastanka nekog dogaaja (engleski: survival analyse), kao
to su povrede, ozdravljenja, dostizanje eljenog rezultata i sl., ukljuuje sloene
statistike modele, kao to su ivotne tabele (life tables), Kaplan-Majerova metoda ili
Koksova regresiona analiza, ali izraunavanje adekvatne veliine uzorka za ovakva
ispitivanja je relativno jednostavno. I u ovim sluajevima je u prvom koraku potrebno
odrediti proporcije nastupanja dogaaja kod ispitanika u poreenim grupama, a zatim te
proporcije uneti u formulu broj 2. Kako su ovo najee prospektivne studije, a vreme
93
praenja moe trajati i nekoliko godina, racionalnije je koristiti podatke iz predhodnih
studija nego sprovoditi dugotrajno pilot istraivanje.
Drugi metod podrazumeva unoenje prosene duine i standardne devijacije
vremena do nastupanja dogaaja kod dve poreene grupe u formulu broj 1. Ovakav
pristup, meutim, zahteva da praenje mora da traje dok dogaaj ne nastupi kod svih
ispitanika u obe grupe. To takoe znai da je verovatnoa da e dogaaj nastupiti kod
svih ispitanika 100%, pa je metod primenljiv samo kod ispitivanja gde je oekivani
dogaaj izvestan (na primer, ozdravljenje ili oporavak kod lakih bolesti ili povreda).

Primer: elimo da ispitamo da li vrsta fizikalne terapije (A ili B) znaajno utie
na duinu oporavka posle modanog udara. Pri dizajnu studije odreujemo da e vreme
praenja iznositi 10 meseci. Osim vrste terapije elimo da procenimo da li na oporavak
znaajno utiu i drugi faktori, kao to su: starost, pol, BMI i td. Prema tome,
primeniemo Kaplan-Majer-ovu i Koksovu regresionu analizu. Doputamo nivo greke
tipa I manji od 0,05, a nivo greke tipa II od 0,20.
Reenje:
I Kako vreme praenja iznosi 10 meseci, a pri tome i ne oekujemo da e
potpuni oporavak nastupiti kod svih ispitanika, racionalnije je da umesto sprovoenja
pilot studije za odreivanje adekvatne veliine uzorka koristimo rezultate predhodnih
istraivanja.
II Konsultujemo literaturu i nalazimo da primena terapije A dovodi do
zadovoljavajueg oporavka kod oko 60% pacijenata (p
1
=0,60), dok primena terapije B
dovodi do oporavka kod oko 70% ispitanika (p
2
=0,70) u periodu primene od 10 meseci.
Odatle: q
1
=1-p
1
=1-0,60=0,40, a q
2
=1-p
2
=1-0,70=0,30.
III Vrednost konstante C za eljeni nivo greke tipa I manji od 0,05 i nivo
greke tipa II od 0,20 iznosi: C=7,85.
IV Unesemo sve potrebne vrednosti u formulu broj 2:
1 1 2 2
2 2
1 2
1 2
2 0, 6 0, 4 0, 7 0,3 2
2 7,85 2 375, 25 375
- 0, 6 - 0, 7
- 0, 6 - 0, 7
p q p q
n C
p p
p p
+ +
= + + = + + = ~

Prema tome, validne zakljuke o uticaju vrste terapije na duinu oporavka posle
modanog udara dobiemo ukoliko u istraivanje ukljuimo dve grupe od po 375
pacijenata.


7.7.8. Korienje nomograma

Nomogrami predstavljaju grafike prikaze numerikih relacija. Njihova
primena je raznovrsna, a izmeu ostalog, konstruisani su i mnogi nomogrami za brzo
odreivanje adekvatne veliine uzorka. U ovom priruniku prikazaemo primenu
nomograma koji je 1985. godine prezentovao strunoj javnosti dr Relja Petrovi, lekar
tadanjeg Zavoda za zatitu zdravlja u Niu. On se moe koristiti za utvrivanje velikih
sluajnih nestratifikovanih uzoraka za procenu srednje vrednosti ispitivanih obeleja u
osnovnom skupu. Nomogram se preporuuje zbog jednostavne primene i strune
opravdanosti njegove upotrebe. Sastoji se od mree konstruisane izmeu dveju
logaritamskih osa apscise, na kojoj je predstavljena populacija, i ordinate, na kojoj je
procenat optimalnog uzorka, i linije nomograma koja odreuje granicu.
Upotreba: Za odreivanje veliine uzorka za zadatu populaciju stanovnika
potrebno je na apscisi pronai taku koja oznaava tu populaciju, zatim podii vertikalu
94
do nomogramske linije, a onda vratiti ulevo do ordinate i proitati procenat zahvata na
ordinati.

Nomogram za odredjivanje optimalnog uzorka
0.01
0.1
1
10
100
10 100 1000 10000 100000 1000000 10000000 100000000 1000000000
Populacija
U
z
o
r
a
k

(
%

z
a
h
v
a
t
a
)
Autor: Dr Relja Petrovi



Primer: Potrebno je odrediti adekvatnu veliinu uzorka za procenu dugotrajnog
delovanja aerozagaenja na zdravlje u gradu ija populacija broji 250000 stanovnika.
Reenje:
Na apscisi pronaemo taku koja oznaava populaciju od 250000 stanovnika.
Podiemo vertikalu do nomogramske linije, a onda vratimo ulevo do ordinate i
oitavamo procenat koji iznosi 1,5%. To praktino znai da za populaciju od 250000
stanovnika optimalni uzorak iznosi 1,5%, odnosno 3750 ispitanika.

Nomogram za odredjivanje optimalnog uzorka
0.01
0.1
1
10
100
10 100 1000 10000 100000 1000000 10000000 100000000 1000000000
Populacija
U
z
o
r
a
k

(
%

z
a
h
v
a
t
a
)
Autor: Dr Relja Petrovi




95
7.7.9. Internet kalkulatori

Na internetu se mogu nai brojni kalkulatori za izraunavanje adekvatne
veliine uzorka, praktino za sve naine testiranja nulte hipoteze: poreenja numerikih
vrednosti i proporcija, regresione analize, analizu varijanse, ponovljena merenja,
analizu preivljavanja i td. Upotreba veine ovih kalkulatora je danas besplatna. Svi oni
sadre kraa uputstva za primenu, a deo njih i formule po kojima se vri izraunavanje.
Da bi mogli biti primenjeni u kalkulatore je potrebno uneti statistike parametre
za glavne promenljive u istraivanju (srednje vrednosti, standardne devijacije,
proporcije), kao i dozvoljeni nivo greke tipa I i II, odnosno eljeni nivo pouzdanosti i
snagu studije. Kao i za primenu formula navedenih u ovom udbeniku, i za internet
kalkulatore je neophodno do statistikih parametara glavne promenljive doi na osnovu
pilot istraivanja ili na osnovu rezultata predhodnih istraivanja.
Ovde e biti prikazana primena samo jednog internet kalkulatora, pod nazivom
Istraivaev komplet alata (Researcher's toolkit), to nikako ne predstavlja iskljuivu
preporuku autora jer je izbor zaista veoma veliki. Ovaj kalkulator se moe primeniti za
izraunavanje potrebne veliine uzorka za procenu srednje vrednosti ili proporcije
osnovnog skupa, kao i za poreenje srednjih vrednosti ili proporcija izmeu dve grupe
ispitanika, a nalazi se na adresi: http://www.dssresearch.com/toolkit/sscalc/size.asp.

Procena razlike izmeu dve srednje vrednosti



Primer: elimo da uporedimo indeks radne sposobnosti kod radnika u
odnosu na nivo kolske spreme: visoka - srednja/via. Procenu vrimo
primenom skale ije su vrednosti od 7 (slab) do 49 (odlian). Pilot studija
sprovedena na dve grupe od po 30 ispitanika je pokazala da kod radnika sa
visokom kolskom spremom prosean indeks radne sposobnosti iznosi 406, a
96
kod onih sa srednjom i viom kolskom spremom 424. Definisali smo
dozvoljeni nivo greke tipa I ( greka) od 5%, a greke tipa II ( greka) od
20%.
Reenje:
Izaberemo opciju Averages (aritmetike sredine), Two Samples (dva uzorka) i
unesemo potrebne statistike parametre u predviena polja kalkulatora. Pritiskom na
taster Calculate Sample Size (izraunaj veliinu uzorka) dobijamo da je potrebno
ispitati 80 radnika sa visokom i 80 sa srednjom ili viom kolskom spremom (veliina
uzorka iznosi 80 za oba uzorka Sample Size = 80 for both samples!). Kako smo ve
ispitali po 30 radnika, u drugoj fazi istraivanja je neophodno ispitati jo po 50.


Procena razlike izmeu dve proporcije

Primer: elimo da uporedimo procenat korienja psihoaktivnih supstanci kod
uenika srednjih kola i studenata. Sproveli smo pilot istraivanje na dve grupe od po
30 ispitanika i korienje psihoaktivnih supstanci je potvreno od strane 2 (6,7%)
uenika i 3 (10,0%) studenta. Doputamo nivo greke manji od 5% (nivo pouzdanosti
u zakljuivanju je tada vei od 95%), a nivo greke manji od 20% (snaga studije je
tada vea od 80%).
Reenje:
Izaberemo opciju Percentages (procenti), Two Samples (dva uzorka) i unesemo
potrebne statistike parametre u predviena polja kalkulatora. Pritiskom na taster
Calculate Sample Size (izraunaj veliinu uzorka) dobijamo:



Potrebno je ispitati dve grupe od po 868 ispitanika. Kako smo ve ispitali po
30, u drugoj fazi istraivanja je neophodno ispitati jo 838 uenika i 838 studenata.


97
8. OSNOVE KORIENJA PROGRAMSKOG
PAKETA SPSS


Programski paket SPSS (Statistical Package for Social Sciences), koji od
verzije 17.0 ima naziv PASW (Predictive Analytics SoftWare) ima sledee
komponente:
1. Programe koji: uitavaju podatke, izvode analize i daju ispise rezultata
2. Fajlove sa podacima (.sav)
3. Fajlove sa ispisima (.spo) i
4. Komandne tj. sintaksne fajlove (.sps)

Program se pokree iz Start menija komandama:
All Programs/SPSS for Windows/SPSSxx.x for Windows (za verzije do 17.0)
ili
All Programs/SPSS inc/PASW Statisticsxx (za verzije od 17.0)



Iz programa se izlazi klikom na znak X (u gornjem desnom uglu) ili odabirom
komandi File pa Exit iz menija programa.

Pokretanjem programa otvara se Glavni prozor, koji se sastoji od tabele za
podatke, menija programa sa komandama od File do Help i nekoliko komandnih ikona.




98
Podaci se unose u tabelu, odnosno matricu reda nm u kojoj su redovi
ispitanici, sluajevi, entiteti ili jedinice posmatranja, a kolone su obeleja, svojstva,
atributi, tj. varijable. Pojedine kolone ili redovi nazivaju se vektori.
Podaci se mogu upisivati direktno u tabelu, ali ih je mogue i uitati iz
standardnih baza podataka (Excel, Dbase, Access...) ili iz bilo kojeg standardnog
editora, ukoliko su sauvani u ASCII formatu (American Standard Code for
Information Interchange).
Tabela editora podataka podeljena je u redove koji su oznaeni brojevima i
kolone koje su oznaene sa var.
Da bi poeli unos podataka potrebno je predhodno kreirati i definisati varijable.
Kliknuti miem na naslov prve kolone var, a zatim desnim klikom mia otvoriti
skraeni meni. Izborom opcije Insert Variable naziv kolone se menja u var00001, a u
ovako kreiranu varijablu je sada mogue unositi podatke.



Glavni prozor SPSS programa se sastoji od dva radna lista koji se nalaze jedan
iznad drugoga.
List koji vidimo kada pokrenemo program i koji smo do sada opisivali naziva
se Data View - Pogled na podatke.
List u kome se vri definisanje varijabli naziva se Pogled na varijable
Variable View. Njega pokreemo klikom na jeziak u donjem levom uglu Glavnog
prozora.



Po automatizmu SPSS novoformiranoj varijabli dodeljuje naziv var00001,
definie je kao numeriku, odreuje joj irinu od 8 cifara sa jo dva decimalna mesta i
daje joj desno poravnanje.

99



Svaku od ovih karakteristika moemo promeniti prema svojim potrebama i
namerama.
Naziv varijable moemo promeniti kada miem kliknemo na eliju sa ve
zadatim imenom var00001.
Naziv moe sadrati slova (samo engleska) i brojeve, ali mora poeti slovom.
U starijim verzijama programa naziv je mogao sadrati do 8 slovno-brojnih
oznaka, dok novije verzije podravaju do 41 oznake.
Naziv ne sme sadrati prazna mesta, slova , , , i , kao i simbole (/, *, !, $,
%, &, =, ?, +, -....).
Definisanje tipa varijable (numerika, tekst - string, datum ...) vri se u eliji
Type, irine u eliji Width, a broja decimalnih mesta u eliji Decimals.
Varijable tipa String ne mogu se koristiti u raunanju. Preporuljivo je da se
kvalitativne (kategorijske) varijable kodiraju numeriki.
Na primer, bolje je umesto kategorija MUKI i ENSKI u varijabli POL
unositi cifre 1 i 2 ili 0 i 1.
Label slui za preciznije definisanje oznake varijable. Ova oznaka moe
sadrati prazna mesta, odnosno odvojene rei i zbog toga se u ispisu rezultata pojavljuje
umesto imena varijable upisanog u polje Name. Kada je polje Label prazno u ispisu
rezultata se pojavljuje naziv upisan u polju Name.
Na primer, kao Name moemo upisati: OKZ, a kao Label: Skor objektivnog
kvaliteta zivota.
U polju Value (vrednost) mogu se definisati znaenja kodova koji su dodeljeni
pojedinim kategorijama kvalitativnih varijabli.
Na primer, ukoliko smo u varijabli POL kategoriji MUKI dodelili kod 1, a
kategoriji ENSKI kod 2, da ne bi pamtili ta koji kod znai, a i da bi se adekvatni
nazivi kategorija pojavili u ispisu rezultata, kliknemo miem na polje Value i otvara se
sledei dijalog prozor:


100
U polje Value upisuje se vrednost koda 1, a u polje Value Label (oznaka
vrednosti) upisuje se znaenje koda, u ovom sluaju MUSKI. Klikom na Add (dodaj)
ova definicija oznake vrednosti koda e biti potvrena i uneta u prostor na dnu dijalog
prozora.
Proceduru ponovimo i za kod 2, odnosno kategoriju ZENSKI.
Dijalog prozor zatvaramo klikom na Continue (nastavi).

Ukoliko elimo da izmenimo neku od definicija naziva vrednosti koda,
kliknemo na nju, nainimo ispravku u poljima Value i Value Label, a zatim kliknemo
na Change (izmeni).



Uklanjanje neke od definicija naziva vrednosti koda vri se tako to kliknemo
na nju, a zatim na komandu Remove (ukloni).

Missing slui za definisanje nedostajuih podataka.
Column slui za definisanje formata ispisa varijable u tabeli.
Measure omoguava definisanje merne skale sa koje dolaze podaci na datoj
varijabli.

Posle definisanja varijabli klikom na prvu eliju moemo pristupiti unosu
podataka.
Na druge elije prelazimo ili strelicama za pomeranje kurzora ili klikom mia
na njih.
Uneti podaci se trajno zapisuju naredbom Save (sauvaj) iz File menija. Pri
prvom zapisivanju pokree se opcija Save As... (sauvaj kao) i tom prilikom je
potrebno dati ime fajlu sa podacima.

Preporuke
Prva kolona u tabeli bi trebalo da sadri redni broj statistike jedinice. Druga
kolona bi trebalo da sadri oznaku grupe u kojoj se nalazi statistika jedinica. Ukoliko
grupe sadre podgrupe, potrebno je uvesti posebnu kolonu Podgrupa. Svaka
podgrupa ima svoju posebnu oznaku.
Uvoenje veeg broja podgrupa umanjuje snagu zakljuivanja jer standardna
greka zavisi od veliine uzorka, a pri poreenju vrednosti nekog obeleja izmeu
razliitih podgrupa, svaka od njih se podrazumeva kao poseban uzorak.


101
Uitavanje podataka iz standardnih baza

Biramo: File/ Open/ Data...



Otvara se prozor Open File.
U polju Files of type iz padajueg menija biramo tip baze u kojoj su traeni
podaci, a u polje File name upisujemo njeno ime.
Komandom Open podaci se uitavaju u prozor za podatke SPSS programa.













102
9. STUDENTOV T-TEST


U poglavlju o testiranu hipoteza smo naveli da parametrijske statistike testove
moemo da primenimo u onim sluajevima kada su vrednosti ispitivanog obeleja date
numeriki, odnosno kada su izmerene intervalnom ili skalom odnosa i kada od
parametara moemo da izraunamo aritmetiku sredinu, varijansu, standardnu
devijaciju i standardnu greku. Drugi uslov za njihovu primenu je da je raspored
vrednosti unutar skupova iz kojih su dobijeni uzorci normalan ili pak uzorci moraju da
budu vei od 30 jedinica.
Studentov t-test je parametrijski test koji se koristi za procenu statistike
znaajnosti razlike izmeu dve aritmetike sredine.
Postoji est tipova t testa:
t test razlike izmeu aritmetike sredine osnovnog skupa i uzorka
t test razlike izmeu aritmetikih sredina dva mala nezavisna uzorka
t test razlike izmeu aritmetikih sredina dva mala zavisna uzorka
t test razlike izmeu aritmetikih sredina dva velika nezavisna uzorka
t test razlike izmeu aritmetikih sredina dva velika zavisna uzorka
t test proporcije

Primenom svakog od ovih tipova testa izraunava se t-vrednost, koja u osnovi
predstavlja kolinik razlike izmeu dve aritmetike sredine i standardne greke procene
te razlike, odnosno pokazuje koliko je puta neka razlika vea od sopstvene greke
procene. Svaki od ovih tipova ima posebnu formulu za izraunavanje t-vrednosti, ali se
sve one mogu uopteno prikazati kao:
1 2
1 2
X X
X X
t
SG

=


Za njegovo realizovanje potrebno je poznavati sledee parametre uzoraka koje
poredimo: njihovu veliinu (n), standardnu devijaciju (SD) i aritmetiku sredinu ( X ).
Ukoliko se razlike aritmetikih sredina uzoraka simetrino rasporeuju oko
prave razlike u populaciji, onda je logino da i njihove standardne greke imaju
normalan raspored oko prave greke, pa mogu da se aproksimiraju normalnim
standardizovanim rasporedom.
Tumaenje izraunate (realizovane) t-vrednosti bazira se na poreenju sa
graninim t-vrednostima za odgovarajuu verovatnou greke procene (prag statistike
znaajnosti) i stepen slobode, koje se mogu oitati iz tabele graninih vrednosti t-
rasporeda.

U tumaenju izraunate t-vrednosti vae sledea pravila:
- Ako je realizovana t-vrednost manja od granine tabline vrednosti za
odgovarajui broj stepena slobode i prag znaajnosti, nulta hipoteza se prihvata kao
tana, a odbacuje se alternativna hipoteza.
- t-realizovano < t
(SS i 0,05)
Ho se ne odbacuje jer je rizik da smo naili greku
procene vei od 5% (p>0,05)

103
- Ako je realizovana t-vrednost jednaka ili vea od granine tabline vrednosti,
za odgovarajui broj stepena slobode i prag znaajnosti, nulta hipoteza se odbacuje kao
netana, a prihvata se alternativna hipoteza:
- t-realizovano > t
(SS i 0,05)
odbacuje se nulta hipoteza za nivo rizika p=0,05,
odnosno za nivo sigurnosti P=0,95 (95%)
- t-realizovano > t
(SS i 0,01)
odbacuje se Ho i za nivo rizika p=0,01, odnosno
za nivo sigurnosti P=0,99 (99%).

Sa poveanjem uzorka t-raspored se pribliava standardizovanom normalnom
z-rasporedu, i kod velikih uzoraka (n>30 ili n
1
+n
2
>60 jedinica) poprima sve osobine
ovog rasporeda i t-vrednost se "ponaa" kao z-vrednost.
Kod velikih uzoraka gornja pravila o prihvatanju ili neprihvatanju H
0
se
uproavaju i ne zahtevaju primenu tablice Studentovog t-rasporeda, ve se
zakljuivanje zavisno od nivoa dozvoljene granice greke vri na sledei nain:

za p=0,05 za p=0,01
Ako se razlika nalazi u intervalu
01,96SG nije znaajna; t<1,96 i Ho se
prihvata; p>0,05
Ako se razlika nalazi u intervalu
02,58SG nije znaajna; t<2,58 i Ho se
prihvata; p>0,05
Ako se razlika nalazi izvan intervala
01,96SG znaajna je; Ho se odbacuje;
p<0,05
Ako se razlika nalazi izvan intervala
02,58SG znaajna je; Ho se odbacuje i
za nivo p<0,01



Oblasti statistiki znaajne razlike za p<0,01

Pri raunarskom sprovoenju t-testa ne postoje posebne verzije testa za velike i
male uzorke, kao ni t-test proporcije. Prema tome, kod korienja raunarskih programa
imamo tri varijante t-testa i one se primenjuju za testiranje razlika izmeu aritmetikih
sredina:
- populacije i uzorka,
- dva nezavisna uzorka i
- dva zavisna uzorka.




104
9.1. t-test razlike izmeu aritmetikih sredina osnovnog skupa i
uzorka

Uslov za primenu ovog testa je da je aritmetika sredina osnovnog skupa iz
iskustva poznata ili da je to unapred propisana vrednost (na primer, u medicini
propisane normalne vrenosti eritrocita, holesterola, krvnog pritiska, bilirubina, uree
itd.). Osnovni skup za ove "normalne" vrednosti predstavljaju zdrave osobe.
Pri izraunavanju t-vrednosti nije potrebno poznavanje varijanse osnovnog
skupa, pa je ovaj tip testa praktiniji od ztesta, jer se testiranje hipoteze o aritmetikoj
sredini osnovnog skupa najee odvija u uslovima kada je varijansa osnovnog skupa
nepoznata. U tim uslovima varijansu osnovnog skupa procenjujemo na osnovu
varijanse uzorka, odnosno greku ocene aritmetike sredine osnovnog skupa
izraunavamo na osnovu standarne devijacije uzorka po obrascu:
1
=
n
SD
SG
uz

gde je n-1 - stepen slobode.
Pod uslovom da osnovni skup uma normalan raspored ili da je n>30, a
varijansa osnovnog skupa nije poznata, testiranje hipoteze zasniva se na statistici
Studentovog t-testa, koji se izraunava po obrascu:
1

=
n
SD
X X
t
uz
os uz

gde je X osnovnog skupa hipotetina, unapred poznata vrednost.


Formula za t-vrednost u ovom testu je:
SG
X X
t
os uz
= pri emu je:
1
uz
SD
SG
n
=


Stepen slobode se odreuje po formuli: S.S.=n-1

U tumaenju izraunate t-vrednosti i ovde vae pravila:
- t-realizovano < t
(SS i 0,05)
, prihvata se Ho, a odbacuje Ha, p>0,05,
- t-realizovano > t
(SS i 0,05)
,odbacuje se Ho, a prihvata Ha, p < 0,05,
- t-realizovano > t
(SS i 0,01)
, odbacuje se Ho, a prihvata Ha i za nivo p < 0,01.

Primer: Normalne vrednosti holesterola kod zdravih osoba se kree od 3,1-5,8
mmol/L, tako da je os x
=3,1+5,8/2=4,45. Odabran je zatim uzorak od 21 (n=21)
dijabetiara, odreen holesterol i dobijene su vrednosti: uz x
=5,88 i SD=0,64.
Osnovno pitanje je da li se vrednost holesterola nalazi u granicama normale,
odnosno da li se njihova prosena vrednost od 5,88 znaajno razlikuje od proseka
osnovnog skupa, odnosno od 4,45.
Problem reavamo testiranjem razlike, pa zato izraunamo kolika je ta razlika:
5, 88 4, 45 1, 43 / uz os X X mmol L = =
105
1. Postavljamo hipoteze:
Ho: Razlika od 1,43 mmol/L holesterola nije statistiki znaajna ve je
posledica dejstva sluajnih faktora i ima karakter sluajne varijabilnosti. Uzorak se
ponaa kao da pripada osnovnom skupu zdravih.
Ha: Razlika od 1,43 mmol/L holesterola je statistiki znaajna i verovatno je
posledica uticaja dijabeta, tako da uzorak ne pripada osnovnom skupu zdravih.

2. Izraunavamo t-vrednost:
14 , 0
1 21
64 , 0
1
=

=
n
SD
SG
uz

5, 88 4, 45
10, 21
0,14
uz os X X
t
SG

= = =


3. Stepen slobode je: SS=n-1=21-1=20

Za broj stepena slobode 20 i prag znaajnosti od 0,05 u tablicama oitavamo da
je t=2,09, a za isti broj stepena slobode i za p=0,01 granina tablina vrednost je t=2,84.




















106
t = 10,21 > t
(20 i 0,05)
= 2,09 i p<0,05
t = 10,21 > t
(20 i 0,01)
= 2,84 i p<0,01

Kako je realizovana t-vrednost od 10,21 vea od granine tabline
vrednosti, t=2,09, za broj stepeni slobode 20 i prag znaajnosti od p=0,05, to
odbacujemo nultu i prihvatamo alternativnu hipotezu sa grekom p<0,05 i
sigurnou P>95% tvrdimo da kod dijabetiara holesterol pokazuje znatno vee
vrednosti nego kod zdravih osoba.
To je verovatno posledica dejstva same bolesti.
Uzorak od 21 dijabetiara prema visini holesterola ne pripada osnovnom skupu
zdravih.

Kako je realizovana t-vrednost od 10,21 vea i od granine tabline
vrednosti t=2,84, za broj stepeni slobode 20 i prag znaajnosti od p=0,01, to
odbacujemo nultu i prihvatamo alternativnu hipotezu i za stepen verovatnoe
tvrdnje P>99% i tvrdimo da kod dijabetiara holesterol pokazuje znatno vee
vrednosti nego kod zdravih osoba.


U SPSS-u se ovaj zadatak radi na sledei nain:

Izaberemo komande: Analyze / Compare Means / One-Sample T Test (Analiza
/ Poreenje aritmetikih sredina / t-test za jedan uzorak)



Otvara se radni prozor u kome su sa leve strane nazivi svih varijabli, u ovom
sluaju samo HOLESTEROL.
Markiramo varijablu i klikom na strelicu prebacimo je u polje Test Variable(s).
U polje Test Value upisujemo prosenu vrednost test varijable u populaciji, u
ovom sluaju to je 4,45.
Kliknemo na OK







107


U Output-u (ispisu) se dobijaju sledee tabele:

N Mean Std. Deviation
Std. Error
Mean
holesterol 21 5.8857 0.64287 0.14029
One-Sample Statistics


Lower Upper
holesterol 10.234 20 .000 1.43571 1.1431 1.7283
Test Value = 4.45
One-Sample Test
Mean
Difference Sig. (2-tailed) t df
95% Confidence
Interval of the
Difference


U prvoj ispisnoj tabeli je deskriptivna statistika varijable holesterol u
uzorku: N (veliina uzorka) 21; Mean (aritmetika sredina) 5,8857; Std.
Deviation (SD) 0,64287 i Std. Error Mean (SG aritmetike sredine) 0,14029.
U drugoj tabeli prikazani su: izraunata t-vrednost (10,234), broj stepeni
slobode (20), p vrednost (0,000), razlika izmeu aritmetike sredine u uzorku i
vrednosti u populaciji (1,43571) i granice 95% intervala poverenja za procenu stvarne
razlike, koja bi se dobila kada bi svi dijabetiari bili testirani (donja granica: 1,1431,
gornja granica: 1,7283).
P vrednost od 0,000 ukazuje da je razlika od 1,43571 statistiki znaajna na
nivou greke procene manjem od 0,1% (p<0,001), odnosno da ispitivani dijabetiari
imaju znaajno vee vrednosti holesterola od 4,45. Obe granine vrednosti 95% IP su
vee od nule, to potvruje predhodni zakljuak.






108
9.2. t-test razlike izmeu aritmetikih sredina dva velika
nezavisna uzorka

Testira znaajnost razlike izmeu prosenih vrednosti dva velika nezavisna
uzorka.
t-vrednost se izraunava po formuli:

1 1
2
2
2
1
2
1
2 1

=
n
SD
n
SD
X X
t
gde su:
1 X - aritmetika sredina jednog uzorka (obino se prvo uzima vea vrednost da
bi se izbegao negativan predznak)
2
1
SD - varijansa istog uzorka
n
1
- veliina prvog uzorka
2 X - aritmetika sredina drugog uzorka
2
2
SD - varijansa drugog uzorka
n
2
- veliina drugog uzorka uz uslov: n>30 ili n
1
+n
2
>60

Stepen slobode se odreuje po formuli: S.S = n
1
+ n
2
2.

Primer: Ispitivana je visina holesterola u krvi kod populacije seoskog i
gradskog stanovnitva. Merenje je izvreno na sluajnim uzorcima odraslog
stanovnitva i kod 200 stanovnika sa sela prosena vrednost holesterola iznosila je
X =7,5 mmol/L, a SD = 0,91. Kod 250 ispitanika iz grada prosena visina holesterola
bila je X = 6,73, a SD= 0,85.
Da li postoji znaajna razlika izmedju proseka visine holesterola kod gradskog i
seoskog stanovnitva i da li je ona posledica razlike u nainu ishrane ili je posledica
sluajnog karaktera?

Ho: 7,5 6,73 = 0,77 nije statistiki znaajna razlika
Ha: 7,5 6,73 = 0,77 je znaajna razlika i posledica je razliitog naina ishrane

16 , 9
1 250
84 , 0
1 200
91 , 0
73 , 6 5 , 7
1 1
2 2
2
2
2
1
2
1
2 1
=

=
n
SD
n
SD
X X
t

t = 9,16 > t

= 1,96 i p<0,05
Kako je realizovana t-vrednost od 9,16 vea od granine vrednosti t=1,96 za
prag znaajnosti od p=0,05, to odbacujemo nultu i prihvatamo alternativnu hipotezu sa
grekom p<0,05 i sigurnou P>95% tvrdimo da je razlika izmeu prosene visine
holesterola seoskog i gradskog stanovnitva statistiki znaajna.
To je verovatno posledica razlike u nainu ishrane.
109

t = 9,16 > t = 2,58 i p<0,01
Kako je realizovana t-vrednost od 9,16 vea i od granine vrednosti t=2,84 za
prag znaajnosti od p=0,01, to odbacujemo nultu i prihvatamo alternativnu hipotezu sa
grekom p<0,01 i verovatnoom P>99%.

U SPSS-u se zadatak radi na sledei nain:

Pre izraunavanja testa napomena da treba formirati grupnu varijablu u kojoj se
ifriraju (kodiraju) ispitivane grupe, tj. u redovima u kojima su ispitanici sa sela u
rubrici grupne varijable upisuje se ifra selo, a za ispitanike iz grada ifra grad.
Vrednosti holesterola svih ispitanika (i onih sa sela i onih iz grada) date su u
varijabli holesterol.
Da bi se aktivirao t test za nezavisne uzorke treba otii u Analyse / Compare
Means / Independent-Samples T Test.



Nakon toga pojavljuje se sledei prozor:



U Test Variable treba prebaciti varijablu koju ispitujemo, tj. varijablu
holesterol. U Grouping Variable treba prebaciti grupnu varijablu u kojoj smo ifrirali
seosko i gradsko stanovnitvo, tj. varijablu sifra.

110


Sada treba definisati kako su ifrirane grupe ispitanika. Klikne se na Define
Groups i pojavi se sledei prozor:



U Group 1 upie se ifra prve grupe ispitanika, tj. selo, a u Group 2 druge
grupe, tj. grad.



Klikne se na Continue, zatim u glavnom radnom prozoru na OK i u
Output-u se dobiju rezultati.
U prvoj tabeli je deskriptivna statistika za oba uzorka (selo i grad), tj. seoskog i
gradskog stanovnitva: veliina uzorka - N, X , SD i SG.
U drugoj tabeli u redu Equal variances assumed (predpostavljene jednake
varijanse) itamo vrednost t testa (u koloni t) i greku p (u koloni Sig. 2-tailed).

111
F Sig. t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference Lower Upper
holesterol Equal
variances
assumed
3.892 0.049 9.235 448 .000 .76687 .08304 .60368 .93006
Equal
variances
not
assumed
9.166 413.026 .000 .76687 .08367 .60240 .93134
Independent Samples Test
95% Confidence
Interval of the Difference
Levene's Test for
Equality of Variances t-test for Equality of Means





9.3. t-test razlike izmeu aritmetikih sredina dva velika zavisna
uzorka

Ako se eksperiment izvodi po metodu jedne grupe (jednog uzorka) gde je
istovremeno grupa i kontrolna i eksperimentalna, onda se vrednosti ispitivanog obeleja
mere i izraunavaju parametri pre delovanja eksperimentalnog faktora. To je tzv. nulta
faza merenja. Zatim se grupa podvrgava eksperimentalnom faktoru i po zavretku
eksperimenta mere se vrednosti istog obeleja i izraunavaju parametri. U postupku se
dalje testira razlika izmeu parametara pre i nakon delovanja eksperimentalnog faktora.
Meutim, u proceduri ne moe da se kod iste osobe (kod istog objekta) iskljui
zavisnost vrednosti koje nastaju pri dejstvu eksperimentalnog faktora od poetnih
vrednosti. Izmeu ovih vrednosti postoji izvestan stepen korelacije, pa se u formulu za
izraunavanje t testa uvodi i faktor korelacije tj. vrednost koeficijenta linearne
korelacije, kao relativne mere stepena korelacije.
Vrednost t testa kod dva velika zavisna uzorka zavisi i od vrednosti koeficijenta
linearne korelacije, pa obrazac ima izraz:



Nain izraunavanja u SPSS-u e biti prikazan kod t-testa razlike izmeu
aritmetikih sredina dva mala zavisna uzorka, a raunarski postupak je istovetan.







112

9.4. t-test razlike izmeu aritmetikih sredina dva mala
nezavisna uzorka

Koristi se za testiranje znaajnosti razlike aritmetikih sredina dva mala
nezavisna uzorka, ije se aritmetike sredine osnovnog skupa rasporeuju u vidu
Studentovog t rasporeda.
Njegova formula je:
( ) ( )
2 1
2 1
2 1
2
2 2
2
1 1
2 1
2
1 1
n n
n n
n n
SD n SD n
x x
t

+
+
+

=

Data formula za t-test moe se primeniti i za testiranje razlike aritmetikih
sredina dva velika nezavisna uzorka, ali ne i obrnuto.
Pri tumaenju realizovane t-vrednosti obavezna je primena i Studentovih
tablica t-rasporeda

Stepen slobode se odreuje po formuli: S.S = n
1
+ n
2
2.

Ako je:
- t-realizovano < t
(SS i 0,05)
, prihvata se Ho, a odbacuje Ha, p>0,05,
- t-realizovano > t
(SS i 0,05)
,odbacuje se Ho, a prihvata Ha, p< 0,05,
- t-realizovano > t
(SS i 0,01)
, odbacuje se Ho, a prihvata Ha i za nivo p< 0,01.

Primer: Izmeren je radijalni puls kod dve grupe od po 10 pacijenata. Jedna
grupa je imala ugraen pejsmeker, a druga nije imala. Dobijene su sledee vrednosti:

Sa pejsmejkerom Bez pejsmejkera
N
1
X
2
1
X
2
X
2
2
X
1 60 3600 67 4489
2 68 4624 72 5184
3 70 4900 72 5184
4 78 6084 84 7056
5 66 4356 69 4761
6 71 5041 80 6400
7 62 3844 68 4624
8 73 5329 74 5476
9 69 4761 78 6084
10 72 5184 81 6561
689 47723 745 55819

Da li postoji statistiki signifikantna razlika izmeu proseka radijalnog pulsa
kod ove grupe pacijenata?

113
Moraju se izraunati aritmetike sredine i standardne devijacije za obe grupe,
prema ve poznatim obrascima:

9 , 68
10
689
1
1
1 = = =

n
X
X 5 , 74
10
745
2
2
2 = = =

n
X
X

01 , 5 9 , 68
10
47723
2
2
1
1
2
1
1
= = =

X
n
X
SD

63 , 5 5 , 74
10
55819
2
2
2
1
2
2
2
= = =

X
n
X
SD

Sada se moe pristupiti testiranju hipoteza:
Ho: 74,5 - 68,9 = 5,6 nije statistiki znaajna razlika;
Ha: 74,5 - 68,9 = 5,6 statisticki je znaajna razlika i posledica je ugradnje
pejsmejkera.
( ) ( )
35 , 2
38 , 2
6 , 5
100
20
18
63 , 5 9 01 , 5 9
6 , 5
2
1 1
2 2
2 1
2 1
2 1
2
2 2
2
1 1
2 1
= =

+
=

+
+
+

=
n n
n n
n n
SD n SD n
x x
t


SS = n1 + n2 -2 = 10 + 10 - 2 = 18


114
Za SS = 18 i za p = 0,05 granina tablina vrednost je t = 2,10

t = 2,35 > t
(18 i 0,05)
= 2,10 i p < 0,05

Kako je realizovana t-vrednost od 2,35 vea od granine tabline
vrednosti t=2,10, za broj stepeni slobode 18 i prag znaajnosti od p=0,05, to
odbacujemo nultu hipotezu i prihvatamo alternativnu sa grekom p<0,05 i
sigurnou od P>95% tvrdimo: razlika od 5,6 izmeu prosenog radijalnog
pulsa pacijenata sa i bez pejs mejkera je statistiki znaajna.

t = 2,35 < t
(18 i 0,01)
= 2,88 i p > 0,01

Realizovana t-vrednost od 2,35 manja je od granine tabline vrednosti
t=2,88, za broj stepeni slobode 18 i prag znaajnosti od p=0,01, tako da ne
moemo tvrditi i sa sigurnou veom i od 99% da je razlika signifikantna.

U SPSS-u se t test razlike izmeu aritmetikih sredina dva mala nezavisna
uzorka radi kao i t test za dva velika nezavisna uzorka.


9.5. t-test razlike izmeu aritmetikih sredina dva mala zavisna
uzorka

Da bi se izbeglo izraunavanje koeficijenta linearne korelacije, kod dva mala
zavisna uzorka primenjuje se posebna tehnika izraunavanja, poznata kao t-test
diferencije.
Princip "diferencije" sastoji se u tome da se niz individualnih razlika, tretira kao
poseban uzorak, za koga se izraunava e diferencij X , SD
diferencije
i SG
diferencije
.
Vrednost t-testa se dobija, kao kolinik aritmetike sredine diferencije
( e diferencij X ) i standardne greke diferencije (SG
diferencije
) pa je njegova formula:




Pri tumaenju realizovane t-vrednosti obavezna je primena i Studentovih
tablica t-rasporeda.
Stepen slobode se odreuje po formuli: S.S = n

- 1.

Primer: Izmeren je sistolni pritisak u mmHg kod 11 fudbalera, neposredno pre i
neposredno posle odigrane utakmice. Dobijene su sledee vrednosti:

fudbaler 1 2 3 4 5 6 7 8 9 10 11
Pre 128 132 138 120 140 135 135 140 145 135 148
Posle 137 135 136 130 148 140 140 140 150 134 150

dif
dif
SG
t
x
=
115
Da li postoji statistiki znaajna razlika u sistolnom krvnom pritisku fudbalera
pre i posle utakmice?

Ho: Ne postoji signifikantna razlika u sistolnom pritisku fudbalskog tima pre i
posle utakmice
Ha: Postoji signifikantna razlika u sistolnom pritisku fudbalskog tima pre i
posle utakmice

Da bi izraunali t-vrednost neophodno je formirati sledeu radnu tabelu:

Sistolni pritisak
Fudbaler
pre (
1
X ) posle (
2
X )
1 2
X X
( ) dif X X X d =
1 2

2
d
1 128 137 9 5 4 9 = 25
2 132 135 3 1 4 3 = 1
3 138 136 -2 6 4 2 = 36
4 120 130 10 6 4 10 = 36
5 140 148 8 4 4 8 = 16
6 135 140 5 1 4 5 = 1
7 135 140 5 1 4 5 = 1
8 140 140 0 4 4 0 = 16
9 145 150 5 1 4 5 = 1
10 135 134 -1 5 4 1 = 25
11 148 150 2 2 4 2 = 4
44 0 162

44
4
11
dif X = =

( )
4
11
44
1 2
= =

=

n
X X
X dif mmHg predstavlja prosenu promenu vrednosti
pritiska po jednom fudbaleru, u ovom sluaju to je poveanje.

( ) | |
84 , 3
11
162
2
2
1 2
= = =

=

n
d
n
X X X
SD
dif
dif


3,84 3,84
1,16
3, 32
11
dif
dif
SD
SG
n
= = = =

4
3, 45
1,16
dif
dif
X
t
SG
= = =

S.S.=n-1=11-1=10

116
t = 3,45 > t
(10 i 0,05)
= 2,23 i p < 0,05
t = 3,45 > t
(10 i 0,01)
= 3,17 i p < 0,01

Kako je realizovana t-vrednost od 3,45 vea od granine tabline vrednosti
t=2,23 za broj stepeni slobode 10 i prag znaajnosti od p=0,05, ali i od granine tabline
vrednosti t=3,17 za prag znaajnosti od p=0,01 to odbacujemo nultu i prihvatamo
alternativnu hipotezu i sa grekom procene manjom od 1% (p<0,01), odnosno sa
verovatnoom veom od 99% (P>99%) tvrdimo da postoji signifikantna razlika u
sistolnom pritisku fudbalskog tima pre i posle utakmice.

U SPSS-u se testiranje razlike izmeu aritmetikih sredina zavisnih uzoraka
vri na sledei nain:
Da bi se aktivirao t test za zavisne uzorke treba otii u Analyse/Compare
Means/Paired-Samples T Test.



U radnom prozoru se obelei varijabla sa vrednostima pre eksperimenta, tj.
varijabla pre i njeno ime se pojavljuje u Current Selection na mesto prve varijable
(Variable 1). Zatim se klikne na varijablu posle i njen naziv se pojavljuje na mestu
druge varijable (Variable 2).





117

Tako uparene vrednosti pre i posle eksperimenta se prebace u Paired Variables.



Klikne se na OK i u Output-u dobijaju tri tabele sa rezultatima:

Mean N Std. Deviation
Std. Error
Mean
Pair 1 pre 136.0000 11 7.74597 2.33550
posle 140.0000 11 6.70820 2.02260
N Correlation Sig.
Pair 1 pre & posle 11 .854 .001
Mean Std. Deviation
Std. Error
Mean Lower Upper t df Sig. (2-tailed)
Pair 1 pre - posle -4.00000 4.02492 1.21356 -6.70398 -1.29602 -3.296 10 .008
Paired Samples Statistics
Paired Differences
95% Confidence
Interval of the Difference
Paired Samples Test
Paired Samples Correlations


U prvoj ispisnoj tabeli su prikazane vrednosti aritmetikih sredina po
merenjima (136:140), broj parova vrednosti (11), standardne devijacije (7,75:6,71) i
standardne greke aritmetikih sredina (2,33:2,02).
U drugoj tabeli je dat koeficijent korelacije izmeu vrednosti koje su izmerene
u dva merenja. Vrednost koeficijenta od 0,854 i p=0,001 ukazuju na veoma visok nivo
korelacije izmeu vrednosti u razliitim situacijama kod istih ispitanica.
t-vrednost od 3,296 i p-vrednost od 0,001 (p<0,01), koje vidimo u treoj tabeli,
pokazuju da je razlika srednjih vrednosti izmeu dva merenja koja iznosi 4,004,02
statistiki znaajna. Granice 95% IP od 6,704 i 1,296 pokazuju kolika bi bila stvarna
razlika kada bi svi ovakvi sluajevi u populaciji bili testirani.




118
9.6. t-test proporcije

Na istim principima na kojima se testira i ocenjuje razlika izmeu dve aritmetike
sredine moe da se oceni i znaajnost razlike izmeu dve proporcije.
Proporcije moguih jednakih uzoraka dobijenih iz istog osnovnog skupa, rasporeuju
se u vidu binomnog rasporeda oko prave proporcije skupa. Kada su uzorci vei od 30 jedinica
i kada je verovatnoa "povoljnog" dogaaja blizu vrednosti od 0,5 mogu da se koriste tablice
normalnog rasporeda.
Za distribuciju proporcija uzoraka, kao i za aritmetike sredine uzoraka, moe da se
izrauna standardna greka proporcije, koja pokazuje koliko je proporcija nekog uzorka
udaljena od prave proporcije osnovnog skupa, odnosno to je vanije - koliko je prava
proporcija osnovnog skupa udaljena od proporcije uzorka.
Ako je uzorak dovoljno veliki (n>30, neki smatraju i n>100), obrazac za standardnu
greku proporcije je:

n
q p
SG
p

= ili
( )
n
p p
SG
p

=
1


gde je: n - veliina uzorka, a p i q - proporcije dihotomnih modaliteta, odnosno p je
relativno (proporcionalno) uee posmatranog modaliteta u uzorku.

Standardnu greku razlike proporcija dva uzorka, izraunavamo kao koren iz
zbira kvadrata greaka proporcija:

2
2 2
1
1 1
2 1
n
q p
n
q p
SG
p p

+

ili
( ) ( )
2
2 2
1
1 1
1 1
2 1
n
p p
n
p p
SG
p p

+

=



Da bi se pokazala statistika znaajnost razlike proporcija dva uzorka (p
1
- p
2
) i
odbacila nulta hipoteza kod proporcija, ta razlika mora da bude odgovarajui broj puta
vea od njene standardne greke pa je obrazac za t-test razlike proporcija dva velika
nezavisna uzorka:
2
2 2
1
1 1
2 1
n
q p
n
q p
p p
t


=

Zakljuak se donosi na sledei nain:
- t-realizovano < t = 1,96, prihvata se Ho a odbacuje Ha, p>0,05,
- t-realizovano > t = 1,96 ,odbacuje se Ho a prihvata Ha, p < 0,05,
- t-realizovano > t = 2,58, odbacuje se Ho a prihvata Ha i za nivo p < 0,01.

Primer: U grupi od 150 mukaraca od hipertenzije je obolelo 45, a u grupi od
200 ena iste starosne dobi od hipertenzije je bolovalo 70. Da li postoji statistiki
znaajna razlika meu polovima po zastupljenosti hipertenzije?
H0: Ne postoji signifikantna razlika izmeu zastupljenosti hipertenzije kod
mukaraca i ena
119
Ha: Postoji signifikantna razlika izmeu zastupljenosti hipertenzije kod
mukaraca i ena

U postupku najpre izraunavamo proporcije za oba uzorka:

3 , 0
150
45
1
= = p ; 7 , 0 1
1 1
= = p q
35 , 0
200
70
2
= = p ; 65 , 0 1
2 2
= = p q

Diferencija = p
2
p
1
= 0,35 0,3 = 0,05 ili 5%

Iz dobijenih vrednosti sledi:

t = 0,99 < t = 1,96 i p > 0,05

Kako je dobijena vrednost t=0,99 manja od 1,96, ne postoji statistiki znaajna
razlika izmeu zastupljenosti hipertenzije kod mukaraca i ena. Nulta hipoteza nije
odbaena jer je p>0,05.

Kod t testa razlike proporcija dva velika zavisna uzorka u obrazac se uvodi
korektivni faktor zbog korelacije meu posmatranim modalitetima, pa formula glasi:

2
2 2
1
1 1
12
2
2 2
1
1 1
2 1
2
1 1 n
q p
n
q p
r
n
q p
n
q p
p p
t


=

Na ilustraciji t testa razlike izmeu proporcija dva mala uzorka neemo se
zadravati, jer se u praksi znatno vie upotrebljava neparametrijski _
2
test.

















120
Zadaci za vebanje

1. U porodilitu u Niu je izmereno 70 novoroenadi i dobijene su sledee
vrednosti: g X 3450 = , SD=280g. Na osnovu raznih istraivanja, postavljena je
hipoteza da prosena teina novoroenadi u Niu iznosi g X 3400 = . Da li se
izmerena telesna teina 70 novoroenadi razlikuje od poznatog proseka za ceo grad?

2. Izvreno je merenje telesne visine deaka treeg razreda dve osnovne kole u
Niu i dobijeni su sledei rezultati:
kola A n=290 3 , 138 = X SD = 6,3
kola B n=320 1 , 141 = X SD = 7,2
Da li se prosene telesne visine deaka dve kole znaajno razlikuju?

3. Merena je prosena vrednost sistolnog krvnog pritiska nakon maksimalnog
tranja deonice od 100m. U istraivanju je uestvovalo 80 ena i 100 mukaraca.
Prosena vrednost sistolnog pritiska (u mmHg) za ene nakon optereenja je iznosila
15515, a kod mukaraca 14017. Da li postoji signifikantna razlika izmeu prosenog
sistolnog pritiska mukaraca i ena?

4. Odreivan je hemoglobin periferne krvi zdravih ispitanika i dobijene su sledee
vrednosti od: 88 = X i SD = 2,4 za 25 mukaraca i 83 = X i SD = 1,4 za 23 ene. Da
li je hemoglobin znaajno razliit u odnosu na pol?

5. Odabrana su dva uzorka od po 20 bolesnika sa povienim holesterolom u krvi.
Jedna grupa je leena dotadanjim poznatim terapijskim metodama. Po zavretku
leenja dobijene su sledee vrednosti: l mmol X / 5 , 6 = i SD = 0,7. Druga grupa
bolesnika je pored klasine terapije bila podvrgnuta i specifinoj dijeti. Posle istog
vremena leenja kao i kod prve grupe, dobijene su sledee vrednosti: 25 , 6 = X i SD =
0,6. Da li je dijeta imala uticaj na smanjenje holesterola u krvi?

6. U jednom epidemiolokom istraivanju iji je zadatak bio da se utvrde mogui
etioloki faktori za nastanak nekog oboljenja ispitivano je 100 osoba i meren nivo
hemoglobina pre i nakon izlaganja faktorima i dobijene su sledee vrednosti:
5 , 15 = pre X , 2 , 3 =
pre
SD , 1 , 20 = posle X , 8 , 3 =
posle
SD , a koeficijent proste linearne
korelacije iznosio je 0,82. Da li postoji signifikantna razlika izmeu prosene visine
hemoglobina ispitanika pre i nakon izlaganja faktorima rizika?

7. Izmerene su vrednosti albumina (g/l) 12 ispitanika pre i posle tretmana i
dobijene su sledee vrednosti:
Ispitanici 1 2 3 4 5 6 7 8 9 10 11 12
Pre 58 52 53 46 58 49 46 53 51 57 48 45
Posle 57 62 51 49 68 65 54 59 44 66 64 45
Da li je dolo do znaajnog snienja albumina posle tretmana?

121
10. NEPARAMETRIJSKI TESTOVI


Neparametrijski testovi se koriste kod atributivnih obeleja, a kod numerikih
obeleja se koriste kod malih uzoraka koji nemaju normalan raspored. Tada se varijable
ne tretiraju kao brojevi sa kojima su mogue matematike operacije, ve kao rangirani
niz.
Neparametrijski testovi testiraju razliku izmeu frekvencija ili rangova
vrednosti unutar skupa.
Prednost u odnosu na parametrijske testove je ta to se mogu koristiti i kod
malih uzoraka koji nemaju normalan raspored, a nedostatak to imaju manju snagu pri
zakljuivanju.


10.1. Hi kvadrat (_
2
) test

To je jedan od najpoznatijih neparametrijskih testova. Poznat je i pod nazivom
Pearson-ov
2
test, jer ga je razradio K. Pearson 1900. godine.
Ovim testom se proverava da li postoji statistiki znaajna razlika izmeu
dobijenih i oekivanih frekvencija pojedinih kategorija nekog opisnog obeleja u
jednom ili dva osnovna skupa ili uzorka.
Dobijene frekvencije su frekvencije dobijene empirijskim istraivanjem ili
eksperimentom.
Oekivane frekvencije su teorijskog karaktera ili oekivane na osnovu hipoteze
koju elimo da proverimo.

Izraunava se po formuli:
( )
o
o d
f
f f
2
2

= _
u kojoj znak oznaava da se Hi kvadrat vrednost izraunava kao zbir
rezultata formule (f
d
-f
o
)
2
/f
o
primenjene za svaku kategoriju opisnog obeleja i to za
svaku grupu ispitanika.
Pri izradi ovog testa:
- Zbir dobijenih i oekivanih frekvencija mora uvek biti jednak
- Zbir razlike dobijenih i oekivanih frekvencija uvek je jednak nuli
Ako ova dva uslova nisu ispunjena, postoji negde greka u raunu ili problem
nema smisla, nije
2
test adekvatan za taj problem.

Vrednost
2
testa ne moe da bude negativna jer ona predstavlja sumu kvadrata.

Stepen slobode se izraunava po obrascu: S.S. = (R-1) x (K-1), gde je K - broj
kolona, a R broj redova.




122
Tumaenje dobijene vrednosti bazira se na teorijskom _
2
rasporedu:
a) Raspored je definisan u oblasti od 0 do +,
b) Kriva rasporeda nije simetrina, meutim, s poveanjem broja modaliteta
posmatranog obeleja (sa poveanjem broja stepena slobode)
2
raspored se pribliava
normalnom rasporedu,
c) Za svaki broj stepeni slobode postoji i odreen
2
raspored i kritine oblasti
prihvatanja ili odbacivanja nulte hipoteze.


S.S.=3
S.S.=4

S.S.=5
S.S.=6



_
2


0 +


Tumaenje realizovane vrednosti _
2
testa vri se na osnovu tablica kritinih
vrednosti _
2
distribucije.
Tri su najvanija uslova za primenu _
2
kvadrat testa:
1. _
2
test se izraunava iskljuivo iz apsolutnih frekvencija, ili iz podataka ako
mogu da se svedu na apsolutne frekvencije;
2. Nijedna od apsolutnih frekvencija ne sme da ima vrednost manju od 5
jedinica i
3. Kada su uzorci manji od 200 jedinica (n
1
+n
2
<200) primenjuje se Yates-ova
korekcija:
(1) svaka dobijena frekvencija, ako je vea od oekivane umanjuje se za 0,5,
(2) svaka dobijena frekvencija ako je manja od oekivane uveava se za 0,5.

_
2
test moe imati sledee modalitete:
1. 2 test rasporeda frekvencija
2. 2 test nezavisnosti
3. 2 test homogenosti


10.1.1.
2
test rasporeda frekvencija (test slaganja)

Ispituje razliku izmeu rasporeda dobijenih (opaenih) i oekivanih (teoretskih)
frekvencija. Dobijene (opaene) frekvence su frekvence modaliteta obeleja u uzorku
koji ispitujemo.
Oekivane (teoretske) frekvencije se mogu dobiti na vie naina:
1. na osnovu nulte hipoteze
2. na osnovu teoretske raspodele verovatnoa
3. na osnovu strune teorije ili prethodnih istraivanja.
Kao to je gore istaknuto, jedna od karakteristika neparametrijskih postupaka je
da se u njima vodi rauna o itavoj distribuciji, pa je zato jedan od osnovnih naina
123
primene
2
testa ispitivanje podudarnosti dve distribucije, tzv. testovi slaganja. Drugim
reima, ispitujemo da li su nai empirijski podaci saglasni sa nekom hipotetikom
raspodelom.

Primer: Prilikom zapoljavanja u Domu zdravlja, doktor medicine je oekivao
da e dnevno u radnim danima imati po 52 bolesnika, odnosno 260 pregleda nedeljno.
Posle prve nedelje rada broj pregledanih bolesnika bio je sledei: ponedeljak 60,
utorak 40, sreda 45, etvrtak 55 i petak 60 pregleda. Da li je lekar bio u pravu?

1. Postavljamo hipoteze:
Ho: Broj pregleda se ne razlikuje po radnim danima u nedelji
Ha: Broj pregleda se razlikuje po radnim danima u nedelji

2. Poto smo odabrali odgovarajui _
2
test, kreemo u njegovu izradu:
Dobijene frekvencije su frekvencije date u zadatku. Raspored oekivanih
frekvencija proizilazi iz tvrdnje nulte hipoteze da je broj pregleda isti u svim radnim
danima, tj. po 52 pregleda dnevno kako je izraunao lekar (260:5=52).

Radi izraunavanja konstruie se radna tabela:


dani
d
f
o
f
o d
f f
( )
2
o d
f f
( )
o
o d
f
f f
2


1. ponedeljak
2. utorak
3. sreda
4. etvrtak
5. petak
60
40
45
55
60


52
52
52
52
52


+8
-12
-7
+3
+8


64
144
49
9
64


1,23
2,77
0,94
0,17
1,23



260 260 0 -
2
=6,34
( )
34 , 6
2
2
=

=
o
o d
f
f f
_

3. Odredimo broj stepena slobode po formuli: S.S.=R-1=5-1=4

Za broj stepena slobode 4 i prag znaajnosti od 0,05 u tablicama kritinih
vrednosti _
2
distribucije oitavamo da je
2
= 9,488.

2
= 6,34 <
2
(4 i 0,05)
= 9,488 i p>0,05
Kako je realizovana
2
vrednost od 6,34 manja od granine tabline vrednosti

2
=9,488 za stepen slobode 4 i prag znaajnosti p=0,05, prihvatamo nultu i odbacujemo
alternativnu hipotezu za nivo greke p>0,05 i zakljuujemo da se broj pregleda ne
124
razlikuje po radnim danima u nedelji, tj. da je doktor medicine pravilno procenio
prosean broj pregleda po radnom danu.

U SPSS-u zadatak se radi na sledei nain:

Podatke u SPSS obrazac unosimo tako to emo brojevima ifrirati dane:
ponedeljak brojem 1, utorak - 2, sreda 3, etvrtak 4 i petak - 5. Brojke su nam
potrebne jer SPSS nee obraditi podatke oznaene slovima ili reima.

Da bi se aktivirao
2
test rasporeda frekvencija treba otvoriti Analyse /
Nonparametric tests i u desnom grananju izabere se Chi-Square.




U radnom prozoru koji se otvara, iz liste sa leve strane odabere se varijabla
dani i prebaci strelicom na Test Variable List, a zatim se odabere Options i oznai
Descriptive.


125


Klikne se na Continue i OK i u Output-u se dobiju rezultati.

Observed N Expected N Residual
1.00 60 52.0 8.0
2.00 40 52.1 -12.0
3.00 45 52.2 -7.0
4.00 55 52.3 3.0
5.00 60 52.4 8.0
Total 260
dani
Chi-Square
a
6.346
df 4
Asymp. Sig. .175
dani
Test Statistics
a. 0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 52.0


U prvoj tabeli su dobijene (Observed N) i oekivane frekvencije (Expected N),
a u drugoj vrednost testa (Chi Square) koja je za ovaj primer _
2
=6,346 i p (Asymp.
Sig.) koje je p=0,175.


10.1.2.
2
test nezavisnosti

Hi kvadrat test nezavisnosti ispituje da li postoji povezanost (asocijacija)
izmeu modaliteta dva kategorijska obeleja kod ispitanika u jednom skupu ili uzorku.
Neka atributivna obeleja po svojoj prirodi mogu da imaju samo dve kategorije
(modaliteta), koje iskljuuju jedna drugu i za ovakva obeleja kaemo da su dihotomna.
Tipian primer za ovakvo obeleje je pol, koje ima modalitete: muki i enski. S druge
strane, mnoga atributivna obeleja, bez obzira na broj modaliteta, mogu da se
posmatraju dihotomno, odnosno da se klasifikuju u dva modaliteta suprotnog znaenja.
Na primer, prema konzumiranju alkohola sve ljude moemo podeliti na mnogo
kategorija: piju estoka pia, piju vino, piju pivo, piju svakodnevno, piju povremeno, ne
piju... Ali ovo obeleje moemo posmatrati i kao dihotomno: piju i ne piju.
Praktino ceo skup, odnosno uzorak moe da se podeli na dva dela: na grupu
jedinica koje imaju i grupu jedinica koje nemaju odreenu kategoriju nekog
obeleja.
126
Ukoliko ispitanike iz jednog skupa ili uzorka podelimo na osnovu
zastupljenosti pojedinih modaliteta dva dihotomna obeleja, na primer eksponirani
neeksponirani i oboleli nisu oboleli, onda dobijamo odnos kao na emi:








Navedeni odnosi dva obeleja jednog uzorka, sa po dva modaliteta, prikazuju
se tabelom kontigencije 2x2, u dva reda i dve kolone. Koji modaliteti se prikazuju u
redovima, a koji u kolonama, zavisi od metoda i naina ispitivanja i studije.

Observacione ili retrospektivne studije su one u kojima se polazi od bolesti
(posledice) pa ide prema ekspoziciji (uzroku bolesti). Kod ovih studija tabela
kontigencije 2x2 ima sledei opti oblik:

stanje zdravlja rizik faktor
(ekspozicija) oboleli zdravi
ukupno
eksponirani a b a+b
neeksponirani c d c+d
ukupno a+c b+d a+b+c+d=N

Radna hipoteza: Eksponiranost je vea kod obolelih nego kod zdravih, odnosno
frekvencija eksponiranih i obolelih (a) je znaajno vea od frekvencije eksponiranih, a
zdravih (b).

Prospektivne studije polaze od uzroka (faktora rizika) pa idu prema posledici
(bolesti). Kod ovih studija tabela kontigencije ima oblik:

uzrok - ekspozicija
stanje zdravlja
eksponirani neeksponirani
ukupno
oboleli a b a+b
nisu oboleli c d c+d
ukupno a+c b+d a+b+c+d=N

Radna hipoteza: Prevalenca oboljenja je vea kod eksponiranih nego kod
neeksponiranih, odnosno frekvencija obolelih-eksponiranih (a) je znaajno vea od
frekvencije obolelih- neeksponiranih (b).

Odgovore na pitanja kod obe studije daje nam
2
test. U stvari
2
test daje
odgovor na pitanje da li postoji asocijacija izmeu ekspozicije (rizik faktora) i nekog
oboljenja.
Primer: Da li postoji veza izmeu puenja i raka plua? Od 500 sluajno
izabranih pacijenata, 85 je imalo karcinom plua, a od ovih 75 su bili puai. Kod 415
pacijenata bez karcinoma plua, bilo je 150 puaa.
127

Ho: Izmeu puenja i raka plua ne postoji povezanost
Ha: Izmeu puenja i raka plua postoji povezanost

Podatke predstavimo u vidu tabele kontigencije 2x2:

puenje Ca plua zdravi ukupno
da 75 a 150 b 225 (a+b)
ne 10 c 265 d 275 (c+d)
ukupno 85 (a+c) 415 (b+d) 500 N

Dobijene frekvencije su ve date u zadatku: za puae obolele od Ca plua (a),
zdrave puae (b), nepuae obolele od Ca plua (c) i zdrave nepuae (d).
Oekivane frekvencije se raunaju tako to se proizvod ukupnog zbira kolona i
ukupnog zbira reda deli sa ukupnom veliinom uzorka (N):
N
R K
fo

= ili
o
f =
d c b a
b a c a
+ + +
+ + ) ( ) (


gde je K kolona, R red, a N veliina uzorka.

fo
puai sa Ca plua (a)
= 25 , 38
500
225 85
=


fo
puai bez Ca plua (b)
= 75 , 186
500
225 415
=


fo
nepuai sa Ca plua (c)
= 75 , 46
500
275 85
=


fo
nepuai bez Ca plua (d)
= 25 , 228
500
275 415
=



Kada smo izraunali oekivane frekvence, pristupimo izraunavanju vrednosti
2
testa:


obeleje
d
f
o
f
o d
f f
( )
2
o d
f f
( )
o
o d
f
f f
2


puai sa Ca plua
puai bez Ca plua
nepuai sa Ca plua
nepuai bez Ca plua
75
150
10
265
38,25
186,75
46,75
228,25
36,75
-36,75
-36,75
36,75
1350,56
1350,56
1350,56
1350,56
35,31
7,23
28,89
5,92
500 500 0
2
=77,35

Stepen slobode se odreuje po formuli: S.S. = (K-1)x(R-1).
Kod tabele kontigencije 2x2, broj stepena slobode jednak je 1 jer je:
(2-1)x(2-1) = 1.
128
Za stepen slobode 1 i p = 0,05 u tablici
2
rasporeda oitavamo graninu
tablinu vrednost
2
= 3,841.

2
= 77,35>
2
(1 i 0,05)
= 3,841 i p<0,05
Kako je realizovana
2
vrednost od 77,35 vea od granine tabline vrednosti,

2
=3,841, za stepen slobode 1 i prag znaajnosti p=0,05, odbacujemo nultu i prihvatamo
alternativnu hipotezu sa grekom p<0,05 i sigurnou P>95% i zakljuujemo da postoji
povezanost izmeu puenja (kao rizik faktora) i raka plua.
Prihvatili smo alternativnu hipotezu, koja u optem smislu znai: izmeu
obeleja postoji statistiki znaajna veza. To nam potvruje realizovana _
2
vrednost
koja je vea od teorijske, tj. tabline. Meutim, realizovana vrednost _
2
ne daje
informaciju koliki je stepen intenziteta te asocijacije.
Ta informacija dobija se na osnovu koeficijenta kontigencije.
(Napomena : odreivanje koeficijenta kontigencije ima smisla samo ako na osnovu Hi -
kvadrat testa odbacimo nultu hipotezu).
Koeficijent kontigencije izraunava se iz sledeeg obrasca:

37 , 0
35 , 77 500
35 , 77
2
2
=
+
=
+
=
_
_
N
C

Potrebno je utvrditi da li je vrednost koeficijenta kontigencije blia maksimumu
ili nuli.
Za tabelu kontigencije 2x2, maksimalna vrednost koeficijenta se dobija po
formuli:
R
R
C
1
max

= ili
K
K 1

707 , 0 5 , 0
2
1 2
max
= =

= C
gde je R broj redova, a K broj kolona.
to je dobijena vrednost koeficijenta kontigencije blia vrednosti od 0,707 to je
veza intenzivnija i jaa.
Dobijena vrednost je blia maksimalnoj vrednosti C=0,707, nego nuli (0,707-
0,37=0,337): C=0,37>0,337 pa moemo da tvrdimo da postoji dosta visok stepen
korelacije ili asocijacije izmeu puenja i raka plua.

U SPSS-u to izgleda ovako:
Biramo: Analyse / Descriptive Statistics / Crosstabs.


129

U radnom prozoru u polje redovi (Row(s)) iz liste sa leve strane prebacimo
dihotomnu varijablu puenje. U polje kolone (Column(s)) prebacimo drugu
dihotomnu varijabla Ca. Kliknemo na Statistics i u novom radnom prozoru oznaimo
Chi-Square.






Kliknemo na Continue i OK. U ispisu se dobiju rezultati:

130
N Percent N Percent N Percent
pusenje * Ca 500 100.0% 0 .0% 500 100.0%
Count
da ne Total
pusenje da 75 150 225
ne 10 265 275
Total 85 415 500
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Pearson Chi-Square 77.347
b
1 .000
Continuity Correction
a
75.256 1 .000
Likelihood Ratio 83.539 1 .000
Fisher's Exact Test .000 .000
N of Valid Cases 500
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 38.
25.
Ca
pusenje * Ca Crosstabulation
Chi-Square Tests
Cases
Valid Missing Total
Case Processing Summary


Druga tabela je tabela kontigencije 2x2 sa ukrtenim modalitetima obeleja. U
treoj tabeli u redu Pearson Chi-Square su vrednosti _
2
testa Value koja iznosi 77,347
i p - Asymp. Sig. (2-sided) za koje je u tabeli Output-a SPSS-a izbacio vrednost 0,000.
U tom sluaju u rezultatima se pie da je p<0,001.


10.1.3. _
2
test homogenosti

Ovaj test utvruje da li ispitivani nezavisni uzorci pripadaju istom ili su uzeti iz
razliitih skupova.
Kod testa homogenosti postupak izraunavanja je isti, ali on nije identian sa
testom nezavisnosti. Testom nezavisnosti istraujemo razliku izmeu frekvencija
modaliteta dva obeleja u jednom uzorku ili jednom skupu, a testom homogenosti
ispitujemo da li frekvencije pojedinih modaliteta jednog kategorijskog obeleja imaju
identinu (homogenu) distribuciju kod vie nezavisnih uzoraka izvuenih iz razliitih
skupova.

Primer: Sluajno su odabrani uzorci od po 800 bolesnika operisanih u Niu i
Beogradu. Broj postoperativnih komplikacija bio je sledei:

Tabela kontigencije postoperativnih komplikacija u Niu i Beogradu

komplikacije Ni Beograd ukupno
ne 762 760 1522
da 38 40 78
ukupno 800 800 1600
131
Zadatak je da se za nivo znaajnosti p=0,05 oceni da li hirurzi u Niu i
Beogradu imaju bitno razliit broj postoperativnih komplikacija.
Ho: Ne postoji statistiki znaajna razlika u broju postoperativnih komplikacija
bolesnika operisanih u Niu i Beogradu, tj. uzorci se ponaaju kao da pripadaju istom
osnovnom skupu.
Ha: Postoji statistiki znaajna razlika u broju postoperativnih komplikacija
bolesnika operisanih u Niu i Beogradu, tj. uzorci se ponaaju kao da pripadaju
razliitim skupovima.

Oekivane frekvencije izraunavamo prema ve poznatoj metodologiji:

fo
a
= 761
1600
1522 800
=


fo
b
= 761
1600
1522 800
=


fo
c
= 39
1600
78 800
=


fo
d
= 39
1600
78 800
=



Sada moemo pristupiti izraunavanju pojedinih vrednosti neophodnih za
izraunavanje _
2
testa.

Dobijene i oekivane frekvencije

Ni Beograd
Komplikacije
fd fo fd fo
ne 762 761 760 761
da 38 39 40 39
ukupno 800 800 800 800

Iz podataka tabele sledi:
( ) ( ) ( ) ( ) ( )
=

39
39 40
761
761 760
39
39 38
761
761 762
2 2 2 2 2
2
o
o d
f
f f
_
0,055

S.S. = (R-1)x(K-1) = (2-1)x(2-1) = 1 x 1 = 1

2
= 0,055 <
2
(1 i 0,05)
= 3,841 i p>0,05

Kako je realizovana, tj. osnovna
2
vrednost od 0,055 manja od granine
tabline vrednosti,
2
=3,841, za broj stepeni slobode 1 i prag znaajnosti od p=0,05,
prihvatamo nultu i odbacujemo alternativnu hipotezu i zakljuujemo da ne postoji
statistiki znaajna razlika u broju postoperativnih komplikacija kod bolesnika
operisanih u Niu i Beogradu, tj. uzorci se ponaaju kao da pripadaju istom osnovnom
skupu.
132
10.2. Mantel - Haenzel-ov _
2
test

Dva autora, Mantel i Haenzel, razradili su tehniku izraunavanja _
2
testa
direktno iz izvornih podataka tabele kontigencije 2x2. Njegova primena se preporuuje
se kod uzoraka manjih od 200 jedinica. Prednost primene ovog naina izraunavanja je
u tome to razraena formula automatski obuhvata i Yates-ovu korekciju.
Za primer u kome je utvrivano da li postoji veza izmeu puenja i raka plua
izraunali bi smo ga na sledei nain:

| |
( ) ( ) ( ) ( )
26 , 75
5 , 0
2
2
=
+ + + +

=
d b c a d c b a
N N c b d a
_

Dobijena je neto manja vrednost (dobijeni _
2
test bez korekcije je bio 77,35)
jer pri prvom metodu izraunavanja na osnovu razlika dobijenih i oekivanih
frekvencija nije bila ukljuena Yates-ova korekcija.


10.3. Fisher-ov test tane verovatnoe

Fisherov test se primenjuje kod tabela kontigencije 2x2, kod nezavisnih
uzoraka kada se vrednosti obeleja mogu da prikau dihotomno tj. kada i ekspoziciju
(uzrok) i bolest ili neko drugo stanje (posledicu) moemo da prikaemo sa da i ne.
Prednost ovog testa ogleda se u tome to on moe da se primeni i kada je u pojedinim
elijama frekvencija manja od 5 jedinica ili jednaka nuli. O tome vodi rauna
aplikacija statistikog programa.
Izraunava se direktno p vrednost za procenu verovatnoe greke tvrdnje da
izmeu frekvencija ima razlike, prema formuli:

( ) ( ) ( ) ( )
( )! ! ! ! !
! ! ! !
N d c b a
d b c a d c b a
p

+ + + +
=

Na taj nain, za razliku od _
2
testa gde prvo raunamo vrednost _
2
pa na osnovu
nje za odreen broj stepena slobode i granine vrednosti utvrujemo koliko je p, kod
Fierovog testa nema svih tih koraka u izraunavanju, ve se odmah dobije kolika je
vrednost p. Ukoliko je:
- p>0,05, prihvatamo nultu i odbacujemo alternativnu hipotezu,
- ps0,05, odbacujemo nultu i prihvatamo alternativnu hipotezu.
Primer: Od 8 onkolokih bolenika, 4 je leeno jednom, a 4 drugom vrstom
terapije. Od 4 bolesnika leenih terapijom A umro je 1 bolesnik, a od 4 bolesnika
leenih terapijom B umrla su 2 bolesnika. Da li postoji signifikantna razlika u ishodu
lenja izmeu ove dve terapije?





133
Prvo pravimo tabelu kontigencije:

terapija preiveli umrli ukupno
A 3 1 4
B 2 2 4
ukupno 5 3 8

Zatim postavljamo hipoteze:
Ho: Nije postojala signifikantna povezanost izmeu vrste terapije i ishoda
leenja.
Ha: Postojala je signifikantna povezanost izmeu vrste terapije i ishoda leenja.

Na kraju, izraunavamo p vrednost primenom formule:
! 8 ! 2 ! 2 ! 1 ! 3
)! 2 1 ( )! 2 3 ( )! 2 2 ( )! 1 3 (

+ + + +
= p =0,107

Kako je p=0,107 vee od 0,05, prihvatamo nultu i odbacujemo alternativnu
hipotezu i zakljuujemo da nije postojala signifikantna povezanost izmeu vrste terapije
i ishoda leenja.
Fisher-v test tane verovatnoe je prvobitno osmiljen za 2x2 tabelu i korien
je samo kada su oekivane uestalosti bile male. To je zato to su za vee brojeve i vee
tabele prorauni bili nepraktini. Sa raunarima stvari su se promenile i Fisher-ov test
tane verovatnoe moe da se uradi za bilo koju 2x2 tabelu. Neki programi e takoe
izraunati Fisher-ov test tane verovatnoe za vee tabele, dok se broj redova i kolona
poveava, broj moguih tabela raste vrlo brzo i postaje neizvodljivo da se izrauna i
sauva verovatnoa za svaku od njih. Postoje specijalni programi kao to je StatExact
koji prave sluajni uzorak moguih tabela i koriste ih za procenu raspodele
verovatnoa. Metode koje uzorkuju mogunosti na ovaj nain zovu se Monte Carlo
metode.
Bilo je mnogo sporova izmeu statistiara o validnosti testa tane verovatnoe i
korekciji kontinuiteta koji ga aproksimira. Problem je i dalje nereen, a diskusija o
ovom problemu je van domaaja ove knjige. Za neke sluajeve Fisher-ov test tane
verovatnoe i Yates-ova korekcija mogu biti konzervativni, odnosno dati veu
verovatnou nego to bi trebalo, mada je ovo stvar rasprave. Stav autora ove knjige je
da Yates-ovu korekciju i Fisher-ov test tane verovatnoe treba koristiti.


10.4. Mc Nemar-ov test

Mc Nemar-ov test je u stvari _
2
test za dva zavisna uzorka. Njime se utvruje
da li postoji povezanost izmeu dihotomnih obeleja dva zavisna uzorka.
Zavisnost podrazumeva bilo iste jedinice posmatranja u dva vremena (pre i
posle nekog tretmana) ili iste jedinice posmatranja podvrgnute dejstvu dva razliita
tretmana. Obeleja tablice kontigencije su prvo i drugo vreme ili prvi i drugi tretman.
Podaci koji se posmatraju mogu biti i parametrijski, ali heterogeni.
Primenjuje se na tablice kontigencije 2x2 koja se odnosi na zavisne uzorke.
Ishodi u tablici su specifino organizovani:
134

prvo testiranje
drugo testiranje
pozitivno negativno
ukupno
pozitivno a b a+b
negativno c d c+d
ukupno a+c b+d N=a+b+c+d

Ivini zbirovi nisu bitni za Mc Nemar test. U izraunavanju se koriste one
uestalosti u kojima se ogleda razlika pri dva testiranja. U kontigencijskoj tablici je
vidljivo da se dobijene razlike nalaze u elijama b i c.

Empirijska vrednost Mc Nemar-ovog testa predstavlja se preko _
2
vrednosti
koja se izraunava primenom formule:
| | ( )
c b
c b
+

=
2
2
1
_

Stepeni slobode se izraunavaju kao kod _
2
testa: S.S. = (K-1)x(R-1).

Tumaenje realizovane vrednosti _
2
testa vri se na osnovu tablica kritinih
vrednosti _
2
distribucije.

Uslovi za primenu Mc Nemar testa:
1. Ne moe se primeniti ako je neka od validnih uestalosti manja od 5.
2. Yates-ova korekcija se primenjuje kada je a+d<20.

Primer: U jednom istraivanju u podruju dijagnostike nastojalo se videti da li
postoji razlika izmeu dve dijagnostike metode u otkrivanju jedne bolesti.
Istraivanjem je obuhvaeno 100 ispitanika.

Dijagnostika metoda I
Dijagnostika
metoda II
pozitivan nalaz negativan nalaz
pozitivan nalaz 15 (a) 40 (b)
negativan nalaz 25 (c) 20 (d)

Postavlja se pitanje postoji li znaajna razlika izmeu metode I i II.

Ho: Ne postoji statistiki znaajna razlika izmeu dijagnostikih metoda I i II
Ha: Postoji statistiki znaajna razlika izmeu dijagnostikih metoda I i II

135
| | ( )
02 , 3
25 40
1 25 40
2
2
=
+

= _

S.S. = (K-1)x(R-1)=(2-1)x(2-1)=1

2
McN
= 3,02 <
2
(1 i 0,05)
= 3,841 i p>0,05

Kako je realizovana
2
McN
vrednost od 3,02 manja od granine tabline
vrednosti,
2
=3,841, za broj stepeni slobode 1 i prag znaajnosti od p=0,05, prihvatamo
nultu i odbacujemo alternativnu hipotezu jer je greka p>0,05 i zakljuujemo da ne
postoji statistiki znaajna razlika izmeu dijagnostikih metoda I i II

U SPSS-u se zadatak radi na sledei nain:

Biramo: Analyse / Nonparametric Tests / 2 Related Saples



U radnom prozoru sa leve na desnu stranu prebacimo varijable koje se ukrtaju,
a to su DgI za prvu dijagnostiku metodu i DgII za drugu. Zatim odaberemo
McNemar.

136


Izda se nalog OK i dobiju se rezultati:

DgII 1 2
1 15 40
2 25 20
DgII & DgI
N 100
Chi-Square
a
3.015
Asymp. Sig. .082
a. Continuity Corrected
b. McNemar Test
Test Statistics
b
DgII & DgI
DgI


Prva tabela je tabela kontigencije, a rezultati su u drugoj tabeli i to vrednost
testa u redu Chi-Square, odakle se ita _
2
McN=
3,015, a vrednost p u redu Asymp. Sig, i
ona iznosi p=0,082.


10.5. Aditivno dejstvo _
2
testa

Aditivno dejstvo _
2
testa znai da je mogue sabrati vei broj vrednosti _
2
testa
(pri emu se sabiraju i stepeni slobode) za istu pojavu i na osnovu tog zbira zakljuiti o
znaajnosti razlike.
Primer: Dejstvo vakcine protiv gripa ispitano je u Niu, Kragujevcu, Beogradu i
Novom Sadu i dobijene su sledee vrednosti za _
2
test:

grad vrednost _
2
S.S.
Ni 2,64 1
Kragujevac 2,38 1
Beograd 4,46 1
Novi Sad 2,93 1
12,41 4
137

Za svaki grad ponaosob rezultat je vezan za jedan stepen slobode i na nivou
znaajnosti je od p=0,05. Tablina vrednost _
2
iznosi 3,841. Prema tome, statistiki je
znaajan samo rezultat u Novom Sadu. Kako u ostalim Gradovima nemamo znaajnost,
to nemamo dovoljno dokaza ni za prihvatanje ni za odbacivanje nulte hipoteze.
Meutim, kako zbir svih vrednosti _
2
iznosi 12,41 i za 4 stepeni slobode, na nivou
znaajnosti od p=0,05 ovaj rezultat ukazuje na znaajnost razlike, jer je:

2
= 12,41 >
2
(4 i 0,05)
= 9,49 i p<0,05

To upuuje na neprihvatanje nulte hipoteze, odnosno na zakljuak da primena
vakcina utie na smanjenje obolevanja. Aditivno svojstvo
2
testa omoguava jasnije
rezultate testiranja.



































138
Zadaci za vebanje

1. Psiholog je u istraivanju mentalno zaostale dece hteo da ispita da li su ona
sklonija nekoj odreenoj boji. Izabrao je 80 mentalno zaostale dece i dao im da
izaberu izmeu etiri razliite boje koulje: 25 je izabralo braon, 18 oran, 19
utu i 19 zelenu boju. Da li postoji posebna sklonost dece prema nekoj
odreenoj boji?

2. U jednoj klinici nastojalo se ispitati da li se dobijene uestalosti uinka
psihoterapije znaajno razlikuju od onih koje bi smo oekivali pod
pretpostavkom da leenje nema stvarnih uinaka. Istraivanjem je obuhvaeno
100 bolesnika od kojih je kod 45 stanje bilo bolje, kod 25 loije, a kod 30 isto.
Da li je bolesnicima nakon psihoterapije bilo bolje?

3. U jednom istraivanju nastojalo se videti da li ishrana bolesnika utie na pojavu
kardiovaskularnih bolesti. Istraivanjem je obuhvaeno 230 ispitanika. Od
ukupno 150 ispitanika koji su imali ishranu sa visokim holesterolom, kod njih
110 razvila se kardiovaskularna bolest, kao i kod 20 od 80 ispitanika koji su
koristili ishranu sa niskim holesterolom. Da li ishrana utie na pojavu
kardiovaskularnih bolesti?

4. Ispitivana je povezanost izmeu zapaljenja dojke i pojave raka dojke na uzorku
od 212 ena, od kojih je 106 imalo karcinom dojke, a 106 je bilo bez
karcinoma. Od 106 ena sa karcinomom dojke, 62 su imale i zapaljenje, a od
106 ena bez karcinoma dojke zapaljenje je imalo 40 ena. Da li postoji
povezanost izmeu zapaljenja i karcinoma dojke?

5. Pri izbijanju epidemije u jednom naselju sa 9000 stanovnika, u odnosu na
vakcinisanost stanovnitva, dobijeni su sledei odnosi obolelih i neobolelih:

stanje vakcinisanosti oboleli nisu oboleli
vakcinisani pre 11 meseci 250 2250
vakcinisani pre same epidemije 180 3320
Nevakcinisani 520 2480

Da li postoji statistiki znaajna razlika u oboljevanju kod vakcinisanih i
nevakcinisanih i da li je ta razlika posledica vakcinacije ili je sluajnog
karaktera?

6. Od radnika tri preduzea (A, B i C) izdvojeni su uzorvi (A = 140, B = 130 i C =
130) i posmatrana sklonost ka povreivanju na radu. U uzorku iz preduzea A i
C bilo je povreeno po 60, a preduzeu B 50 radnika. Da li je sklonost ka
povreivanju u preduzeima ista, bez obzira na vrstu proizvodnje kojom se ta
preduzea bave, tj. Da li su skupovi radnika iz kojih su uzorci dobijeni
homogeni (pa samim tim i sva tri uzorka pripadaju istom skupu)?



139
7. Standardnom i novom terapijom leeno je 50 bolesnika i dobijeni su sledei
rezultati:

standardna terapija
nova terapija
poboljano nepromenjeno
ukupno
poboljano 20 15 35
nepromenjeno 5 10 15
ukupno 25 25 50

Da li postoji znaajna razlika u rezultatima leenja starom i novom terapijom?



































140
11. REGRESIONA I KORELACIONA ANALIZA


Re regresija dospela je u statistiku kada je 1855. godine Fransis Galton
objavio publikaciju u kojoj je analizirao visinu sinova u zavisnosti od visine oeva.
Zakljuak ove studije bio je da sinovi ekstremno visokih oeva nisu toliko visoki, dakle
regresiraju.
Promena jednog obeleja statistikog skupa esto utie na promenu drugih
obeleja zbog meusobne povezanosti. Povezanost izmeu obeleja moe se razlikovati
i po smeru i po jaini povezanosti. Najjaa ili najua veza izmeu obeleja je
funkcionalna veza, tj. takva veza da svakoj vrednosti jednog obeleja odgovara tano
odreena vrednost drugog obeleja. Labavija veza izmeu obeleja, koja su podlona
manjim ili veim odstupanjima, naziva se korelativnom (ili stohastikom) vezom.
Obino se jedna sluajno promenljiva identifikuje kao nezavisna (x), a druga
kao zavisno sluajno promenljiva (y).
Skup statistikih metoda kojima se prouavaju uzajamne veze statistikih
obeleja i pojava (smer, jaina, oblik) naziva se teorijom korelacije, a osnovni
pokazatelji korelacionih veza su jednaina regresije i koeficijent korelacije.
Ispitivanje zavisnosti u statistikoj analizi ima dva osnovna pravca:
1. oblik zavisnosti koji ispituje regresiona analiza
2. jainu zavisnosti koju odreuje korealicona analiza
U medicinskim istraivanjima najee se sree linearni model regresione i
korelacione analize, pa e se naa razmatranja odnositi na taj model.


11.1. Regresiona analiza

Regresiona analiza pokazuje oblik povezanosti izmeu dve promenljive
pomou regresione linije.
Odnos promenljive (y) prema promenljivoj (x) moe biti razliit, i zato je prvi
korak ka otkrivanju oblika povezanosti ucrtati dijagram rasturanja ili dijagram
disperzije izmeu dva obeleja.


141

Da bi smo kvantifikovali priblinu linearnu vezu izmeu te dve veliine,
moemo konstruisati pravac koji najbolje opisuje podatke. Intuitivno bi to uinili tako
da je priblino jednak broj taaka iznad pravca i ispod njega.



Postoji egzaktan matematiki nain kojim se prikazuje najbolje prilagoen
pravac linearne veze. Odreuje se iz uslova da je zbir kvadrata vertikalnih udaljenosti
taaka od od pravca najmanja metoda najmanjih kvadrata. Tako odreen pravac
povezanosti izmeu dve varijable prikazuje se regresionom linijom.










142
Regresiona linija izraava se jednainom regresije:

y = a + b x,
gde je:
y zavisno promenljiva,
x - nezavisno promenljiva,
a regresiona konstanta,
b koeficijent regresije.
Zavisno promenljiva y je nepoznata promenljiva, koja se izraunava na osnovu
vrednosti nezavisne promenljive x koja je poznata.
Regresiona konstanta (a) i koeficijent regresije (b) odreeni pomou metoda
najmanjih kvadrata imaju formule:

a y b x = i
( )




=
2
2
x x n
y x xy n
b

Sa n je u jednaini oznaen ukupan broj parova koji po nekim autorima ne bi
smeo da bude manji od 12 (n>12) da bi se dobila reprezentativna regresiona prava i
pravi oblik meuzavisnosti meu pojavama.
Parametar a je regresiona konstanta i odreuje nivo regresione prave. To je
vrednost y za x=0 i predstavlja taku u kojoj regresiona linija see y-osu. Drugim
reima, to je poetna vrednost zavisne y kada jo uvek nije poela da deluje nezavisna
x. Osobine parametra a su:
1. ako je a =0, regresiona prava prolazi kroz koordinatni poetak. To znai da ako
obeleja ne mogu da imaju negativne vrednosti polaze od nultog nivoa,
2. ako je a>0, regresiona prava see ordinatnu osu iznad koordinatnog poetka,
3. ako je a<0, regresiona prava see ordinatnu osu ispod koordinatnog poetka.

Parametar bkoeficijent regresije odreuje nagib regresione prave. U
matematikom smislu on predstavlja tangens ugla koga regresiona prava zaklapa sa
X-osom. Osobine parametra b su:
1. ako je b=0, regresiona prava je paralelna sa X-osom; to znai da obeleje Y ima
uvek istu vrednost i da ne zavisi od obeleja X,
2. ako je b>1, regresiona prava se udaljava od X-ose i pribliava Y-osi,
3. ako je b<1, regresiona prava je blia X-osi a udaljava se od Y-ose.

Regresionom analizom mogu i da se predvide vrednosti zavisno promenljivih
za odreene vrednosti nezavisno promenljivih, a koje nisu evidentirane u istraivanju.
Kada se vrednosti nezavisno promenljivih za koje nas interesuju vrednosti zavisno
promenljivih nalaze izmeu najniih i najviih evidentiranih vrednosti proces
predvianja se naziva interpolacija, a kada su izvan opsega evidentiranih vrednosti
proces predvianja se naziva ekstrapolacija.





143
Primer: Dat je broj eritrocita i visina hemoglogobina u krvi 12 ispitanika:

N
broj
eritrocita
visina
hemoglobina
1 4,21 108,4
2 4,3 112
3 3,6 87,3
4 4,41 99
5 3,8 93
6 3,7 92,3
7 3,8 90
8 3,8 94
9 3,81 95
10 3,7 92,3
11 2,9 7,96
12 3,9 80
E 44,72 1122,9

Konstrui regresionu liniju.

Kao prvi korak podatke treba ubaciti u dijagram rasturanja, da bi se ocenilo
postojanje korelacije i oblik zavisnosti. Ucrtane take najbolje pokazuju (aproksimiraju)
oblik prave linije, kao i porast u pozitivnom smeru. To znai da sa porastom broja
eritrocita raste i koliina hemoglobina u krvi.

0
20
40
60
80
100
120
0 1 2 3 4 5
broj eritrocita
v
i
s
i
n
a

h
e
m
o
g
l
o
b
i
n
a











144
Za izraunavanje jednaine regresije najpre treba formirati radnu tabelu, koja u
naem primeru izgleda:

N x y x
2
y
2
xy
1 4,21 108,4 17,72 11750,56 456,36
2 4,30 112,0 18,49 12544,0 481,60
3 3,60 87,3 12,96 7621,29 314,28
4 4,41 99,0 16,81 980,0 405,90
5 3,80 93,0 14,44 8649,0 353,40
6 3,70 92,3 13,96 8519,19 341,51
7 3,80 90,0 14,44 8100,0 342,00
8 3,80 94,0 14,44 8836,0 357,20
9 3,81 95,0 14,52 9025,0 361,95
10 3,70 92,3 13,69 8519,29 341,51
11 2,90 77,96 8,41 6336,16 230,84
12 3,90 80,0 9,00 6400,0 240,00
E 44,72 1122,9 168,61 106101,59 4226,55

73 , 3
12
72 , 44
= = =

n
x
x i 58 , 93
12
9 , 1122
= = =

n
y
y

( )
2 2
2
12 4226, 5 44, 72 1122, 9
22, 44
12 168, 61 44, 72
n xy x y
b
n x x


= = =






93, 58 21 44 3 73 13, 61 a y b x = = =

Sada imamo sve parametre za izraunavanje jednaine regresije:
y
c
= 13,61 + 21,44 x

Da bi smo konstruisali regresionu liniju, potrebno je odrediti bar dve
koordinatne take. Uzeemo najmanju i najveu vrednost za nezavisno promenljivu (x).
Za x=2,90 y
c
=13,61+21,44x2,90=75,79
Za x=4,41 y
c
=13,61+21,44x4,41=108,16
gde je y
c
ocena prosene vrednosti za vrednost zavisno promenljive.
0
20
40
60
80
100
120
0 1 2 3 4 5
broj eritrocita
v
i
s
i
n
a

h
e
m
o
g
l
o
b
i
n
a


145

Kao to se iz slike moe videti, prava linija je blizu svih taaka i zbir kvadrata
odstupanja je manji nego za bilo koju drugu pravu liniju, tj. zbir kvadrata odstupanja je
minimalan.


11.2. Korelaciona analiza

Korelaciona analiza pokazuje stepen zavisnosti izmeu promenljivih, odnosno
korelacijom se meri jaina ve utvrene povezanosti izmeu dve promenljive.
Stepen intenziteta povezanosti izmeu promenljivih, koje su u linearnom
odnosu meri se:
kovarijansom, kao apsolutnom merom intenziteta korelacije i
koeficijentom proste lenearne korelacije, kao relativnom merom intenziteta
korelacione veze.

Kovarijansa predstavlja u sutini zajedniku meru varijabilnosti jedne i druge
varijabile, pa se matematiki moe da predstavi kao zbir varijansi jedne i druge
varijable:
2 2
y x xy
SD SD C + = tj.
( ) ( )
n
y y
n
x x
C
xy


+

=
2 2

Odakle se dobija radna formula za kovarijansu:
y x
n
xy
C
xy
=


gde je n veliina uzorka, odnosno, broj koreliranih parova vrednosti.
Meutim, kovarijansa kao apsolutna mera stepena povezanosti nije pogodna za
procenu, pa se pristupa izraunavanju relativne mere tj. izraunava se koeficijent proste
linearne korelacije.
Koeficijent proste linearne korelacije ili Pearson-ov koeficijent predstavlja
kovarijansu izraenu u jedinicama standardnih devijacija obeju varijabli.
Izraunava se kao kolinik izmeu kovarijanse i proizvoda standardnih
devijacija jedne i druge varijable, pa je njegova formula:



Koeficijent proste linearne korelacije pokazuje stepen zavisnosti izmeu
promenljivih i on odreuje veliinu disperzije (rasturanja) podataka oko regresione
linije.
Ako varijable nisu povezane disperzija oko regresione linije je velika. Sa
poveanjem linearne povezanosti, disperzija se smanjuje i grafik postaje sve
spljoteniji. Ako izmeu dve promenljive postoji apsolutno slaganje svi podaci lee na
regresionoj liniji.
146

A B C D E
Grafik. A. savrena negativna korelacija; B. negativna korelacija; C. nema korelacije;
D. pozitivna korelacija; E. savrena pozitivna korelacija

Koeficijent korelacije ima vrednost koja se kree u rasponu od -1 do +1.
Ako varijable nisu povezane, r je jednak nuli. Kada veim vrednostima
nezavisno promenljive x, odgovaraju i vee vrednosti zavisno promenljive y i obrnuto:
opadanjem vrednosti nezavisne x, opadaju i vrednosti zavisne y - onda je to pozitivna
korelacija (r>0). Obrnuto, kada veim vrednostima nezavisno promenljive x,
odgovaraju manje vrednosti zavisno promenljive y, odnosno opadanjem vrednosti
nezavisne x rastu vrednosti zavisne y - onda je to negativna korelacija (r<0).
Vai opte pravilo: to je vrednost koeficijenta proste linearne korelacije blia
jedinici, to je meuzavisnost meu posmatranim pojavama jaa.
Koeficijent korelacije nikada nema vrednosti 1 ili -1, jer to bi znailo da
izmeu pojava postoji matematika, a ne statistika veza.

Skala za tumaenje koeficijenata korelacije:


Vrednost koeficijenta korelacije moe da se ocenjuje i preko specijalnih tablica
za granine vrednosti r
xy.


Tablice prikazuju kolika mora da bude najmanja vrednost r
xy
, da bi se za
odreeni broj stepena slobode i za odgovarajui prag znaajnosti (0,05 ili 0,01) mogao
da smatra statistiki signifikantnim. Broj stepeni slobode se izraunava po formuli:

S.S. = n-2 gde je: n = broj parova.

Primer: Utvrditi da li postoji korelacija izmeu broja eritrocita i visine
hemoglobina ve datih podataka za 12 ispitanika.
Ho: Izmeu broja eritrocita i visine hemoglobina 12 ispitanika ne postoji korelacija
Ha: Izmeu broja eritrocita i visine hemoglobina 12 ispitanika postoji korelacija
Sledei korak je izraunavanje koeficijenta proste linearne korelacije. Formula
za njegovo izraunavanje je:
y x
xy
xy
SD SD
C
r

=
147

pa je potrebno izraunati prvo C
xy
i SD
x
i SD
y
.
y x
n
xy
C
xy
=


Kako smo ve napravili radnu tabelu i izraunali
_
x i
_
y , moemo odmah
krenuti na izraunavanje kovarijanse.
46 , 3 575 , 93 727 , 3
12
56 , 4226
= =
xy
C
4 , 0 727 , 3
12
61 , 168
2
2
2
= = =

x
n
x
SD
x

25 , 9 575 , 93
12
59 , 106101
2
2
2
= = =

y
n
y
SD
y


Sada imamo sve elemente za izraunavanje koficijenta, pa je:
94 , 0
7 , 3
46 , 3
25 , 9 4 , 0
46 , 3
= =

=
y x
xy
xy
SD SD
C
r

Za na primer vrednost koeficijenta korelacije je 0,94 to znai: Izmeu broja
eritrocita i vrednosti hemoglobina postoji jaka pozitivna (direktna) korelacija.

Za na primer S.S. = n 2 = 12-2 = 10.
Za stepen slobode 10 i p=0,05 granina vrednost r
xy
=0,576.
r
xy
= 0,94 > r
xy(10; 0,05)
=0,576 i p < 0,05
Kako je dobijena r
xy
vrednost od 0,94 vea od granine tabline vrednosti,
r
xy
=0,576, za broj stepeni slobode 10 i prag znaajnosti od p=0,05, to odbacujemo nultu
i prihvatamo alternativnu hipotezu sa grekom p<0,05 i sigurnou P>95% tvrdimo da
postoji jaka pozitivna korelacija izmeu broja eritrocita i koliine hemoglobina 12
ispitanika.

Za stepen slobode 10 i p=0,01 granina vrednost r
xy
=0,708.
r
xy
= 0,94 > r
xy(10; 0,01)
=0,708 i p < 0,01
Kako je dobijena r
xy
vrednost od 0,94 vea od granine tabline vrednosti,
r
xy
=0,708, za stepen slobode 10 i prag znaajnosti od p=0,01, odbacujemo nultu i
prihvatamo alternativnu hipotezu sa grekom p<0,01 i sigurnou P>99% tvrdimo da
postoji jaka pozitivna korelacija izmeu broja eritrocita i koliine hemoglobina 12
ispitanika.

Postoji jo jedan statistiki problem. Naime, koeficijent proste linearne
korelacije se obino izraunava iz uzorka. Postavlja se pitanje njegove signifikantnosti
za celu populaciju, odnosno da li uzorak iz koga je izraunat koeficijent dovoljno
reprezentativan za donoenje nepristrasne ocene koeficijenta osnovnog skupa.
Dok se to ne utvrdi, dobijena vrednost koeficijenta na osnovu uzorka
predstavlja samo hipotezu o vrednosti istog koeficijenta osnovnog skupa.
148
Problem je reen na sledei nain:
Testira se hipoteza da li je izraunati prost koeficijent linearne korelacije iz
uzorka (r
xy
) i precizna ocena prostog koeficijenta linearne korelacije osnovnog skupa
(Rxy).
Ako odgovarajuim testom odbacimo nultu hipotezu, prihvatamo izraunatu
vrednost koeficijenta korelacije iz uzorka kao pravu ocenu koeficijenta u osnovnom
skupu. Drugim reima uzorak je reprezentativan, pa dobijeni rezultat moe da se uopti.
Testiranje koeficijenta proste linearne korelacije se zasniva na Studentovom
rasporedu za n-2 stepena slobode, a dobijena t-vrednost se tumai na isti nain kao i
kod klasinog Studentovog t-testa.
Test je matematiki definisan formulom:
2
1
2

=
n
r
r
t
xy
xy
ili
2
1
2
xy
xy
r
n
r t

=

gde je r
xy
- dobijena vrednost iz uzorka, a n - velicina uzorka (broj parova).

Broj stepena slobode se izraunava po obrascu: S.S. = n-2.
Dobijena t vrednost se tumai na isti nain kao i kod klasinog Studentovog
t testa.

Primer: Testirajmo dobijenu vrednost, r
xy
=0,94 za 12 osoba kod kojih je traena
veza izmedu broja eritrocita i vrednosti hemoglobina.

Ho: Rxy (osnovnog skupa) = 0
Ha: Rxy (osnovnog skupa) = 0

712 , 8
1078 , 0
94 , 0
2 12
94 , 0 1
94 , 0
2
= =

= t

t = 8,712 > t
(10 i 0,05)
= 2,23 i p <0,05

Kako je dobijena t vrednost od 8,712 vea od granine tabline vrednosti,
t=2,23, za stepen slobode 10 i prag znaajnosti od p=0,05, to odbacujemo nultu i
prihvatamo alternativnu hipotezu sa grekom p<0,05 i sigurnou P>95%
zakljuujemo: izmeu broja eritrocita i vrednosti hemoglobina postoji visok stepen
korelacije, a dobijena vrednost r
xy
=0,94 predstavlja stvarnu meru korelacije pa se
zakljuak moe da uopti na celu populaciju.
t = 8,712 > t
(10 i 0,01)
= 3,17 i p <0,01
Kako je dobijena t vrednost od 8,712 vea od granine tabline vrednosti,
t=3,17, za broj stepeni slobode 10 i prag znaajnosti od p=0,01, odbacujemo nultu i
prihvatamo alternativnu hipotezu sa grekom p<0,01 i sigurnou P veim i od 99%.
Pirsonov koeficijent korelacije daje informacije da li je povezanost varijabli
slaba, umerena, jaka ili veoma jaka. Medutim, on nam ne daje i informaciju koliko je
149
zavisna promenljiva uslovljena vrednostima nezavisno promenljive, a koliko drugim
faktorima.
Ovaj problem reava koeficijent determinacije, koji se najlake izraunava kao
drugi stepen koeficijenta proste linearne korelacije i on je mera za objanjeni
varijabilitet: koeficijent determinacije = r
xy
2
= 0,94
2
= 0,8836
Vrednost koeficijenta determinacije od 0,8836 nam pokazuje da su vrednosti
hemoglobina sa 88,36% odreene (determinisane) brojem eritrocita.
Ostatak do 1 je koeficijent alijenacije: 1-r
xy
2
=1-0,8836=0,1164 tj. 11,64%
promena vrednosti hemoglobina uslovljeno je nekim drugim faktorima. Koeficijent
alijenacije je mera za neobjanjeni varijabilitet.
Zbir objanjenog (determinisanog) varijabiliteta i neobjanjenog varijabiliteta je
uvek jednak jedinici, odnosno 100%.




U SPSS-u se koeficijent proste linearne korelacije se odreuje na sledei nain:

Obelei se Analyse / Correlate i u desnom grananju Bivariate:




U radnom prozoru koji se otvara zadre se opcije koje je ponudio raunar:
Pearson, Two-tailed i Flag significant correlations. eljene varijable se prebace iz
levog u desni prozor, u naem sluaju varijabla sa brojem eritrocita (broj Er) i
visinom hemoglobina (Hb).

150


Klikne se na OK i dobiju rezultati:

brojEr Hb
brojEr Pearson Correlation 1 .778**
Sig. (2-tailed) .003
N 12 12
Hb Pearson Correlation .778** 1
Sig. (2-tailed) .003
N 12 12
Correlations
**. Correlation is significant at the 0.01 level



U tabeli su date vrednost Pirsonovog koeficijenta korelacije koji je za dati
primer 0,778, a vrednosti p se ita u Sig. (2-tailed) i iznosi 0,003 u datom zadatku.


11.3. Spearman-ov koeficijent rang korelacije

Spearmanov koeficijent rang korelacije je neparametrijski ekvivalent
Pearsonovom koeficijentu linearne korelacije.
Razlika je u tome to se raunske operacije ne izvode iz numerikih vrednosti
zavisne i nezavisno promenljive pojave, ve iz njihovih relativnih odnosa tj. rangova.

Raunamo ga, umesto Pearsonovog koeficijenta, u sledeim sluajevima:
- barem jedna od varijabli, x ili y, merena je ordinalnom skalom
- ni x ni y nemaju normalnu distribuciju
- uzorak je mali
- treba nam mera povezanosti izmeu dve varijable kada ta povezanost nije
linearna
Postupak se odvija u dve etape:
151
1. Stvarne numerike vrednosti i zavisne i nezavisne pojave sreuju se po
veliini, od najmanje do najvee (ili obrnuto) i odreuje se njihov rang tj. obelee se
kao: prvi rang (prvo mesto = 1), drugi rang (drugo mesto = 2), trei rang (tree mesto
po velicini = 3) i tako do n-tog ranga.
Kod rangova ne znamo stvarne razlike izmeu numerikih vrednosti, nego
jedino razlike izmeu rangova.
2. Kada smo prave vrednosti transformisali u rangove pristupa se
izraunavanju tzv. rang korelacije, tj. izraunava se korelacija meu rangovima.
Ovaj postupak je krai i praktiniji od Pearson-ove linearne korelacije,
pogotovu ako broj parova nije veliki.
Spearman-ov koeficijent rang korelacije se izraunava po formuli:
( ) 1
6
1
2
2

=

n n
d
,
gde je:
- (ro) Spearmanov koeficijent,
d razlika (diferencija) izmeu rangova x i y,
n - broj parova rangova promenljivih x i y.

Stepen slobode se izraunava: S.S. = n.

Koeficijent rang korelacije takoe moe da ima vrednosti od -1 do + 1.
to je razlika izmeu rangova obeleja x i y manja, to se njegova vrednost vie
pribliava vrednostima + 1 i -1, a to znai i da je stepen korelacije vei izmeu
posmatranih pojava.
Razlika izmeu Pirsonovog koeficijenta proste linearne korelacije i
Spirmanovog koeficijenta rang korelacije je u tome to se ovaj poslednji moe da
izraunava iz podataka kada je merenje vreno na ordinalnoj skali.
Spirmanov koeficijent moe da zameni Pirsonov, ako se intervalni podaci
prevedu u ordinalne tj. ako se rangiraju po veliini. Obrnuto, ako su podaci dati u
ordinarnoj skali, moe da se primeni samo Spirmanov koeficijent.
Bitna razlika je i u sledeem:
Statistika snaga power Pirsonovog koeficijenta je znatno vea nego
Spirmanovog, pa zato ako su podaci dati intervalno, prednost treba dati Pirsonovom
koeficijentu, a Spirmanov zbog lakoe izraunavanja primeniti kao pilot probu.

Primer: Asistent je rangirao 7 studenata iz svoje grupe u odnosu prema nastavi
(x) i stepenu obuenosti za praktian rad (y).
Kao rang 1 je koristio najpovoljniju, a kao rang 7 najnepovoljniju ocenu za oba
modaliteta.

student A B C D E F G
rang za x 4 2 6 1 3 7 5
rang za y 3 1 6 2 4 7 5

Da li je odnos prema nastavi u meuzavisnosti sa obuenou za praktian rad?

152
Ho: Izmeu odnosa prema nastavi i obuenosti za praktian rad ne postoji
meuzavisnost.
Ha: Izmeu odnosa prema nastavi i obuenosti za praktian rad postoji
meuzavisnost.

Konstruiemo radnu tabelu i sreujemo rangove po veliini:

student rang za x rang za y d D
2

A 4 3 1 1
B 2 1 1 1
C 6 6 0 0
D 1 2 -1 1
E 3 4 -1 1
F 7 7 0 0
G 5 5 0 0
E
- - - 4

Spirmanov koeficijent rang korelacije je:

( ) ( )
93 , 0
1 7 7
4 6
1
1
6
1
2 2
2
=


=

=

n n
d


S.S. = 7
=0,93>
(7 i 0,05)
=0,786 i p<0,05
Dakle, izmeu odnosa prema nastavi i obuenosti za praktian rad postoji jaka
meuzavisnost, to tvrdimo sa p<0,05.

U SPSS-u se koeficijent proste linearne korelacije se odreuje na sledei nain:

Biramo: Analyse / Correlate / Bivariate







153
U radnom prozoru se zadre opcije koje ponudi raunar Two-tailed i Flag
significant correlations. Obelei se opcija za eljeni test, tj. Spearman. Ispitivane
varijable se prebace iz levog u desni prozor, u naem sluaju varijabla sa odnosom
prema nastavi (nastava) i stepenom obuenosti za praktini rad (praksa).



Klikne se na OK i dobiju rezultati:

nastava praksa
Spearman's rho nastava Correlation Coefficient 1.000 .929**
Sig. (2-tailed) . .003
N 7 7
praksa Correlation Coefficient .929** 1.000
Sig. (2-tailed) .003 .
N 7 7
**. Correlation is significant at the 0.01 level (2-tailed)
Correlations


U tabeli su date vrednosti Spirmanovog koeficijenta (0,929) i vrednost p
(0,003) - Sig. (2-tailed).












154
Zadaci za vebanje

1. Izmerena je koncentracija kiseonika kod 10 zdravih odraslih mukaraca i
dobijene su sledee vrednosti:
N 1 2 3 4 5 6 7 8 9 10
arterijska 23 17 19 20 22 21 21 19,5 20,5 24
venska 16 11,5 13 14 12,5 14,5 14,2 11,5 17 18
Da li postoji povezanost izmeu koncentracije kiseonika u arterijskoj i venskoj
krvi?
Dobijene podatke rangiraj i izraunaj Spirmanov koeficijent rang korelacije.

2. U grupi 11 obolelih od skleritisa udruenog sa sistemskim bolestima vezivnog
tkiva registrovan je broj recidiva i nivo cirkuliuih imunih kompleksa (CIC).
Moe li se na osnovu nivoa CIC prognozirati uestralst recidiva?
Br.recidiva 6 10 15 3 4 2 6 2 4 15 3
CIC (mg%) 171 149 265 168 55 7 37 55 146 144 82

3. Ugrupi od 10 bolesnika sa glaukomom izmerena je aktivnost enzima
superoksiddismutaze (SOD) u onoj vodici, prilikom operacije, a takoe i
koeficijent lakoe isticanja one vodice (C). Da li je aktivnost enzima
povezana sa promenom koeficijenta lakoe isticanja one vodice (C)?
SOD 1,5 1,6 1,7 1,9 1,1 1,3 1,4 1,3 1,4 1,7
C 0,08 0,06 0,09 0,06 0,14 0,12 0,10 0,16 0,12 0,06

4. Kod trinaestoro dece izvreno je tuberkulinsko testiranje, a rezultate su itala
dva lekara sa sledeim nalazima:
r.br. 1 2 3 4 5 6 7 8 9 10 11 12 13
lekar A 6 4 8 12 14 9 15 5 5 3 7 11 13
lekar B 5 4 7 10 15 10 16 7 5 3 7 9 14
Da li postoji slaganje izmeu lekara A i B u oitavanju veliine tuberkulinske
reakcije?

5. Kod 40 osoba meren je sistolni pritisak i dobijeni su sledei rezultati u odnosu
na godine starosti:
- starost: 2 , 49 = x , 2 , 8 =
x
SD ,

=1968
2
x ,

=1968 xy
- sistolni pritisak: 140 = y , 14 =
y
SD ,

= 5600
2
y
Utvrdi da li postoji veza izmeu godina starosti i sistolnog pritiska?









155
12. JEDNOSTRANA ANALIZA VARIJANSE ONE
WAY ANOVA


Analiza varijanse - ANOVA je metoda koja omoguava deljenje varijanse
(varijabiliteta) dobijene u rezultatima istraivanja na delove, pri emu je mogue te
delove varijanse dovesti u vezu sa nekim poznatim uzrokom ili faktorom.
Ovom metodom je mogue odrediti veliinu varijanse koju objanjava neki
faktor i proceniti da li je taj deo varijanse vei od oekivanja na osnovu nulte hipoteze.
Najvanije oblasti u kojima se ANOVA primenjuje su:
- Jednostrana ANOVA (One-Way ANOVA)
- Univarijantni generalizovani linearni modeli (GLM Univariate)
- Multivarijantni generalizovani linearni modeli (GLM Multivariate)
- Generalizovani linearni modeli za ponovljena merenja (GLM Repeated
Measures).

Jednostrana (jednostruka) ANOVA je metoda kojom se porede aritmetike
sredine numerikih obeleja kod tri i vie nezavisnih uzoraka.
Uslovi za njenu primenu su normalna ili bar simetrina distribucija (bez
ekstremnih vrednosti) i bar intervalna merna skala.

Zbog ega za poreenje srednjih vrednosti kod vie od dve grupe ispitanika
koristimo jednostranu ANOVA-u, a ne nekoliko puta Studentov t-test?

Prvi razlog: Dozvoljena greka procene za tvrdnju da statistiki znaajna
razlika postoji kod poreenja vrednosti za dve grupe ispitanika iznosi do 5% (p<0,05).
Ukoliko poredimo tri grupe i kod svakog od tri poreenja t-testom (I: prva i druga; II:
prva i trea; III: druga i trea grupa) dobijemo da je greka procene 4,9%, odnosno
p=0,049 (p<0,05) tvrdiemo da su razlike izmeu sve tri grupe statistiki znaajne.
Kolika bi bila verovatnoa da smo barem negde u naem zakljuivanju nainili greku
veu od 5%? Sigurno vea od 5%. Proverimo. Verovatnoa greke kod vie poreenja
rauna se po formuli:
Verovatnoa greke = 1 - (1 - 0,05)
broj poreenja

Kod tri grupe imamo tri poreenja, pa bi verovatnoa da smo barem negde
nainili greku veu od 5% bila:
Verovatnoa greke = 1 - (1 - 0,05)
3
= 1 0,95
3
= 1 0,857 = 0,143 = 14,3%

Drugi razlog: to vie grupa imamo za poreenje, to vie t-testova bi trebalo
raditi (na primer, za poreenje 6 grupa bi trebalo uraditi: 6x5/2=15 t-testova).

Odbacivanje nulte hipoteze znai da se uzorci ponaaju kao da ne potiu iz iste
populacije ve iz znaajno razliitih populacija.
Ukoliko se nulta hipoteza odbaci, to znai da se aritmetike sredine znaajno
razlikuju kod bar dva uzorka, ali nemamo informaciju kod kojih. Zbog toga je potrebno
primeniti i naknadno (post hoc) testiranje svakog sa svakim uzorkom da bi se utvrdilo
izmeu kojih to uzoraka postoji znaajna razlika u aritmetikim sredinama. Post hoc
testova ima vei broj, a svi se dele na one koji se primenjuju kada se moe predpostaviti
156
jednakost varijansi kod uzoraka i one koji se primenjuju kada se homogenost varijansi
ne moe predpostaviti. Ne postoji jednostavna preporuka koji tano post hoc test
primeniti, ali po pravilu kada jedan test potvrdi da izmeu aritmetikih sredina dva
uzorka postoji znaajna razlika, to potvruju i drugi testovi.
Ukoliko se grupe bitno razlikuju po broju ispitanika, a Levenov test potvruje
homogenost varijanse, najbolje je koristiti Tuki (Tukey) post hoc test jer on sadri
Kajzerovu korekciju za nejednake veliine uzorka.
Kada se u jednostranoj ANOVA-i tretiraju dva uzorka, tada nije mogue
sprovesti post hoc testiranje, ali se tada F test poistoveuje sa t-testom i validan je za
poreenje aritmetikih sredina izmeu ta dva uzorka.

Jednostrana ANOVA se zasniva na poreenju varijabilnosti (varijansi)
vrednosti izmeu grupa i unutar grupa. Odnos izmeu meugrupne i unutargrupne
varijabilnosti izraava se pomou F vrednosti i verovatnoe greke njene procene.

2
m
2
u
SD varijansa medjugrupnog varijabiliteta
F=
varijansa unutargrupnog varijabiliteta SD
=

Kada meugrupna varijabilnost znaajno prevazilazi unutargrupnu odbacujemo
nultu hipotezu.

Varijansa unutargrupnog varijabiliteta izraunava se kao kolinik ukupnog
unutargrupnog varijabiliteta - V
u
i broja stepeni slobode koji iznosi n-k, gde je n ukupan
broj jedinica posmatranja, a k broj poreenih grupa. Ukupni unutargrupni varijabilitet -
V
u
dobija se kada se saberu unutranji varijabiliteti svih grupa, a unutranji varijabilitet
svake grupe je zbir kvadrata odstupanja svake njene pojedinane vrednosti od
aritmetike sredine.
Varijansa meugrupnog varijabiliteta izraunava se kao kolinik meugrupnog
varijabiliteta - V
m
i broja stepeni slobode koji iznosi k-1, gde je k broj poreenih grupa.
Meugrupni varijabilitet - V
m
predstavlja zbir kvadrata odstupanja aritmetikih sredina
grupa od zajednike aritmetike sredine pomnoenih brojem lanova u grupi.

Primer: Posmatrane su tri bolnice gde je od iste bolesti leeno po 5 ispitanika, a
vreme leenja u danima je iznosilo:

Duina leenja
Pacijent I bolnica
X
1

II bolnica
X
2

III bolnica
X
3

1 2 6 10
2 3 7 11
3 4 8 12
4 5 9 13
5 6 10 14
20 40 60

Da li postoji znaajna razlika u prosenom vremenu leenja izmeu bolnica?

157
Izrauna se proseno vreme leenja po jednom bolesniku u svakoj od
ispitivanih bolnica:
1
1
1
20
4
5
X
X
n
E
= = =
2
2
2
40
8
5
X
X
n
E
= = =
3
3
3
60
12
5
X
X
n
E
= = =

Zajednika ili totalna aritmetika sredina iznosi:

1 2 3
1 2 3
20 40 60 120
8
5 5 5 15
total
X X X
X
n n n
E + E + E + +
= = = =
+ + + +


Da bi izraunali unutranji varijabilitet svake grupe formiramo sledeu radnu
tabelu:

Pacijent
( )
2
1
1
X X
( )
2
2
2
X X
( )
2
3
3
X X
1 4 4 4
2 1 1 1
3 0 0 0
4 1 1 1
5 4 4 4
10 10 10

Zatim se saberu unutranji varijabiliteti svih grupa i dobijamo unutargrupni
varijabilitet:
( ) ( ) ( )
2 2 2
1 2 3
1 2 3
10 10 10 30
u
V X X X X X X = + + = + + =

Meugrupni varijabilitet izraunavamo kao:
( ) ( ) ( )
( ) ( ) ( )
2 2 2
2 2 2
1 2 3
1 2 3
4 8 5 8 8 5 12 8 5 160 total total total
m
V X X n X X n X X n = + + = + + =

Za izraunavanje varijansi unutargrupnog i meugrupnog varijabiliteta,
potrebni su nam jo stepeni slobode.
Za meugrupni varijabilitet stepen slobode iznosi k-1, u naem primeru:
S.S.m=3-1=2
Za unutargrupni varijabilitet stepen slobode iznosi n-k:
S.S.u=15-3=12

Sada imamo sve elemente za izraunavanje varijansi.
Varijansa meugrupnog varijabiliteta iznosi:

2
160
80
. . 2
m
m
m
V
SD
S S
= = =
Varijansa unutargrupnog varijabiliteta:

2
30
2, 5
. . 12
u
u
u
V
SD
S S
= = =


158
Na kraju izraunavamo F-vrednost:

2
m
2
u
SD varijansa medjugrupnog varijabiliteta 80
F= 32
varijansa unutargrupnog varijabiliteta 2, 5 SD
= = =

F-vrednost od 32 govori da je varijansa meugrupnog varijabiliteta 32 puta
vea od varijanse unutargrupnog varijabiliteta.
Pitanje je da li je ova vrednost statistiki znaajna. Odgovor na ovo pitanje
dobija se na osnovu Snedecorovih tablica za granine F-vrednosti, a prema F
distribuciji.
Granina F-vrednost se oitava na preseku stepena slobode S.S.u i S.S.m.
Za stepene slobode 12 i 2, kao u naem primeru, i prag znaajnosti od 0,05,
granina tablina F-vrednost iznosi 3,88.
Kako je naa dobijena F-vrednost, F=32 vea od granine tabline vrednosti,
odbacujemo nultu hipotezu i sa sigurnou veom od 95% tvrdimo da postoji statistiki
znaajna razlika izmeu meugrupnog i unutargrupnog varijabiliteta, odnosno da se
grupe ponaaju kao da ne pripadaju istom osnovnom skupu.

I dalje ostaje otvoreno pitanje:
Izmeu kojih grupa je izraena razlika?

Na ovo pitanje odgovor daje post-hok analiza, odnosno primena nekog od
testova za procenu F-vrednosti.

Tukey-ov test

Izraunaju se apsolutne vrednosti razlika izmeu svakog para grupnih
aritmetikih sredina:
1 2 X X 4 8 4 = =

1 3 X X 4 12 8 = =

2 3 X X 8 12 4 = =


Izrauna se vrednost D po formuli:
2
u
SD
D Q
n
=

gde Q predstavlja vrednost koja se oitava u posebnim tablicama za odgovarajue
stepene slobode i eljenu znaajnost.

U naem primeru za S.S.u=12, S.S.m=2 i p=0,05 vrednost Q iznosi 3,16
2, 5
D 3,16 2, 23
5
= =


159
Kako je granina D vrednost 2,23 manja od sve tri vrednosti razlika
aritmetikih sredina izmeu grupa, zakljuujemo da postoji statistiki znaajna razlika
izmeu duine leenja u sve tri bolnice, odnosno da leenje u prvoj bolnici traje
znaajno krae nego u drugoj i treoj, a u treoj traje znaajno due nego u prvoj i
drugoj.
Ovo tvrdimo sa sigurnou veom od 95%.

U SPSS-u zadatak se radi na sledei nain:

Podatke unosimo tako to emo prvu varijablu nazvati dani. U ovu kolonu
uneemo broj dana odnosno duinu leenja. Druga varijabla koju unosimo je bolnica: sa
1- oznaiemo prvu bolnicu, sa 2 drugu bolnicu i sa 3 treu bolnicu.

Da bi se aktivirala ANOVA biramo: Analyze / Compare Means / One-Way
ANOVA.



U radnom prozoru koji se otvara u polje Dependent list prebacujemo zavisnu
varijablu, to je u ovom primeru varijabla dani, a u Factor prebacimo varijablu sa
iframa grupa koje se uporeuju, a to su u ovom sluaju bolnice.



Nakon unosa varijabli u predviena polja, klikne se na dugme Post Hoc.


160


U ovom radnom prozoru biramo koji emo post hoc test primeniti za poreenje
aritmetikih sredina izmeu svih parova grupa.
Od testova koji predpostavljaju jednake varijanse tikliramo Tukey (Tuki), a od
testova koji ne predpostavljaju jednake varijanse tikliramo: Dunnett T3 (Danet).
Kliknemo: Continue>OK
Dobijaju se sledee tabele sa rezultatima:


U prvoj tabeli je rezultat Levenovog testa koji potvruje predpostavku
homogenosti varijansi u tri uzorka (p=0,352 odnosno p>0,05).

dani
Sum of
Squares df Mean Square F Sig.
Between Groups 160.000 2 80.000 32.000 .000
Within Groups 30.000 12 2.500
Total 190.000 14
ANOVA


Na osnovu vrednosti F statistika (F=32,00) i verovatnoe greke procene (Sig.)
od 0,000 (p<0,001) zakljuujemo da se uzorci ne ponaaju kao da potiu iz iste
populacije, odnosno da postoji znaajna razlika aritmetikih sredina barem izmeu dva
od tri uzorka.



Test of Homogeneity of Variances
UZR
1,086 2 27 ,352
Levene
Statistic df1 df2 Sig.
161


Oznaili smo da elimo dva post hoc testa, ali nam je Levenov test potvrdio
predpostavku homogenosti varijanse, pa emo tumaiti samo rezultate Tukijevog testa,
a on pokazuje da postoji statistiki znaajna razlika u duini leenja izmeu prve i
druge bolnice (p=0,005; p<0,01), prve i tree (p=0,000; p<0,001), kao i druge i tree
bolnice (p=0,005; p<0,001).

























162
PRILOG


Povrine ispod normalne krive
(Svakoj vrednosti predhodi decimalni zarez)
z
x x
SD
=

0 1 2 3 4 5 6 7 8 9
0,0 0000 0040 0080 0120 0160 0199 0239 0279 0319 0359
0,1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0753
0,2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0,3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0,4 1554 1519 1628 1664 1700 1736 1772 1808 1844 1879
0,5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224
0,6 2257 2291 2324 2357 2389 2422 2454 2486 2517 2549
0,7 2580 2611 2642 2673 2704 2734 2764 2794 2823 2852
0,8 2881 2910 2939 2967 2995 3023 3051 3078 3106 3133
0,9 3159 3186 3212 3238 3264 3289 3315 3340 3365 3389
1,0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621
1,1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1,2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1,3 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1,4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1,5 4332 4345 4357 4370 4382 4394 4406 4418 4429 4441
1,6 4452 4463 4474 4484 4495 4505 4515 4525 4335 4545
1,7 4554 4564 4573 4582 4591 4599 4608 4611 4625 4633
1,8 4641 4649 4656 4664 4671 4678 4686 4693 4699 4706
1,9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
2,0 4772 4778 4783 4788 4793 4708 4803 4808 4812 4817
2,1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2,2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2,4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2,5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2,6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2,7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2,8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2,9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3,0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
3,1 4900 4991 4991 4991 4992 4992 4992 4992 4993 4993
3,2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
3,9 4999
4,0 49997
4,5 4999966
5,0 499999713



163




Studentova t-distribucija

Stepen nivo greke = p
slobode 0,10 0,05 0,01 0,001
1 6,31 12,70 63,70 637,00
2 2,92 4,30 9,92 31,60
3 2,35 3,18 5,84 12,90
4 2,13 2,78 4,60 8,61
5 2,02 2,57 4,03 6,86
6 1,94 2,45 3,71 5,96
7 1,90 2,36 3,50 5,40
8 1,86 2,31 3,36 5,04
9 1,83 2,26 3,25 4,78
10 1,81 2,23 3,17 4,59
12 1,78 2,18 3,06 4,32
14 1,76 2,14 2,98 4,14
16 1,75 2,12 2,92 4,02
18 1,73 2,10 2,88 3,92
20 1,72 2,09 2,84 3,85
22 1,72 2,07 2,82 3,79
24 1,71 2,06 2,80 3,74
26 1,71 2,06 2,78 3,71
28 1,70 2,05 2,76 3,67
30 1,70 2,04 2,75 3,65
40 1,68 2,02 2,70 3,55
60 1,67 2,00 2,66 3,46
80 1,66 1,99 2,64 3,42
100 1,66 1,98 2,63 3,39
120 1,66 1,98 2,62 3,77

1,645 1,96 2,576 3,291
Normalna
distibucija














164

Hi-kvadrat distribucija

Stepeni
slobode
p = 0,10 p = 0,05 p = 0,01 p = 0,001
1 2,706 3,841 6,635 10,827
2 4,605 5,991 9,210 13,815
3 6,251 7,815 11,341 16,268
4 7,779 9,488 13,277 18,465
5 9,236 11,070 15,086 20,517
6 10,645 12,592 16,812 22,457
7 12,017 14,067 18,475 24,322
8 13,362 15,507 20,090 26,125
9 14,684 16,919 21,666 27,877
10 15,987 18,307 23,209 29,588
11 17,275 19,675 24,725 31,264
12 18,549 21,026 26,217 32,909
13 19,812 22,362 27,688 34,528
14 21,064 23,685 29,141 36,123
15 22,307 24,996 30,578 37,697
16 23,542 26,296 32,000 39,252
17 24,769 27,587 33,409 40,790
18 25,989 28,869 34,805 42,312
19 27,204 30,144 36,191 43,820
20 28,412 31,410 37,566 45,315
21 29,615 32,671 38,932 46,797
22 30,813 33,924 40,289 48,268
23 32,007 35,172 41,638 49,728
24 33,196 36,415 42,980 51,179
25 34,382 37,652 44,314 52,620
26 35,563 38,885 45,642 54,052
27 36,741 40,113 46,963 55,476
28 37,916 41,337 48,278 56,893
29 39,087 42,557 49,588 58,302
30 40,256 43,773 50,892 59,703

Ako je broj stepena slobode veci od 30, tabline vrednosti mogu da se aproksi-
miraju formulom:
S S B . . +
F
H
G
I
K
J
1
2
2

gde je:
S.S. - broj stepena slobode
B - konstanta koja iznosi 0,91 (p=0,10); 1,16 (p=0,05); 1,64 (p=0,01) ili
2,19 (p=0,001).



165

Izvod iz Snedecorove F-distribucije (za analizu varijanse)
Granine vrednosti F na nivou signifikantnosti od 5 %

k-1
n-k 1 2 3 4 5 6 8 12 24

1 161,45 199,5 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32
2 18,512 18,999 19,163 19,248 19,298 19,329 19,371 19,414 19,453 19,496
3 10,129 9,552 9,276 9,118 9,014 8,941 8,844 8,744 8,638 8,527
4 7,71 6,945 6,591 6,388 6,257 6,164 6,041 5,912 5,774 5,628
5 6,607 5,786 5,410 5,192 5,050 4,950 4,818 4,678 4,527 4,365
6 5,987 5,143 4,756 4,534 4,388 4,284 4,147 4,000 3,841 3,669
7 5,591 4,737 4,347 4,121 3,972 3,866 3,725 3,574 3,410 3,230
8 5,317 4,457 4,067 3,838 3,688 3,580 3,438 3,284 3,116 2,928
9 5,117 4,256 3,863 3,633 3,482 3,374 3,230 3,073 2,900 2,707
10 4,965 4,103 3,708 3,478 3,326 3,217 3,072 2,913 2,737 2,538
11 4,844 3,982 3,587 3,357 3,204 3,094 2,948 2,788 2,609 2,405
12 4,747 3,885 3,490 3,259 3,106 2,999 2,848 2,686 2,505 2,296
13 4,667 3,805 3,410 3,179 3,025 2,915 2,767 2,604 2,420 2,207
14 4,600 3,739 3,344 3,112 2,958 2,848 2,699 2,534 2,349 2,131
15 4,543 3,683 3,287 3,056 2,901 2,790 2,641 2,475 2,288 2,066
16 4,494 3,634 3,239 3,007 2,853 2,741 2,591 2,424 2,235 2,010
17 4,451 3,592 3,197 2,965 2,810 2,699 2,548 2,381 2,190 1,961
18 4,414 3,555 3,160 2,928 2,773 2,661 2,510 2,342 2,150 1,917
19 4,381 3,522 3,127 2,895 2,740 2,629 2,477 2,308 2,114 1,878
20 4,351 3,493 3,098 2,866 2,711 2,599 2,447 2,278 2,083 1,843
21 4,325 3,467 3,072 2,840 2,685 2,573 2,421 2,250 2,054 1,812
22 4,301 3,443 3,049 2,817 2,661 2,549 2,397 2,226 2,028 1,783
23 4,279 3,422 3,028 2,795 2,640 2,528 2,375 2,203 2,005 1,757
24 4,260 3,403 3,009 2,777 2,621 2,508 2,355 2,183 1,984 1,733
25 4,242 3,385 2,991 2,759 2,603 2,490 2,337 2,165 1,965 1,711
26 4,225 3,369 2,975 2,743 2,587 2,474 2,321 2,148 1,947 1,691
27 4,210 3,354 2,961 2,728 2,572 2,459 2,305 2,132 1,930 1,672
28 4,196 3,340 2,947 2,714 2,558 2,445 2,292 2,118 1,915 1,654
29 4,183 3,328 2,934 2,702 2,545 2,432 2,278 2,104 1,901 1,638
30 4,183 3,328 2,934 2,702 2,545 2,432 2,278 2,104 1,901 1,638
40 4,085 3,238 2,839 2,606 2,449 2,336 2,180 2,004 1,793 1,509
60 4,001 3,151 2,758 2,525 2,368 2,254 2,097 1,918 1,700 1,389
120 3,946 3,072 2,680 2,447 2,290 2,175 2,016 1,834 1,608 1,254

3,841 2,996 2,605 2,372 2,214 2,098 1,938 1,752 1,517 1,000










166

Izvod iz Snedecorove F-distribucije (za analizu varijanse)
Granine vrednosti F na nivou signifikantnosti od 1 %

k-1
n-k 1 2 3 4 5 6 8 12 24

1 4052,1 4999,0 5403,5 5625,1 5764,1 5859,4 5981,4 6105,8 6234,2 6366,5
2 98,495 99,008 99,167 99,247 99,305 99,325 99,365 99,425 99,464 99,504
3 34,117 30,815 29,459 28,709 28,236 27,910 27,489 27,053 26,597 26,122
4 21,200 18,001 16,693 15,978 15,521 15,208 14,800 14,374 13,930 13,464
5 16,258 13,274 12,059 11,391 10,966 10,672 10,266 9,888 9,467 9,019
6 13,744 10,924 9,779 9,149 8,746 8,465 8,101 7,718 7,313 6,880
7 12,346 9,546 8,452 7,846 7,460 7,191 6,840 6,469 6,074 5,650
8 11,295 8,649 7,591 7,006 6,631 6,371 6,029 5,667 5,279 4,859
9 10,561 8,022 6,992 6,423 6,057 5,802 5,467 5,111 4,730 4,311
10 10,044 7,560 6,552 5,994 5,636 5,386 5,057 4,706 4,327 3,909
11 9,647 7,205 6,217 5,668 5,317 5,069 4,745 4,397 4,021 3,602
12 9,330 6,927 5,953 5,412 5,064 4,820 4,500 4,156 3,780 3,361
13 9,074 6,701 5,740 5,205 4,862 4,620 4,302 3,961 3,586 3,165
14 8,862 6,514 5,563 5,035 4,695 4,456 4,140 3,800 3,427 3,005
15 8,683 6,359 5,417 4,893 4,556 4,318 4,004 3,668 .3,294 2,869
16 8,532 6,227 5,292 4,772 4,437 4,201 3,889 3,553 3,181 2,753
17 8,400 6,112 5,185 4,669 4,336 4,102 3,791 3,455 3,083 2,653
18 8,285 6,013 5,092 4,579 4,248 4,015 3,706 3,370 2,999 2,566
19 8,184 5,926 5,010 4,501 4,170 3,939 3,631 3,296 2,925 2,489
20 8,096 5,849 4,938 4,431 4,103 3,871 3,565 3,231 2,859 2,421
21 8,017 5,780 4,875 4,368 4,042 3,811 3,506 3,173 2,801 2,360
22 7,944 5,719 4,816 4,314 3,988 3,759 3,453 3,121 2,749 2,305
23 7,881 5,663 4,765 4,264 3,939 3,710 3,406 3,074 2,702 2,256
24 7,823 5,614 4,718 4,218 3,895 3,666 3,363 3,031 2,659 2,210
25 7,770 5,568 4,676 4,177 3,855 3,627 3,324 2,993 2,620 2,169
26 7,722 5,527 4,637 4,140 3,818 3,591 3,288 2,958 2,585 2,132
27 7,677 5,488 4,601 4,106 3,785 3,558 3,256 2,925 2,551 2,096
28 7,636 5,453 4,568 4,074 3,754 3,528 3,226 2,896 2,522 2,064
29 7,597 5,421 4,538 4,045 3,726 3,599 3,198 2,869 2,494 2,034
30 7,563 5,390 4,510 4,018 3,699 3,474 3,173 2,843 2,469 2,006
40 7,314 5,179 4,312 3,828 3,513 3,291 2,993 2,665 2,287 1,805
60 7,077 4,978 4,126 3,649 3,339 3,119 2,823 2,496 2,115 1,601
120 6,851 4,786 3,949 3,479 3,173 2,956 2,663 2,336 1,950 1,380

6,635 4,605 3,782 3,320 3,017 2,802 2,511 2,182 1,791 1,000









167


Vrednost Q za p=0,05

Stepeni Broj grupa
slobode 2 3 4 5 6 7 8 9 10
1 18,00 26,70 32,80 37,20 40,50 43,10 45,40 47,30 49,10
2 6,09 8,28 9,80 10,89 11,73 12,43 13,03 13,54 13,99
3 4,50 5,88 6,83 7,51 8,04 8,47 8,85 9,18 9,46
4 3,93 5,00 5,76 6,31 6,73 7,06 7,35 7,60 7,83
5 3,61 4,54 5,18 5,64 5,99 6,28 6,52 6,74 6,93
6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32 6,49
7 3,34 4,16 4,68 5,06 5,35 5,59 5,80 5,99 6,15
8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92
9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74
10 3,15 3,88 4,33 4,66 4,91 5,12 5,30 5,46 5,60
11 3,11 3,82 4,26 4,58 4,82 5,03 5,20 5,35 5,49
12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,40
13 3,06 3,73 4,15 4,46 4,69 4,88 5,05 5,19 5,32
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25
15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,20
16 3,00 3,65 4,05 4,34 4,56 4,74 4,90 5,03 5,15
17 2,98 3,62 4,02 4,31 4,52 4,70 4,86 4,99 5,11
18 2,97 3,61 4,00 4,28 4,49 4,67 4,83 4,96 5,07
19 2,96 3,59 3,98 4,26 4,47 4,64 4,79 4,92 5,04
20 2,95 3,58 3,96 4,24 4,45 4,62 4,77 4,90 5,01
24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92
30 2,89 3,48 3,84 4,11 4,30 4,46 4,60 4,72 4,83
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,74
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65
120 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47 4,56

2,77 3,32 3,63 3,86 4,03 4,17 4,29 4,39 4,47
















168



Granine vrednosti koeficijenta linearne korelacije

Stepeni slobode
Verovatnoa nulte hipoteze
p=0,05 p=0,01
1 0,997 1,000
2 0,950 0,990
3 0,878 0,959
4 0,811 0,917
5 0,755 0,875
6 0,707 0,834
7 0,666 0,798
8 0,632 0,765
9 0,602 0,735
10 0,576 0,708
11 0,553 0,684
12 0,532 0,661
13 0,514 0,641
14 0,497 0,623
15 0,482 0,606
16 0,468 0,590
17 0,456 0,575
18 0,444 0,561
19 0,433 0,549
20 0,423 0,537
21 0,413 0,526
22 0,404 0,515
23 0,396 0,505
24 0,388 0,496
25 0,381 0,487
30 0,349 0,449
40 0,304 0,393
50 0,273 0,354
60 0,250 0,325
120 0,173 0,227
S.S. = N-2 N=broj parova










169




Granine vrednosti koeficijenta Rang korelacije

Broj parova (N)
Nivo znaajnosti
0,05 0,01
5 1,000 -
6 0,886 1,000
7 0,786 0,929
8 0,738 0,881
9 0,683 0,833
10 0,648 0,794
12 0,591 0,777
14 0,544 0,715
16 0,506 0,665
18 0,475 0,625
20 0,450 0,591
22 0,428 0,562
24 0,409 0,537
26 0,392 0,515
28 0,377 0,496
30 0,364 0,478























170
LITERATURA


1. Altman D. Practical Statistics For Medical Research. London,
Chapman and Hall, 1991.
2. Armitage P, Berry G, Matthews JNS: Statistical Methods in Medical
Research, ed 4. Oxford, Blackwell Science, 2002.
3. Geller N. Advances in Clinical Trial Biostatistics. New York, Marcel
Dekker, 2004.
4. Kirkwood B, Sterne J. Essential Medical Statistics. Oxford, Blackwell
Science, 2003.
5. Lilienfeld AM, Lilienfeld DE: Foundations of Epidemiology, ed 3.
New York, Oxford University Press, 1994.
6. Markovi O, Janoevi S, Markovi N, Dotli R, Eri-Marinkovi J,
Raki Lj. Medicinska statistika. Beograd, 1998.
7. Matthews D, Farewell V. Using and Understanding Medical Statistics,
ed 4. Basel, Karger, 2007.
8. McNeil D: Epidemiological Research Methods. New York, Wiley,
1996.
9. Pirc B, Milat D. Osnove istraivanja u zdravstvu. Zagreb, 1975.
10. Sackett DL, Haynes RB, Guyatt GH, Tugwell P: Clinical
Epidemiology: A Basic Science for Clinical Medicine, ed 2. London,
Little, Brown, 1991.
11. Staniic V. Osnovne statistike metode za medicinare. Ni, 1995.
12. Stanii V, Rani V. Praktikum i repetitorijum statistike
metodologije za medicinare sa zadacima za vebanje. Ni, 1996.
13. Weiss NS: Clinical Epidemiology: The Study of the Outcome of
Illness, ed 2. New York, Oxford University Press, 1996.
14. Whitehead J: The Design and Analysis of Sequential Clinical Trials, ed
2. New York, Horwood, 1991.











Sadraj


1. MEDICINSKA STATISTIKA......................................................................... 5
1.1. Definicija i predmet prouavanja .............................................................. 5
1.2. Razlike u prouavanju ive i neive prirode ............................................. 6
1.3. Teorija verovatnoe i zakon velikih brojeva............................................. 6
1.3.1. Verovatnoa a priori........................................................................... 8
1.3.2. Verovatnoa a posteriori .................................................................... 8
1.3.3. Puasonov zakon velikih brojeva......................................................... 9
2. STATISTIKO SREIVANJE I PRIKAZIVANJE PODATAKA.............. 10
2.1. Tipovi podataka....................................................................................... 10
2.2. Merne skale ............................................................................................. 11
2.3. Metode prikupljanja podataka................................................................. 12
2.4. Metode sreivanja podataka.................................................................... 13
2.5. Prikazivanje podataka ............................................................................. 16
2.5.1. Tabelarno prikazivanje podataka ..................................................... 16
2.5.2. Grafiko prikazivanje podataka ....................................................... 17
2.6. Primenjena statistika u MS Excelu.......................................................... 20
3. RELATIVNI BROJEVI ................................................................................. 26
3.1. Indeksi strukture...................................................................................... 26
3.2. Koeficijenti intenziteta ............................................................................ 28
3.3. Indeksi dinamike ..................................................................................... 30
4. MERE CENTRALNE TENDENCIJE SREDNJE VREDNOSTI .............. 33
4.1. Aritmetika sredina prosek................................................................... 33
4.2. Medijana.................................................................................................. 38
4.3. Modus...................................................................................................... 40
4.4. Meusobni odnos mera centralne tendencije .......................................... 41
4.5. Mere centralne tendencije - izraunavanje u MS Excelu........................ 42
5. MERE VARIJABILNOSTI DISPERZIJE.................................................. 44
5.1. Apsolutne mere disperzije....................................................................... 45
5.1.1. Interval varijacije rang (opseg) vrednosti...................................... 45
5.1.2. Interkvartilna razlika ........................................................................ 45
5.1.3. Varijansa i standardna devijacija...................................................... 47
5.2. Relativne mere disperzije........................................................................ 50
5.2.1. Koeficijent varijacije........................................................................ 50
5.2.2. Standardizovano odstupanje............................................................. 51
5.3. Mere varijabiliteta - izraunavanje u MS Excelu.................................... 52
6. TEORIJSKE RASPODELE VEROVATNOA ........................................... 59
6.1. Binomna distribucija verovatnoe........................................................... 60
6.2. Puasonova distribucija............................................................................. 61
6.3. Normalna distribucija.............................................................................. 62
6.4. Standardizivana normalna distribucija.................................................... 65
6.5. t - distribucija .......................................................................................... 69

6.6. Hi kvadrat (2) distribucija ..................................................................... 70
6.7. F distribucija............................................................................................ 72
7. TESTIRANJE HIPOTEZA I PROCENA PARAMETARA POPULACIJE
NA OSNOVU UZORKA................................................................................... 73
7.1. Uzorak..................................................................................................... 74
7.1.1. Jednostavan sluajan uzorak ............................................................ 75
7.1.2. Sistematski uzorak............................................................................ 75
7.1.3. Viestepeni uzorak ........................................................................... 75
7.1.4. Stratifikovani uzorak........................................................................ 76
7.1.5. Viefazni uzorak............................................................................... 76
7.1.6. Klaster uzorak .................................................................................. 77
7.2. Distribucija aritmetikih sredina jednakih uzoraka................................. 77
7.3. Standardna greka aritmetike sredine.................................................... 78
7.4. Distribucija proporcija jednakih uzoraka ................................................ 79
7.5. Interval pouzdanosti ................................................................................ 79
7.5.1. Interval pouzdanosti (poverenja) za aritmetiku sredinu................. 79
7.5.2. Interval pouzdanosti za proporciju................................................... 80
7.5.3. Procena skjunisa i kurtozisa populacije na osnovu uzorka .............. 80
7.6. Polazne osnove za izraunavanje veliine uzorka................................... 83
7.6.1. Odreivanje najvanijih obeleja ispitivanja ................................... 83
7.6.2. Kontrola greke procene................................................................... 83
7.6.3. Odreivanje varijabilnosti ispitivanih obeleja................................ 85
7.6.4. Obuhvat uzorka istraivanjem.......................................................... 86
7.7. Odreivanje adekvatne veliine uzorka .................................................. 87
7.7.1. Aritmetika sredina ili proporcija osnovnog skupa.......................... 87
7.7.2. Procena razlike izmeu dve srednje vrednosti ................................. 88
7.7.3. Procena razlike izmeu dve proporcije ............................................ 89
7.7.4. Poreenje vie od dve grupe ispitanika............................................ 90
7.7.5. Zavisni uzorci ................................................................................... 91
7.7.6. Korelaciona i regresiona analiza ...................................................... 92
7.7.7. Analiza vremena do nastanka dogaaja (analiza preivljavanja)..... 92
7.7.8. Korienje nomograma .................................................................... 93
7.7.9. Internet kalkulatori ........................................................................... 95
8. OSNOVE KORIENJA PROGRAMSKOG PAKETA SPSS.................... 97
9. STUDENTOV T-TEST................................................................................ 102
9.1. t-test razlike izmeu aritmetikih sredina osnovnog skupa i uzorka .... 104
9.2. t-test razlike izmeu aritmetikih sredina dva velika nezavisna uzorka 108
9.3. t-test razlike izmeu aritmetikih sredina dva velika zavisna uzorka... 111
9.4. t-test razlike izmeu aritmetikih sredina dva mala nezavisna uzorka . 112
9.5. t-test razlike izmeu aritmetikih sredina dva mala zavisna uzorka..... 114
9.6. t-test proporcije ..................................................................................... 118
10. NEPARAMETRIJSKI TESTOVI.............................................................. 121
10.1. Hi kvadrat (_
2
) test .............................................................................. 121
10.1.1.
2
test rasporeda frekvencija (test slaganja) ................................ 122

10.1.2.
2
test nezavisnosti ...................................................................... 125
10.1.3. _
2
test homogenosti ...................................................................... 130
10.2. Mantel - Haenzel-ov _
2
test................................................................. 132
10.3. Fisher-ov test tane verovatnoe......................................................... 132
10.4. Mc Nemar-ov test................................................................................ 133
10.5. Aditivno dejstvo _
2
testa..................................................................... 136
11. REGRESIONA I KORELACIONA ANALIZA........................................ 140
11.1. Regresiona analiza............................................................................... 140
11.2. Korelaciona analiza............................................................................. 145
11.3. Spearman-ov koeficijent rang korelacije............................................. 150
12. JEDNOSTRANA ANALIZA VARIJANSE ONE WAY ANOVA ...... 155
PRILOG ........................................................................................................... 162
LITERATURA................................................................................................. 170

You might also like