Professional Documents
Culture Documents
Izdava
ISA - Informatiki savez Republike Srpske
Za izdavaa
Prof. dr Rade Tanjga, predsjednik
Tehniki urednik
Mitja Tanjga
Naslovna strana
Dragan Drobac
tampa
Grafid Banja Luka
Predgovor
Knjiga Statistika rezultat je realizacije nastave iz predmeta Statistika na
Banjaluka College u Banjoj Luci.
Knjiga je namjenjena studentima prve godine i kao takva u potpunosti slijedi
nastavni plan i program.
U knjizi je napravljen pokuaj da se statistika posmatra ne samo i nuno kao
matamatika disciplina, ve prije svega kao metodologija i skup alata za
rjeavanje nematematikih problema. Zbog toga su izvoenja i dokazi
pojedinih tvrdnji svedeni na minimum, a panja je usmjerena na nain
statistikog miljenja i povezivanja tog naina miljenja sa strukom
(menadmentom, ekonomijom, raunarstvom i informatikom).
Da bi se ovaj koncept udbenika ostvario svaka izloena cjelina potkrepljena
je sa vie konkretnih primjera. Najvie je primjera iz medicine, to je i
razumljivo s obzirom na autorovo iskustvo u realizaciji nastave za
medicinare u periodu 1998-2010.
Sadraj:
1.
Uvod
1.1. Pojam i definicija statistike
1.2. Razvoj statistike
1.3. Klasifikacija statistike
1.4. Statistika metodologija
1.5. Osnovni statistiki pojmovi
1.6. Uvod u medicinsku statistiku
2.
Deskriptivna statistika
2.1. Prikupljanje podataka
2.1.1. Odreivanje cilja istraivanja
2.1.2. Mjerne skale
2.1.3. Metode prikupljanja podataka
2.2. Sreivanje, grupisanje i prikazivanje podataka
2.2.1. Grupisanje podataka
2.2.2. Tabelarno prikazivanje statistikih podataka
2.2.3. Grafiko prikazivanje statistikih podataka
2.2.4. Dijagrami
2.3. Deskriptivna statistika (statistiko opisivanje)
2.3.1. Relativni brojevi
2.3.2. Mjere centralne tendencije
2.3.3. Mjere varijabliteta
2.3.4. Mjere oblika distribucije
3.
Analitika statistika
3.1. Statistika analiza
3.1.1. Ispitivanje razlike
3.1.2. Greke u zakljuivanju
3.1.3. Jaina, efikasnost i osjetljivost metoda
3.1.4. Analitiki metodi
3.2. Teorijska statistika
3.2.1. Vjerovatnoa
3.2.2. Sluajna varijabla i distribucija vjerovatnoe
4.
Uzorak i statistike uzorka
4.1. Izbor uzorka
4.2. Statistika uzorka
5.
Ispitivanje razlike
5.1. Parametarski metodi za ispitivanje razlike
5.1.1. Zed test
5.1.2. Studentov t-test
5.1.3. Zakljuak
5.2. Neparametarski metodi za ispitivanje razlike
4
6
6
7
9
10
14
18
25
25
25
26
28
30
30
40
47
54
77
77
81
106
124
131
131
136
146
149
151
154
154
175
256
256
271
313
314
314
319
328
329
330
332
334
347
350
350
351
351
351
351
354
358
375
377
377
380
384
384
385
390
401
1. Uvod
1.1. Pojam i definicija statistike
Rije statistika, po svim izvorima, najvjerovatnije vodi porijeklo od
latinske rijei status to znai stanje. Najprije se upotrebljavala da oznai
rezultat registrovanja numerikih podataka o posmatranoj pojavi.
Pojam statistika kao naziv nove nauke prvi je sredinom 18. vijeka (1748)
upotrebio Gotfrid Ahenval (Gottfried Achenvall; 1719-1772), profesor
Univerziteta u Getingenu kad je sistemu numerikog opisivanja drave,
njenih funkcija i elemenata, dao naziv statistika.
Od profesora Gotfrida do danas statistika se do te mjere razvila da je
nadmaila svoje prvobitno znaenje. Danas, moderna statistika ima vie
znaenja.
Pod statistikom se, s jedne strane, podrazumijeva rezultat rada statistikih
slubi na prikupljanju, sreivanju, opisivanju i objavljivanju podataka.
S druge strane, statistika podrazumijeva i obuhvata nauno istraivaku
metodologiju i rezultate njene primjene.
Ovdje emo se pozabaviti statistikom kao naunim metodom i
metodologijom istraivanja. Statistika je, kao nauni metod, grana opte
naune metodologije. Meutim, s obzirom na injenicu da je statistika
neophodna u svim naunim istraivanjima i istraivanjima uopte, moe se
slobodno rei da je statistika osnovna grana opte naune metodologije.
U tom smislu, statistika je metod kvantitativnog istraivanja masovnih
pojava. Vodei rauna o injenici da se statistiki metod prilogoava
specifinostima i ciljevima istraivanja naune discipline gdje se
primjenjuje, statistika se moe definisati i kao sistematizovani skup znanja o
statistikim metodama.
Dakle, statistika je, kao nauni metod, grana opte naune metodologije koja
predstavlja sistematizovani skup znanja o statistikim metodama
kvantitativnog istraivanja masovnih pojava.
1.2. Razvoj statistike
Razvojni put statistike, od prapoetaka do danas, veoma je dug i iznosi
priblino oko 6000 godina.
U svom razvoju statistika se najprije razvijala kao potreba organizovanih
drutvenih zajednica - kao praksa.
Statistika praksa, a time i statistika uopte, primijenjivana je kod
prebrojavanja stanovnitva u Kini (4000 godina p.n.e.) i u Egiptu (3000
6
NUMERIKA
ATRIBUTIVNA
KONTINUIRANA
DISKONTINUIRANA
DISKONTINUIRANA
RJEENJE
BROJANJE
OPIS
13
18
2. Deskriptivna statistika
Statistike metode istraivanja masovnih pojava mogu se podijeliti u dvije
osnovne grupe. Prva grupa obuhvata metode prikupljanja, sreivanja i
prikazivanja podataka i metode odreivanja parametara skupova podataka.
Ova grupa spada u domen deskriptivne statistike.
Drugoj grupi pripadaju metode statistike analize, iji je osnovni zadatak
objanjenje varijabiliteta pomou klasifikacionih, korelacionih i drugih
statistikih pokazatelja, kao i statistiko zakljuivanje na osnovu uzorka.
Ovim metodama bavi se analitika statistika i statistika zakljuivanja
(inferencijalna statistika), koja se, meutim, ne moe strogo razgraniiti od
deskriptivne statistike.
2.1. Prikupljanje, sreivanje i obrada statistikih podataka
2.1.1. Odreivanje cilja istraivanja
U prvoj etapi statistikog istraivanja rjeavaju se metodoloki problemi
istraivanja. Odreuju se: problem i predmet, cilj i hipotetiki okvir,
jedinice, obiljeja, vrijeme posmatranja, instrumenti istraivanja, eme
grupisanja i obrade i drugo. Prije svega se definie problem i postavlja cilj
istraivanja, jer od njih zavise i metodoloko-tehnike i organizacione
osnove istraivanja.
Problem i cilj se moraju postaviti jasno, konkretno i precizno, kako bi se to
bolje definisali predmet istraivanja, obiljeja i jedinice posmatranja.
Nejasno definisan problem i cilj moe dovesti kako do suvinih pitanja, to
dodatno optereuje i poskupljuje statistiko istraivanje, tako i do isputanja
pitanja neophodnih za dobijanje rezultata zbog kojih se statistiko
istraivanje sprovodi.
Planom prikupljanja podataka odreuju se i definiu modaliteti istraivanja i
dogaaji koji e se obuhvatiti, a u sklopu njihovih definicija i nain mjerenja
i iskazivanja. Mjerenje nije uvijek mogue izvriti sa istom preciznou.
Nivo mjerenja zavisi od prirode same pojave i posmatranih obiljeja. Tako
se uspjeh studenata, na primjer, moe mjeriti i iskazivati opisno (odlian,
vrlo dobar, dobar, dovoljan, slab) ili brojano (10, 9, 8, 7, 6, 5). Radnike
moemo razvrstati na nekvalifikovane (NKV), kvalifikovane (KV), visoko
kvalifikovane (VKV), i (ili) na kvalifikovane, polukvalifikovane i
nekvalifikovane, zavisno od cilja istraivanja. Tjelesnu temperaturu moemo
19
24
(f)
14
10
5
2
1
2
1
35
(f)
20
9
3
3
35
(f)
11
8
8
1
2
1
2
1
23
nulom. Kod sva tri sluaja grupisanja postupak je ispravan, ali se postavlja
pitanje koju irinu intervala odabrati. Kad su u pitanju jedinice posmatranja
koje podlijeu dekadskom zakonu prirodno je odabrati interval koji odgovara
dekadskoj mjeri, dok vrijeme treba uzimati sa intervalima vremenskih
jedinica itd.
Primjer 2.
Grupisati vrijednosti hemoglobina 10 zdravih osoba: 150,5 - 170,2 - 130,8 160,2 - 120,3 - 160,5 - 150,7 - 160,7 - 140,2 gr/l.
Tabela 2.2.1.2: Grupisanje hemoglobina grupisanje sa irinom intervala od
20 gr/l.
Hemoglobin
120,0 - 130,9
140,0 - 150,9
160,0 - 170,9
Ukupno
Broj osoba
//
///
/////
-----------
(f)
2
3
5
10
26
Broj osoba
//
////
/////
///// /
//
/
----------------
(f)
2
4
5
6
2
1
20
Broj pacijentica
///// ///// ///// /////
///// ///// ///// ///
///// ///
///
/
-------------
27
(f)
38
8
3
1
50
Broj pozitivnih
reakcija
///// //
////
/////
(f)
7
4
5
16
Apsolutne frekvencije
Pojedinane
Kumulativne
4
4
6
10
3
13
2
15
1
16
1
17
17
/
Relativne frekvencije
Pojedinane
Kumulativne
0,235
0,235
0,353
0,588
0,176
0,764
0,118
0,882
0,059
0,941
0,059
1
1
/
30
Predkolona
Tabela br.
Kolona
Naziv institucije
ZAGLAVLJE
Redni broj kolone
Red
Zbir po redovima
Rubrika
Zbir po kolonama
Ukupan zbir
Izvor podataka
Potpis
Primjer 1.
Kod dvadeset sluajno izabranih bolesnika hematolokog odjeljenja Interne
klinike pregledom krvi utvreno je sljedee pripadnitvo krvnim grupam
AB0 i Rh sistema: od 14 Rh pozitivnih 5 bolesnika imalo je 0, 3 A, 4 B i 2
AB grupu, a od 6 Rh negativnih krvnu grupu 0 imalo je 2, A 2, B 1 i AB 1
bolesnik. Dobijene rezultate prikazati tabelom.
31
Rh
1
Pozitivni
Negativni
Svega
0
2
5
2
7
Krvne grupe
A
B
3
4
3
4
2
1
5
5
AB
5
2
1
3
Ukupno
6
14
6
20
Stadijum
0
1
2
3
4
5
1
Prvi
Drugi
Trei
etvrti
Ukupno
Broj
bolesnica
2
5
90
87
182
Tabela sadri jednu statistiku seriju pa prema tome pripada grupi prostih
tabela. Istovremeno ona je i elementarna tabela jer je obeleje (oboljenje)
ralanjeno u grupe (stadijumi).
Primjer 3.
Tabela 2.2.2.4: Distribucija oboljenja studenata registrovana u Zavodu za
mentalno zdravlje u Beogradu u periodima 1968/71. i 1972/75. godine.
Redni broj
Dijagnoza
0
1
2
3
4
5
6
1
Neuroze
Psihoze
Psihosomatski poremeaji
Epilepsija
Druge dijagnoze
Svega
Period
Prvi
Drugi
2
3
835
1243
61
54
252
283
1
28
716
938
1865
2546
Ukupno
4
2078
115
535
29
1654
4411
33
Slika 2.2.3.1: Prikaz pomou stereorama: kocka B dva puta vea od kocke A
Ako je ipak, iz nekog razloga, potrebno trodimenzinalno prikazivanje, tada
se najbolji nain kojim se izbjegava pomenuti nedostatak sastoji u tome da se
razliite vrijednosti prikau sabiranjem jednakih zapreminskih jedinica.
Na primjer, ako je pojava A tri puta vea od pojave B prva e se prikazati
jednom kockom, a druga sa tri kocke jednake meu sobom i istovjetne sa
kockom koja prikazuje veliinu pojave A.
35
II (-,+)
I (+,+)
B (-3,5)
A (2,3)
IV (+,-)
III (-,-)
Slika 2.2.3.3: Pravougli koordinatni sistem
R2
R1
POLARNA OSA
37
r
Slika 2.2.3.5: Kruni koordinatni sistem
Na brojne ose koordinatnog sistema mogu se nanositi razliite mjerne skale.
Najee su u upotrebi aritmetika i logaritamska skala. Aritmetika skala se
karakterie istovjetnim jedininim duinama na brojnoj osi koje odgovaraju
istim razlikama u veliini pojave. Na primer, razmak izmeu 3 i 4 isti je kao
i razmak izmeu 5 i 6 ili pak razmak izmeu 10 i 15 jednak je razmaku od
20 i 25 itd. Logaritamska skala za razliku od aritmetike nema iste razmake
na brojnoj osi, ve su one u nekom odnosu (u nekoj razmjeri, logaritamskoj)
pa prema tome ne odgovaraju istim razlikama u veliini pojave. Na primjer
razmak od 1 do 10 je isti kao i onaj od 10 do 100 i od 100 do 1000 ili je
odnos takav da je razmak od 2 do 4 isti kao od 4 do 8, od 8 do 16, itd.
U zavisnosti od vrste mjerne skale sa brojnim osama dobijaju se razliiti
koordinatni sistemi, ali i razliiti papiri za grafiko prikazivanje. Ako je na
obe brojne ose nanesena skala sa aritmetikom podjelom u milimetrima
dobija se milimetarski koordinatni sistem i papir. Logaritamski koordinatni
system i papir je onaj koji na obima osama ima logaritamsku skalu, a
semiliogaritmski koordinatni sistem i papir je onaj kod kojeg je jedna brojna
osa razmjerena po aritmetikoj, a druga po logaritamskoj skali. Pri izboru
mjerne skale brojnih osa treba voditi rauna o tome ta se prikazuje (tj.
kakve vrste i u kakvom odnosu su empirijski podaci) i kakva se analiza eli.
Bez obzira na vrstu sistema i dijagrama, pravilno odabranih i obiljeenih, pri
grafikom prikazivanju moraju se potovati neki osnovni zajedniki principi.
Treba izbjegavati da se na jednom grafikonu ucrtava vie linija ako se time
gubi osnovna funkcija grafikog prikazivanja, mogunost usporeivanja i
praenja kretanja prikazanih pojava. Pri konstrukciji grafikona mora se
38
39
Primjer 1.
Data je distribucija frekvencija 29 zdravih osoba u odnosu na nivo
fibrinogena. Prikazati je grafiki.
Tabela 2.2.4.1: Distrubucija frekvencija zdravih osoba u odnosu na
fibrinogen
Broj
ispitanika
(f)
4
3
7
4
6
2
2
1
29
Fibrinogen
(g/l)
2,00 - 2,49
2,50 - 2,99
3,00 - 3,49
3,50 - 3,99
4,00 - 4,49
4,50 - 4,99
5,00 - 5,49
5,50 - 5,99
Ukupno
40
Primjer 2.
Prikazati histogramom frekvencija podatke o distribuciji bolesnika od ulkusa
po godinama starosti.
Tabela 2.2.4.2: Distrubucija bolesnika od ulkusa u odnosu godine starosti
Godine ivota Broj bolesnika (f)
20 - 24
60
25 - 34
100
35 - 49
210
50 - 69
320
70 - 74
40
Ukupno
730
Konani rezultati su sljedei iznosi frekvencija: 60, 50, 70, 80 i 40. One
predstavljaju nove ordinate. Da bi konstrukcija ovog dijagrama do kraja bila
ispravna treba obratiti panju koliko se jedininih duina nanosi na apcisnu
osu za svaki grupni interval.
Histogram frekvencija je vrlo precizan u prikazivanju distribucije frekvencija
numerikih kontinuiranih obiljeja. Meutim, ovaj dijagram ima i jedan
nedostatak. Histogram frekvencija nije pogodan kada treba vriti grafika
poreenja. U ovom sluaju preglednost je smanjena.
Poligon frekvencija
Poligonom frekvencija se prikazuje stanje numerikih, prekidnih i
neprekidnih obiljeja. On pripada grupi linijskih dijagrama. Konstruie se u
pravouglom koordinatnom sistemu na taj nain da se grupni intervali,
odnosno grupe obiljeja nanose na apcisnu osu, a frekvencije, odnosno broj
sluajeva u klasnom intervalu ili grupi, na ordinatnu osu.
Poligon se dobija tako da se iz sredine grupnih intervala ili iz grupa diu
ordinate na koje se nanose odgovarajue frekvencije koje se oznaavaju
nekim znakom (taka, krui, zvjezdica). Spajajui oznake na ordinatama
pravom linijom dobija se izlomljena, poligonalna linija.
Primjer 1.
Ispitivan je nivo antihemofilnog globulina (AHG, VIII faktor koagulacije)
kod 9 bolesnika od prave hemofilije (hemofilija A). Dobijenu distribuciju
prikazati pomou poligona frekvencije.
Tabela 2.2.4.3: Distrubucija bolesnika od hemofilije A u odnosu na nivo
antihemofilnog globulina
AHG - A (%)
0,5 - 0,9
1,0 - 1,4
1,5 - 1,9
2,0 - 2,4
2,5 - 2,9
Ukupno
Broj bolesnika
3
2
2
1
1
9
42
Broj elija
2
3
4
83
73
84
Ukupno
240
43
Ulkus
Ulkus
duodeni ventrikuli
3
9
3
2
3
1
3
5
1
15
15
44
elije (%)
Mijeloblasti
Promijelociti
Mijelociti
Metamijelociti
8
13
34
45
45
46
Y-Axis
X-Axis
Broj
umrlih
185
33
22
22
22
284
Kumulativna
frekvencija
185
218
240
262
284
/
Prosjena vrijednost
retikulocita %
2
5
18
30
38
47
15
8
6
3
5
4
4
4
13,50
49
tapiasti dijagram
tapiasti dijagram koristi se za prikazivanje stanja jednog prekidnog
numerikog obiljeja. Pripada grupi linijskih dijagrama i konsturie se u
pravouglom koordinatnom sistemu na taj nain to se grupe nanose na
apcisnu osu, a frekvencija na ordinatnu osu. Dobija se tako to se u visini
ordinate odgovarajue grupe nacrta pravougaonik najmanje mogue irine
(tapi).
Primjer 7.
Prikazati grafiki distribuciju frekvencija 60 bolesnika od ANL (akutne
nelifoblastne leukemije) po broju kura potrebnih za postizanje remisije.
Tabela 2.2.4.10: Distrubucija bolesnika od akutne nelimfoblastne leukemije
u odnosu na broj kura
Broj kura
1
2
3
4
5
6
Ukupno
Broj bolesnika
26
13
11
5
3
2
60
50
Stubiasti dijagram
Stubiasti dijagram se koristi za prikazivanje jednog ili vie atributivnih
obiljeja. Pripada grupi povrinskih dijagrama.
Za razliku od ostalih dijagrama on ima samo jednu brojnu osu i ona obino
odgovara ordinatnoj osi pravouglog koordinatnog sistema. Umjesto na
apscisnu osu obiljeje se nanosi na polupravu koja polazi od nule brojne ose
i nema mjernu skalu. Kao takva ona slui iskljuivo kao podloga za crtanje i
nije oznaena strelicom.
Primjer 8.
Prikazati grafiki Besissovu megakariocitnu diferencijalnu formulu zdravih
osoba.
Tabela 2.2.4.11: Distrubucija megakariocita (%) u odnosu na stadijum
sazrijevanja
Stadijum
sazrijevanja
I
II
III
Megakariociti
(%)
6
21
73
51
Primjer 9.
Aktivnost diaminooksidaze (DAO) u patolokim trudnoama uporediti na
istom dijagramu.
Tabela 2.2.4.12: Distrubucija trudnica
diaminooksidaze u patolokim trudnoama
odnosu
na
aktivnost
Procenat
trudnica kod
kojih je DAO
Normalna
Poviena
Ukupno
Smanjena
Normalna
Poviena
Dijagnoza
RH Senzibilizacija
12
91
111
44
56
40
Nefropatija gravidarum
Hipertenzija areterijalis
Ukupno
9
6
27
34
37
162
4
8
20
47
51
209
33
22
100
21
23
100
20
40
100
odnosu
na
aktivnost
odnosu
na
aktivnost
52
Apsolutna
frekvencija
72
132
8
11
9
7
7
246
53
Procenti
Stepeni
29,27
53,66
3,25
4,47
3,67
2,84
2,84
100,00
105,37
193,18
11,70
16,10
13,21
10,22
10,22
360,00
Broj
13
16
7
36
54
Procenti
36,11
44,45
19,44
100
Polarni dijagram
Polarni dijagram se upotrebljava za prikazivanje kretanja jedne ili vie
pojava u vremenu. Za razliku od linijskog vremenskog dijagrama polarnim
dijagramom prikazuju se cikline pojave. On pripada grupi linijskih
dijagrama a konstruie se u polarnom koordinatnom sistemu na taj nain to
se na radijuse iji je broj odreen veliinom ugla alfa nanosi frekvencija ili
nivo pojava jednog vremenskog perioda.
Spajanjem taaka koje odgovaraju frekvenciji svakog radijusa dobija se
izlomljena linija koja predstavlja polarni dijagram.
Primjer 12.
Prikazati grafiki broj oboljelih od gripa po mjesecima jedne godine i
usporediti ih sa godinjim prosjekom koji iznosi 135 oboljelih po mjesecu.
Tabela 2.2.4.15: Distrubucija oboljelih od gripa po mjesecima
Mjeseci
Januar
Februar
Mart
April
Maj
Jun
Jul
Avgust
Septembar
Oktobar
Novembar
Decembar
Ukupno
Broj oboljelih
160
170
180
170
150
100
80
50
100
130
160
170
1620
LEGENDA
Pismeni
Nepismeni
Simboliki crtei
Simboliki crtei su grafiki prikazi koji slue prvenstveno u propagandne
svrhe. To su popularni prikazi pojava. To su popularni prikazi pojava.
Konstruiu se na taj nain to se slikom pojave prikazuje sama pojava
(veliinom kreveta - broj kreveta u bolnici, izgledom djeteta - njegovo
fiziko stanj itd.). Razlike u intenzitetu moraju se prikazivati razliito
velikim simbolima (po povrini odnosno opsegu) ali je bolje ako se to ini
veim ili manjim brojem simbola jer je takav prikaz kvantitativno lake
uoljiv i statistiki ispravniji. Vjetina je da se za pojavu koju prikazujemo
pronae prikladan simbol koji sam po sebi objanjava pojavu.
56
57
Vb = Vr / Vb
Primjer 1.
Od 233 pacijenta kojima su raene laboratorijske pretrage u laboratoriji
Doma zdravlja kod 158 pacijenata raena je KKS (kompletna krvna slika) i
DKS (diferencijalna krvna slika) dok je kod ostalih pacijenata raena smo
KKS. U kakvom je odnosu broj pacijenata sa KKS i DKS prema ukupnom
broju pacijenata kojima je raen nalaz krvi.
Rb = Vr / Vb = 158/233 = 0,6781
Rezultat dijeljenja broioca imeniocem je decimalni broj. Da bi se olakalo
tumaenje poreenja na osnovu relativnih brojeva s obzirom da je decimalni
broj esto vrlo mali i sa mnogo decimala (to nije pogodno za donoenje
pravilnog zakljuka) on se mnoi sa 100 i izraava u procentima ili se mnoi
sa 1000 i izraava u promilima.
Izraen u procentima rezultat iz prethodnog primjera 0,6781 iznosi 67,81%.
Ukoliko se tako dobijen relativni broj koristi za dalja raunanja uzima se
njegova tana vrijednost, meutim ukoliko se koristi kao konani rezultat
tada se zaokruuje na prvi cijeli broj. Posebno se zaokruivanje radi kad je
rije o parametru kome po njegovoj prirodi ne odgovara decimalni broj (broj
ljudi i slino).
58
Primjer 2.
Na osnovu podataka o broju vakcinisanih (200) i procenta izvrenja plana
vakcinacije (80%) izraunati broj predvienih za vakcinaciju.
Vb = Vr / Rb * 100 = 200 / 80 * 100 = 250
Primjer 3.
Koliki je ukupan procenat djece sa abnormalnim hemoglobinom otkriven u
periodu 6 godina na odreenoj teritoriji ako je u klinikom materijalu
otkriveno 25, odnosno 1%, a u populacionim istraivanjima 26, odnosno
0, 26% djece.
Vb1
2500
Rb1
1
Vb 2
Vr 2 *100 26 *100
10000
Rb 2
0,26
Vr Vr1 Vr 2 25 26 51
Vb Vb1 Vbr2 2500 10000 12500
Da bi se izraunao zajedniki procenat mora se voditi rauna o veliini baze.
Ako su one jednake po veliini zajedniki procenat moe se lako izraunati
sabiranjem procenata i dijeljenjem toga zbira brojem sabiraka. Ukoliko
bazne vrijednosti nisu jednake (to je na sluaj) zajedniki procenat se
izraunava ili na prikazani nain ili pomou izraza za aritmetiku sredinu
procenta.
Kada se govori o procentima kao najeem nainu izraavanja relativnih
brojeva moe se njegova matematika definicija (procenat je decimalni
razlomak sa imeniocem 100) transformisati u statistiku. Tako se moe rei
da je procenat relativni broj ija baza vrijednosti iznosi 100.
Proporcije
Na isti nain, pomou relativnog broja moe se definisati jo jedan pojam
koji je est u statistici.
Proporcije su relativni brojevi ija je bazna vrijednost jednaka jedinici.
One su uvijek dijelovi neega i ne mogu nikada da prevaziu total koji iznosi
59
- Indeksi strukture
- Koeficjenti
- Indeksi dinamike
60
x
i 1
N
61
x 4 8 6 10 4 32
6,40'
5
5
f
s 1
s k
f
s 1
xs'
s
62
Primjer 2.
Izraunati prosjenu vrijednost frekvencija radijalnog pulsa u minuti
prikazanog distribucijom frekvencija kod 15 zdravih osoba.
x
x'
fx'
60-64
62
124
65-69
67
268
70-74
72
360
75-79
77
231
80-84
82
82
Ukupno
15
1065
s k
f
s 1
s k
f
s 1
xs'
s
1065
71[o / min]
15
xs'
63
Primjer 3.
Koliki je prosjean broj poroaja 12 vierotki. Broj poroaja dat je
distribucijom frekvencija.
X
fx
12
Ukupno
12
34
s k
f
s 1
s k
f
s 1
xs'
s
34
2,833 3
12
a x
i 1
i k
a
i 1
64
sredina, a
a
i 1
13,33 13
43 2
9
13,22
3
3
Ovakav nain je dozvoljen samo ako u svakoj grupi ima isti broj jedinica
posmatranja. Pri izraunavanju ove aritmetike sredine moramo voditi
rauna o bazi, tj. o broju jedinica posmatranja na osnovu koga su izraunate
elementarne aritmetike sredine. Ukoliko grupe imaju razliit broj podataka
izraunavanje se vri preko datog matematikog izraza. Meutim, da je broj
jedinica posmatranja bio isti u svakoj grupi iz koje se izraunava prosta
aritmetika sredina bilo bi dozvoljeno da se aritmetika sredina izraunava
kao kolinik zbira elementarnih aritmetikih sredina i njihovog broja.
Aritmetika sredina relativnih brojeva
Na slian nain izraunava se aritmetika sredina relativnih brojeva. Ako
relativni broj obiljeimo sa P (s obzirom da se najee izraava u
procentima) matematiki izraz za izraunavanje aritmetike sredine
relativnih brojeva imae oblik:
65
a P
i
i 1
ik
a
i 1
Broj oboljelih
Procenat preivjelih
18
51
123
8
78%
61%
18%
0%
i k
a P
i 1
ik
a
i 1
18 * 78 51 * 61 123 *18 8 * 0
18 51 123 8
6729
P 200 33,64 34%
78 61 18 0 157
39,25
4
4
66
( x x min ).
(x
i 1
x ) 2 ( xi x 0 ) 2
i 1
c)
posmatranja;
proita se ili izrauna vrijednost obiljeja koja odgovara
pronaenom srednjem lanu niza jedinica posmatranja.
5
2
2
e 111
990
110
9
1 8 1
4,5
2
2
1,250 1,300
e
1,275
2
f 1
2
Broj osoba
0,48
0,49
0,5
0,51
0,52
Ukupno
1
3
7
4
2
17
Kumulativna
frekvencija
1
4
11
15
17
/
f 1
2
17 1
9
2
e 0,50sek
Primjer 4.
Odrediti medijanu vrijednosti triglicerida /mmol/l/ u plazmi 40 zdravih
osoba prikazanih distribucijom frekvencija
Trigliceridi
(mmol/l)
0,30-0,59
0,60-0,89
0,90-1,19
1,20-1,49
1,50-1,79
Ukupno
Kumulativna
frekvencija
3
10
29
39
40
/
Broj osoba
3
7
19
10
1
40
Sredina grupnog
intervala
0,45
0,75
1,05
1,35
1,65
/
f 1 40 1
20,5
2
2
e 1,05
Mjesto medijane iznosi 20,5 a sama medijana 1,05 mmol/l. Ova vrijednost je
procijenjena zamjenjivanjem svih vrijednosti treeg grupnog intervala
njegovom sredinom.
Za serije grupisanih podataka medijana se dobija interpolacijom izmeu
donje i gornje granice intervala grupe u kojoj se medijana nalazi, tj.:
N
f1
Me l1 2
i
f Me
gdje je:
l1 - donja granica medijalnog intervala,
N - broj lanova posmatrane serije,
f1 - zbir frekvencija predmedijalnog intervala
i - duina medijalnog intervala.
fMe - frekvencija medijalnog intervala
Medijana se ponekad naziva i drugim kvartilom s obzirom na mogunost
podjele jedne serije na etiri jednaka dijela. Ako se serija podataka
rangiranih po veliini podijeli na etiri jednaka dijela, vrijednosti obiljeja
koje ih dijele nazivaju se kvartilima: prvi kvartil Q1, drugi kvartil Q2, trei
kvartil Q3. Na isti nain, ako seriju podijelimo na 10 odnosno na 100
jednakih dijelova dobie se decili odnosno percentili. Svi ovi pokazatelji
odreuju se na slian nain kao i medijana. Tako se, na primjer, za grupisane
podatke prvi i trei kvartil odreuju na osnovu sljedeih izraza:
71
N
f1
Q1 l1 4
i
f Q1
3N
f1
Q3 l1 4
i
f Q3
gdje je:
l1 - donja granica medijalnog intervala,
N - broj lanova posmatrane serije,
f1 - zbir frekvencija do kvartilnog intervala
fQ - frekvencija kvartilnog intervala
i - duina kvartilnog intervala.
Prvi kvartil - Q1 je ona vrijednost obiljeja posmatranja od koje 25%
elemenata skupa ureenih po veliini ima manju ili jednaku vrijednost tog
obiljeja.
Trei kvartil - Q3 je ona vrijednost obiljeja posmatranja od koje 75%
elemenata skupa ureenih po veliini ima manju ili jednaku vrijednost tog
obiljeja.
2. 3. 2. 3. Mod (Modus)
Mod ili tipina, dominantna vrijednost je srednja vrijednost po poloaju. To
je ona vrijednost obiljeja koja se najee javlja. U distribuciji frekvencija
mod je vrijednost obiljeja kojoj odgovara najvea frekvencija, a na
dijagramu ona vrijednost na x osi kojoj odgovara najvea ordinata. Mod se
obiljeava sa Mo.
Kada su date individualne, negrupisane vrijednosti jedinica posmatranja mod
se odreuje jednostavno inspekcijom tj. uoavanjem najvee vrijednosti
obiljeja.
Primjer 1.
Sedam zdravih osoba ima sljedee vrijnosti glikoze u krvi: 5,0; 4,2; 5,4; 5,0;
5,1; 5,4; 5,0 mmol/l. Odrediti modalnu vrijednost.
Mo=5,0 mmol/l
S obzirom da je broj podataka mali vrlo lako se uoava da se vrijednost od
5,0 javlja tri puta, vrijednost od 5,4 dva puta, a po jedanput 4,2 i 5,1 mmol/l.
Prema tome je Mo= 5,0 mmol/l jer se ova vrijednost najee javlja.
Ako su jedinice posmatranja prikazane distribucijom frekvencija po
grupama, mod se takoer lako odreuje uoavanjem vrijednosti obiljeja
grupe kojoj odgovara najvea frekvencija jedinica posmatranja.
72
Primjer 2.
Podaci o prekidu napada paroksizmalne superventrikularne tahikardije kod 9
bolesnika, intravenskom aplikacijom lijeka dati su distribucijom frekvencija.
Odrediti modalnu vrijednost.
Doza lijeka (x)
1/2
3/4
1
Ukupno
Broj bolesnika
1
1
7
9
Mo=1
Modalna vrijednost je jedna doza lijeka jer je kod 7 do 9 bolesnika napad
prekinut ovom dozom.
Ako su jedinice posmatranja prikazane distribucijom frekvencija po grupnim
intervalima aproksimativna modalna vrijednost je sredina onog intervala koji
ima najveu frekvenciju. Meutim, za preciznije odreivanje modalne
vrijednosti u ovom sluaju koristi se sljedei izraz:
f 2 f1
o i
f 2 f1 f 2 f 3
gdje je l donja granica modalnog intervala, i je irina grupnog intervala, f 2
je frekvencija modalnog intervala, f 1 frekvencija prethodnog intervala, a f 3
frekvencija sljedeeg intervala.
Primjer 3.
Odrediti modalnu vrijednost distribucije frekvencija bolesnika od akutnog
miokarda po godinama ivota.
Godine ivota
Broj bolesnika
30-39
40-49
50-59
60-69
70-79
Ukupno:
23
147
102
77
15
364
Mo = 45 godina
73
o 40 10
147 23
47,34
147 23 147 102
x =Me= Mo
sr
o 3e 2 x
75
MoMex
sr
Y-Axis
X-Axis
X MeMo
Serija
(I)
10
8
7
6
7
8
10
Serija
(II)
6
7
10
10
10
7
6
Serija
(III)
16
10
2
0
2
10
16
Serija
(IV)
16
16
10
10
2
2
0
Serija
(V)
8
8
8
8
8
8
8
Serija
(VI)
0
2
8
8
32
0
0
Sve serije imaju istu srednju vrijednost x 8,00 , meutim kako se vidi sa
donjih grafikih prikaza serije se izmeu sebe znatno razlikuju jer nisu
jednako distribuirane.
77
78
SD 2 var ijansa
80
SD 2
i 1
f x
i k
SD 2
iN
i 1
i k
f
i 1
SD
i 1
iN
iN
x
i 1
2
i
i za grupisane podatke
f x
SD
i 1
iN
i k
f
i 1
iN
fx
i 1
i k
f
i 1
2
i
81
xi
xi x
1
2
3
4
5
6
7
8
9
10
Ukupno
4,5
4,1
5,3
4,4
4,7
4
5,5
5,1
6
6,4
50
-0,5
-0,9
0,3
-0,6
-0,3
-1
0,5
0,1
1
1,4
0
xi x
0,25
0,81
0,09
0,36
0,09
1
0,25
0,01
1
1,96
5,82
xi 50
5mmol / l
N
10
SD
xi x
N
5,82
0,76mmol / l
10
x SD 5 0,76mmol / l
Ocjena (x)
1
2
3
4
5
Ukupno
6
7
8
9
10
/
Broj
novoroenadi
3
4
8
5
2
22
x
fx
fx2
18
28
64
45
20
175
108
196
512
405
200
1421
f i xi 175
7,954
fi
22
SD
f i xi2 2
x
fi
SD
1421
7,954 2 1,325 1,151
22
x SD 7,954 1,151
82
Vitalni kapacitet
1000-1999
2000-2999
3000-3999
4000-4999
5000-5999
6000-6999
/
x1
1499
2499
3499
4499
5499
6499
/
osoba. Podaci su
fixi
2998
9996
17495
26994
10998
6499
74980
fi(xi)2
4494002
24980004
61215005
121446006
60478002
42237001
314850020
f i xi 74980
3749
fi
20
SD
2
f i xi2
314850020
x
3749 2 1299,038
fi
20
x SD 3749 1299ml
Obino
se
izraunava
procentima
pa
gornji
izraz
glasi
CV SD / x*100 .
Dakle, koeficjent varijacije je standardna devijacija izraena u procentima
aritmetike sredine.Iz same formule se vidi da je koeficjent varijacije manji
to je standardna devijacija manja u odnosu na aritmetiku sredinu i
obrnuto. Prema tome varijabilitet pojave je utoliko manji ukoliko je manji
koeficjent varijacije.
Kako je varijabilitet pojave obrnuto proporcionalan sa homogenou jedinica
posmatranja to koeficjent varijacije koristimo istovremeno i kao mjeru
homogenosti. Homogenost neke pojave je vea ukoliko je koeficjent
varijacije manji. Pojava je homogena ako je koeficjent varijacije manji od
30% (CV<30%).
Koeficjent varijacije se upotrebljava u sluaju kada se eli utvrditi:
a) u kome obiljeju neka grupa varira vie, a u kome manje;
b) koja od grupa varira vie a koja manje u istom obiljeju.
Primjer 1.
Rezultati mjerenja tjelesne visine i mase 10 studentica su:
84
CV z
SDtm
X tm
*100
3,2
*100 5,16%
62
X X
SDX
zx
xx
sd x
z A z A1 z A2
z B z B1 z B 2
9 7 74 60
2 1 3
1
14
6 7 90 60
1 2,14 1,14
1
14
86
Primjer 2.
Aritmetika sredina i standardna devijacija glikemije ispitanika grupe A
iznosile su 90,0 i 27 mg %, a grupe B 5,0 i 1,5 mmol/l.
Usporediti nivo glikemije ispitanika A3 (117 mg %) i B5 (6,5 mmol/l).
Glikemija ispitanika grupe A odreivana je u starim, a grupe B u novim
jedinicama mjera. Koritenjem zed vrijednosti moe se i bez konverzije
mjernih jedinica, na jednostavniji nain, dobiti odgovor na postavljeno
pitanje.
x x 117 90 27
z A3
1
sd x
27
27
z B5
1
sd x
1,5
1,5
Statistiki parametri
Xsr
SD
4,5
0,9
55,5
11,1
1,4
0,3
90,0
18,0
Jedinica mjere
mmol/l
mg/dl
mmol/l
mg/dl
87
Lipidi
Ukupni holesterol
HDL - holesterol
Trigleceridi
LDH - holesterol
Ukupno
Prosjeno
Zed vrijednost
A
B
(8-4,5)/0,9=3,89
(7-4,5)/0,9= 2,78
(90-55)/11=3,14
(50-55,5)/11=-0,50
(2-1,4)/0,28=2,14
(1,8-1,4)/0,28= 1,43
(115-90)/18=1,39
(100-90)/18= 0,56
3,89+3,14+2,14+1,39=10,56
4,77-0,5=4,47
10,56/4= +2,64
4,27/4= +1,07
a)
88
a3
M3
SD 3
89
x Me Mo
Slika a) Simetri~na distribucija frekvencija
x Me Mo
Slika b) Negativno asimetri~na distribucija frekvencija
Mo Me x
Slika c) Pozitivno asimetri~na distribucija frekvencija
90
S K2
3( x M e )
SD
(Q1 Q3 ) 2M e
Q3 Q1
91
Koficijent spljotenosti
Odnos etvrtog momenta i standardne devijacije na etvrti stepen predstavlja
relativnu mjeru spljotenosti, koja se oznaava sa 4:
M4
SD 4
>3
=3
<3
3.
Analitika statistika
Statistika analiza
Statistika analiza predstavlja posljednju i istovremeno krunsku fazu kako
statistike obrade tako i kompletnog istraivanja. Statistika analiza je
matematiko logiki postupak donoenja zakljuaka o problemu istraivanja,
na osnovu rezultata adekvatno odabranih i pravilno primjenjenih specifinih
statistikih metoda, analitikih metoda. Primjena svakog analitikog metoda
rezultira donoenjem statistikog zakljuka. Statistiki zakljuci donose se
na osnovu egzaktnih matematiko-statistikih pravila odluivanja specifinih
za primjenjeni tip analitikog metoda. Na osnovu statistikog zakljuka
donose se struni zakljuak, u oblasti u kojoj se istrauje, na primjer,
zakljuak u oblasti prirodnih, tehnikih, agronomskih, medicinskih,
drustvenih, humanistikih nauka.
Logiko transponovanje statistikog u struni zakljuak veoma je osjetljiv
tranutak statistike analiza jer interpretacija statistikog zakljuka nije vie
stvar egzaktnih statistikih pravila nego opteg i strunog iskustva i
sposobnosti analitikog rezonovanja istraivaa. Objedinjavanjem znaenja
svih strunih zakljuaka formira se opti, generalizovani zakljuak o
problemu istraivanja. Ukoliko generalizovani zakljuak sadri nove
zakonomjernosti o ispitivanom problemu on postaje teorija bazine nauke u
kojoj je primjenjeno statistiko istraivanje.
Statistiki zakljuci o problemu istraivanja donose se najee na osnovu
ispitivanja reprezentativnog dijela osnovnog skupa tj. na osnovu rezultata
dobijenih obradom podataka iz uzorka. Apsolutna vjerodostojnost (tanost)
ovako dobijenih zakljuaka, odnosno apsolutna podudarnost zakljuka
dobijenog na osnovu uzorka sa zakljukom koji bi se dobio ispitivanjem
osnovnog skupa, moe se slobodno smatrati nevjerovatnim dogaajem.
Zakljuci izvedeni na osnovu ispitivanja uzorka uvijek, manje ili vie,
odstupaju od zakljuaka dobijenih na osnovu ispitivanja osnovnog skupa.
Oni prema tome predstavljaju procjenu pravog stanja ispitivanog problema u
osnovnom skupu. Zbog toga, zakljuci izvedeni na osnovu ispitivanja uzorka
uvijek sa sobom nose mogunost manje ili vee greke. Naunu vrijednost
obezbjeuje im mogunost utvrivanja stepena njihove izvjesnosti tj.
sigurnosti.
93
96
0,025
0,025
0,475
0,475
0,95
-z
- Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1
0
H0
Oblast
prihvatanja H0
+z
+ Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1
98
0,005
0,005
0,495
0,495
0,99
-z
- Zp
H1
H0
Oblast odbacivanja H0 i
prihvatanja H1
+z
+ Zp
H1
Oblast
prihvatanja H0
Oblast odbacivanja H0 i
prihvatanja H1
0,05
0,45
0,5
0,95
-z
- Zp
+ Zp
H1
+z
H0
Oblast odbacivanja H0 i
prihvatanja H1
Oblast
prihvatanja H0
0,001
0,49
0,495
0,99
-z
- Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1
+ Zp
+z
H0
Oblast
prihvatanja H0
99
0,05
0,5
0,45
0,95
-z
+z
+ Zp
0
H0
H1
Oblast odbacivanja H0 i
prihvatanja H1
Oblast prihvatanja H0
0,001
0,5
0,49
0,99
-z
0
H0
Oblast prihvatanja H0
+z
+ Zp
H1
Oblast odbacivanja H0 i
prihvatanja H1
101
Stvarnost
Nulta hipoteza
tana
Nulta hipoteza
pogrena
Greka I vrste ()
Greka II vrste ()
102
105
106
108
Osnovni pojmovi
Za razumjevanje i laki rad sa vjerovatnoama potrebno je definisati neke
osnovne pojmove u radu sa njima.
Vjerovatnoa dogaaja koji je predmet istraivanja naziva se vjerovatnoom
oekivanog dogaaja i oznaava se sa p.
p - vjerovatnoa dogaaja koji je predmet istraivanja
Vjerovatnoa dogaaja koji nije predmet istraivanja naziva se suprotnom
vjerovatnoom i obiljeava se sa q.
q - vjerovatnoa dogaaja koji nije predmet istraivanja (vjerovatnoa
suprotnog dogaaja)
Obe vjerovatnoe, oekivanog i suprotnog dogaaja jesu tzv.
komplementarne parcijalne vjerovatnoe, odnosno komplementarni dijelovi
ukupne, totalne vjerovatnoe i za njih vai da je:
p + q = 1 =100%
Parcijalna vjerovatnoa predstavlja vjerovatnou svakog pojedinanog
ishoda. Ukupna vjerovatnoa koja predstavlja zbir svih parcijalnih
vjerovatnoa istovremeno je i vjerovatnoa sigurnog dogaaja i iznosi 1 ili
100%. Vjerovatnoa nemogueg dogaaja jednaka je nuli.
Dakle, vjerovatnoa se kree u intervalu od 0, kada je oekivani dogaaj
nemogu do 1, odnosno do 100% kada je oekivani dogaaj siguran
(0 p 1).
Prema broju i nainu nastupanja dogaaja razlikuju se vjerovatnoe prostih i
sloenih dogaaja. Vjerovatnoom prostog dogaaja naziva se vjerovatnoa
samo jednog oekivanog dogaaja, tj. elementarnog dogaaja. Prema odnosu
dogaaja razlikuju se vjerovatnoe nezavisnih i zavisnih dogaaja, odnosno
iskljuivih i neiskljuivih dogaaja.
Ako se vjerovatnoa izraunava za dogaaj ije nastajenje ne zavisi od
nastupanja ili nenastupanja nekog drugog dogaaja, radi se o vjerovatnoi
nezavisnog dogaaja. Vjerovatnoe nezavisnih dogaaja esto se nazivaju i
apsolutne vjerovatnoe. Ako se vjerovatnoa izraunava za dogaaj ije
nastupanje zavisi od prethodnog nastupanja ili nenastupanja nekog drugog
dogaaja, radi se o vjerovatnoi zavisnog dogaaja.
U odnosu na iskljuivost dogaaja razlikuju se vjerovatnoe iskljuivih i
neiskljuivih dogaaja. Ako se izraunava vjerovatnoa dogaaja koji se ne
109
p PiliAiliB P A; B P A PB
p PiAiB P A, B P A PB
111
p PiliAiliBbe ziAiB P A; B; A, B
odnosno
p P( A) P( B) P( A) P( B)
Vjerovatnoa sloenog dogaaja (zavisni dogaaji)
Vjerovatnoa sloenog dogaaja da se istovremeno ili sukcesivno dese dva
(ili vie) meusobno zavisna dogaaja jednaka je produktu vjerovatnoa
svakog (i ovog i onog) dogaaja. Vjerovatnoa zavisnog dogaaja P(AB)
dobija se kao produkt apsolutne vjerovatnoe hronoloki prvog dogaaja
(P(A); P(B)) i relativne vjerovatnoe hronoloki drugog dogaaja (P(B/A);
PA/B)).
B
p PiAiBposlij eA P AB P AP
A
A
p PiBiAposlij eB PBA PB P
B
B P AB
P
A P A
A PBA
P
B P B
Uslovna vjerovatnoa je osnovni tip vjerovatnoe u prirodnim naukama, jer
se dogaaji karakteriu uzrono posljedinim odnosima.
ili
112
p PB P A1 B P A2 B P A3 B .... P An B
B
p PB P Ai P
Ai
, k = 1,2,...,n
P B
B
P
A
P
i Ai
113
Primjer 1.
Patronana sestra brine o 25 porodica. Distribucija frekvencija ovih porodica
(f) po broju djece (x) prikazana je tabelarno.
Tabela 3.2.1.1: Distribucija frekvencija porodica po broju djece
r
P X x
P X x
1
2
3
4
5
Ukupno
0
1
2
3
4
/
2
8
10
4
1
25
2/25
8/25
10/25
4/25
1/25
25/25
2/25
10/25
20/25
24/25
25/25
/
p2 P X 1 8
25
0,32 32%
p3 P X 2 10
25
p4 P X 3 4
25
114
0,40 40%
0,16 16%
p 5 P X 4 1
25
0,04 4%
q4
25
0,16
p X 3 1 p X 3 1 0,16 0,84
ili
p X 3 p X 1 p X 2 p X 4 0,84
25
25
p p X 1P X 3 8
2
8 10 4 24
0,96
25
25 25 25 25
p 2 p X 2
10 4
1 15
0,60
25 25 25 25
p3 p1 X 3
8 10 4 22
0,88
25
25 25 25
25 0,043
p 1
0,000064
p P A, B P AP B
p P A; B; A, B P A PB P APB
p 0,44 0,20 0,04 0,60
116
Primjer 2.
Utvreno je da 500 od 10000 mukaraca i 25 od 10000 ena ima daltonizam,
sljepilo za boje (frekvencija daltonizma prema polu je razliita, jer se radi o
X hromozomskoj nasljednoj anomaliji). Kolika je vjerovatnoa da e neka
osoba sa daltonizmom biti mukog pola u ovom osnovnom skupu?
Rjeenje
Ispituje se vjerovatnoa istovremenog javljanja dvije karakteristike kod iste
osobe. Rjeenje se dobije primjenom zakona multiplikacije na zavisne
dogaaje jer se ispituje istovremena pojava dva dogaaja, sljepila za boje i
mukog pola. Apsolutna vjerovatnoa pojave daltonizma:
p P A 500 25
525
0,026
10000 10000
20000
p P AB P AP B
20000
0,025
Primjer 3.
Istraivanja pokazuju da 6% trudnica koje dolaze u savjetovalite za trudnice
ima bakteriuriju (infekciju urinarnog trakta). Kod 30% trudnica sa
bakteriurijom i kod 1% trudnica bez bakteriurije dolazi do razvoja
pijelonefritisa (akutna infekcija gornjeg dijela urinarnog trakta).
Analiziranjem ove empirijske situacije uoava se vmogunost pojave dva
dogaaja. Osnovni dogaaj je pojava bakteriurije (dogaaj A). On ima dva
mogua ishoda: trudnica ima (A1) ili nema (A2) bakteriuriju. Ishodi ovih
dogaaja su iskljuivi i komplementarni pa je:
P A2 1 P A1 1 0,06 0,94
117
0,6569
B
PB
0,0274
118
Primjer 4.
Date su tri kutije. U prvoj su dvije bijele i dvije crne kuglice, u drugoj je
jedna bijela i etiri crne kuglice i u treoj kutiji su tri bijele i dvije crne
kuglice. Nai vjerovatnou da se izvue bijela kuglica iz sluajno odabrane
kutije. Dakle trai se vjerovatnoa dogaaja A (izvuena bijela kuglica), da
je izvuena bijela kuglica ili iz prve ili iz druge ili iz tree kutije.
Rjeenje:
Dogaaji: A - izvuena bijela kuglica; A1 - izvlaenje iz prve kutije;
A2 - izvlaenje iz druge kutije; A3 - izvlaenje iz tree kutije.
1. Vjerovatnoa dogaaja Ai - izvlaenje iz jedna od razpoloivih kutija
P(A1) = P(A2) = P(A3) = 1/3
2. Vjerovatnoa uslovnog dogaaja da je bijela kuglica izvuena iz neke od
kutija
- P(A/A1) = 2/4
- P(A/A2) = 1/5
- P(A/A3) = 3/5
3. Ukupna vjerovatnoa da se desi izvlaenje bijele kuglice ili iz prve ili iz
druge ili iz tree kutije
(P(A) = P(A1)P(A/A1) + P(A2)P(A/A2) + P(A3)P(A/A3) =
= 1/3*2/3 + 1/3*1/5 + 1/3*3/5 = 13/30 = 0,217
Vjerovatnoa da se bijela kuglica izvue iz sluajno odabrane kutije iznosi
P(A) = 0,217
3.2.2. Sluajna varijabla i distribucija vjerovatnoe
3.2.2.1. Sluajna varijabla
Posmatra se statistiki eksperiment koji se sastoji u bacanju dva novia.
Prostor uzorka - skup svih elementarnih dogaaja S sastoji se od 4
elementarna ishoda:
S = [(P,P), (P,G), (G,P), (G,G)]
gdje je: P - pad pisma, G - pad grba.
Posmatrajmo sluaj pojavljivanja grba. Vidi se da se u etiri podjednako
mogua sluaja u jednom sluaju ne pojavljuje nijedanput grb, u dva sluaja
jedanput i u jednom sluaju dva puta.
119
Broj grbova X
P,P
P,G
G,P
G,G
GG
PG
PP
GP
Prostor uzorka
Oznaka
sluajne
varijable
121
Vrijednosti sluajne
varijable
Broj vrijednosti
sluajne varijable
0, 1, 2, 3, ..., 10
Konaan
0, 1, 2, 3, ..., 23
Konaan
0, 1, 2, 3, ...
Prebrojivo mnogo
P( X x2 ) P( X 1) p2
1
4
1 1 1
4 4 2
P( X x3 ) P( X 2) p3
1
4
122
Vjerovatnoa
p
1/4
1/2
1/4
1
P(0 X 1) P( X 0) P( X 1)
P(0 X 1) P( X 0)
3
4
1
4
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
1
2
3
4
5
6
Ukupno
60
36
30
63
51
60
300
0,20 0,12 0,10 0,21 0,17 0,20
1,00
124
UZIMAWE
UZORKA
OBIQE@JE
ODRE]IVAWE
FREKVENCIJA ZA
SVAKU VRIJEDNOST
UZORAK
PLANIRAWE UZORKA
X
X
DISTRIBUCIJA
FREKVENCIJA
ZAKQU^IVAWE
FORMIRAWE
PROSTORA UZORKA
PRIDRU@IVAWE
BROJA SVAKOM
ISHODU
ODRE]IVAWE
VJEROVATNO]E
ZA SVAKU
FORMIRAWE
PROSTORA UZORKA
VRIJEDNOST
P(X=x)
X
X
POPULACIJA
PLANIRAWE
EKSPERIMENTA
ODRE\IVAWE
SVIH ISHODA
DISTRIBUCIJA
VJEROVATNO]E
125
0,5
0,25
X
0
F ( x) P( X x)
126
F ( xr ) P( X xr ) P( X x1 ) P( X x2 ) .... P( X xr )
i 1
matematike
1 1 1
1
4 2 4
127
1
3/4
2/4
1/4
0
x
i 1
fi
1
1089
[1 * 600 2 * 36 3 * 30 4 * 63 5 * 51 6 * 60
3,63
300
300
x
i 1
fi
6
6
x1 f1 x2 f 2 ... x6 f 6
f
f
f
f
x1 1 x2 2 ... x6 6 xi i xi pi 3,63
n
n
n
n
n i 1
i 1
pi=P(X=xi)
p1=P(X=x1)
p2=P(X=x2)
pn=P(X=xn)
E ( X ) x1 p1 x2 p 2 ... xn p n xi pi
i 1
129
(3.2.4.1)
2/4
1/4
X
0
E(x)
1
4
1
2
1
4
0
1/4
1
1/2
2
1/4
Y
p
2
1/4
5
1/2
8
1/4
132
E[ X E ( X )] 0
133
(3.2.4.3)
(3.2.4.4)
p
1/4
1/2
1/4
1
xp
0
1/2
1/2
xp
0
1/2
1
3/2=E(X2)
1=E(X)= x
E ( X ) xi p i 1
E ( X 2 ) xi2 pi
2
x2 E ( X 2 ) x
3
2
3
1
(1) 2
2
2
1
4
1
2
1
4
x2 [ xi E ( X )]2 pi (0 1) 2 * (1 1) 2 * (2 1) 2 *
i 1
1
2
135
Ovakav opit koji moe produkovati samo dva ishoda naziva se Bernulijev
opit. Nas, meutim, nee interesovati samo jedan Bernulijev opit, nego niz
nezavisnih, ponovljenih Bernulijevih opita. Takav niz opita naziva se
Bernulijev proces ako su ispunjeni slijedei uslovi:
a) Svaki opit rezultira u jednom od dva mogua ishoda koji se tehniki
klasifikuju kao uspjeh (U) i neuspjeh (N);
b) Vjerovatnoa uspjeha, p = P(U), konstantna je od opita do opita.
c) Vjerovatnoa neuspjeha P(N) = 1-p oznaava se se sa q, tako da je
p+q=1.
d) Opiti su nezavisni, odnosno bilo koji ishod da se realizuje u nekom opitu
nee imati uticaja na vjerovatnou ishoda u bilo kom drugom opitu.
Vjerovatno je jajjednostavniji primjer Bernulijevog procesa eksperiment sa
bacanjem pravilnog novia, gdje se pojavljivanje pisma ili grba moe
klasifikovati kao uspjeh i neuspjeh, respektivno, tako da je p+q=1.
Ukoliko se izvri n ponovljenih Bernulijevih opita tada broj uspjeha moe
iznositi 0, 1, 2, ..., n. Cilj je odrediti formulu za izraunavanje vjerovatnoe
ostvarivanja svakog mogueg broja uspjeha unutar n nezavisnih, uzastopno
ponovljenih opita koji formiraju Bernulijev proces. Distribucija do koje se
dolazi na ovaj nain i koja daje eljene vjerovatnoe naziva se binomna
distribucija.
Radi potpunijeg sagledavanja logike izvoenja binomne distribucije naprije
e se uzeti primjer odreivanja vjerovatnoe dobijanja tano dva pisma u
eksperimentu sa bacanjem novia pet puta, a zatim e se dobijeni izraz
generalizovati.
Svako pojedinano bacanje moe se tretirati kao Bernulijev opit odnosno kao
jedan opit unutar Bernulijevog procesa. Oznaimo pojavljivanje pisma kao
uspjeh. Pretpostavlja se da je u konkretnom eksperimentu prilikom pet
uzastopnih bacanja dobijen sljedei niz ishoda:
GPGGP
gdje su sa G i P oznaeni grb i pismo, respektivno. Da bi se pojednostavila
analiza transformisae se oznake ishoda tako to e se pojava uspjeha
oznaiti sa brojem 1, a neuspjeha sa 0. Kako je u eksperimentu pismo
oznaeno kao uspjeh, gornji niz izhoda moe se napisati kao 01001.
Vjerovatnoa uspjeha i neuspjeha u pojedinanom opitu iznose p i lj,
respektivno. Podsjetimo se da je, na osnovu definicije nezavisnih dogaaja,
vjerovatnoa njihovog zajednikog javljanja jednaka produktu pojedinanih
vjerovatnoa. Stoga je vjerovatnoa ostvarivanja konkretnog niza jednaka
P(P, G, G, G, P) = P(0, 1, 0, 0, 1) = q*p*q*q*p = p2 q3
138
n
n
P( x) p x q n x p x (1 p) n x za x = 0, 1, 2, ..., n
x
x
(3.2.4.8)
za x = 0, 1, 2, ..., n
Vjerovatnoa P(x)
n 0
p (1 p) n 0 (1 p) n
0
n 1
p (1 p ) n 1 np(1 p ) n 1
1
n 2
p ( 1 p ) n 2
2
.
.
.
.
.
.
n x
p 1 p n x
x
.
.
n n
p (1 p) n n p n
n
140
(3.2.4.9)
.
.
.
P(n) p n
Zakljuujemo da se sa desne strane izraza 3.2.49. nalaze sve vjerovatnoe
koje figuriu u binomnoj distribuciji vjerovatnoe. Kako se na lijevoj strani
tog izraza nalazi (p+q)n, a poznato je da je (p+q)=1, vidi se da je suma svih
binomnih vjerovatnoa jednaka 1n=1, ime je ispunjen i drugi uslov.
Binomna distribucija ima dva parametra, n i p. Mijenjanjem njihovih
vrijednosti dobijaju se rezliite binomne distribucije, to znai da se termin
binomna distribucija odnosi na cijelu familiju binomnih distribucija od kojih
svaka zavisi od konkretnih vrijednosti parametara n i p. Da se sagleda kako
vrijednosti parametara utiu na oblik binomne distribucije, na slici 3.2.4.2.
dat je grafiki prikaz nekoliko razliitih binomnih distribucija.
Na osnovu slike 3.2.4.2. zakljuuje se da je binomna distribucija simetrina
kad je p=0,5 bez obzira na vrijednost n. Kad je p<0,5 distribucija je
asimetrina udesno, a u sluaju kad je p>0,5 distribucija je asimetrina
ulijevo. Izuzetno vana osobina binomne dostribucije moe se uoiti sa slika
c, d, e: ukoliko se parametar p ne razlikuje mnogo od 0,5 sa poveanjem
broja opita (n) distribucija postaje sve simetrinija (dobija zvonasti oblik).
Meutim, kada se p znatno razlikuje od 0,5 ta tendencija se ne moe uoiti
(slike f i g).
141
E ( X ) x xi pi x1 p1 x2 p 2 0q 1 p p
i 1
1;0
, p q 1
X :
p; q
Za svaki dogaaj je izvjesno da e se realizovati ili se nee realizovati pa je
P(A)+P(A)=p+q=1.
Primjer 2:
Eskperiment bacanja novia realizuje se dva puta (n=2).
U ovom eksperimentu imamo etiri mogue realizacije: AA, ACA, AAC, AC
AC. Sluajna varijabla se moe predstaviti u obliku:
AA; AA C iliA C A; AC AC AA;2 AA C ; AC AC
n 2, X : 2
2
p 2 ;2 pq; q 2
p
;
pq
qp
;
q
p 2 2 pq q 2 p q 1
2
Primjer 3:
Eskperiment bacanja novia realizuje se tri puta (n=3).
AAA;3 AAA C ;3 AAC AC ; AC AC AC
, pi p q 3 1
n 3, X : 3
2
2
3
i
p ;3 p q;3 pq ; q
k 0
k 0 k
0
1
2
n
q n npq n1
nn 1 2 n2
n
p q ... p n p q 1
2
145
Primjer 4:
Kolika je vjerovatnoa da porodica sa sedmoro djece ima dva djeaka?
Ovdje se mora najprije uoiti da se radi o binomnoj raspodjeli jer postoje
samo dva ishoda: djeak ili djevojica.
Nadalje, vano je uoiti da je vjerovatnoa pojavljivanja nekog od ovih
dogaaja konstantna.
Vjerovatnoa da se rodi djeak neto je vea (0,51) od 1/2 ali zbog
jednostavnijeg rauna uzimamo da je jednaka 1/2.
7
7
21
2
72
7
P(2) 1 / 2 1 / 2 1 / 2
0.16
128
2
2
jer je:
n
n!
7!
7 * 6 * 5 * 4 * 3 * 2 *1 7 * 6
21
k n k !k! 7 2!2! 5 * 4 * 3 * 2 *1 * 2 *1 2 *1
Hipergeometijska distribucija
Vidjeli smo da binomni model zahtijeva da vjerovatnoa uspjeha p mora
ostati konstantno iz opita u opit, odnosno da opiti moraju biti meusobno
nezavisni. Posebnu primjenu binomna distribucija ima u problemima
vezanim za izbor uzorka. Strogo uzevi, elementi uzorka bie meusobno
nezavisni (tj. vjerovatnoa p bie konstantna) samo u sluajevima kada se
uzorak veliine n uzima iz beskonanog osnovnog skupa ili ako se iz
konanog skupa uzima uzorak sa ponavljanjem. U ovom drugom sluaju
svaki elemet uzorka nakon izpitivanja vraa se u osnovni skup i prua mu se
mogunost da ponovo bude izabran u uzorak.
Ukoliko iz konanog skupa uzimamo uzorak bez ponavljanja uzastopna
izvlaenja bie zavisna i vjerovatnoa p mijenjae se nakon izbora svakog
novog elementa jer se broj i struktura preostalih elemenata u osnovnom
skupu mijenja. U praksi se najvei broj istraivanja sprovodi koritenjem
uzorka bez ponavljanja, pa na prvi pogled ne bi se smjela koristiti binomna
distribucija kada je posmatrana populacija konana.
Meutim, ako veliina uzorka n nije suvie velika u odnosu na veliinu
populacije N, binomna distribucija se ipak moe koristiti jer predstavlja
dobru aproksimaciju stvarne distribucije rezultata uzorka. Smatra se da e
aproksimacija biti zadovoljavajua ako je odnos n/N manji od 5%. Ali u
sluaju da se primjenjuje uzorak bez ponavljanja koji sadri 5% ili vie
elemenata korane populacije mora se koristiti hipergeometrijska
146
Beskonano velika
populacija
Konana populacija
n/N>5%
Bez ponavljanja
Sa ponavljanjem
Binomna
Binomna
Binomna
Binomna
Hipergeometrijska
Binomna
Uzorak
N1=broj uspjeha
N2=broj neuspjeha
x=broj uspjeha
Uzima se uzorak
veliine n
N=veliina populacije
n-x=broj neuspjeha
n=veliina uzorka
147
Hipergeometrijska distribucija
N1 N 2
x n x
P( X x)
N
n
gdje su:
N = veliina populacije
N1 = broj "uspjeha" u populaciji
n = veliina uzorka (bez ponavljanja)
N2 = broj "neuspjeha" u populaciji
x = broj "uspjeha" u uzorku
min(n, N1) = minimum od n i N1
n-x = broj "neuspjeha" u uzorku
148
P( X x)
e x
x!
x = 0, 1, 2, ...
>0
150
151
e 2 2 3
0,1804
3!
Uniformna distribucija
Jedna od najjednostavnijih prekidnih distribucija je uniformna distribucija.
Posebnu primjenu je nala u raunarskim simulacijama i igrama na sreu.
Njena osnovna osobina je da svaka vrijednost sluajne varijable ima jednaku
vjerovatnou pojavljivanja.
Pretpostavimo da sluajna varijabla X moe uzeti jednu od vrijednosti 1, 2,
..., n. Ako je vjerovatnoa da X uzme bilo koju od ovih vrijednosti jednaka, i
iznosi 1/n, i ako se ove vjerovatnoe ne mijenjaju od opita do opita, za X se
kae da ima prekidnu uniformnu distribuciju.
Uniformna distribucija:
1
P( X x)
n
x = 1, 2, ..., n
VarX x2
n2 1
12
153
154
Vrijeme
(min)
20-24
25-28
29-32
33-36
37-40
41-44
45-48
Frekvencija
5
10
22
27
21
13
3
Relativna
frekvancija
0,05
0,10
0,22
0,27
0,21
0,13
0,03
156
P(a<x<b
157
P(a X b) f ( x)dx
(3.2.5.1)
Sluajna varijabla
Neprekidna
Prekidna
F ( x) P( X x)
f ( x)dx
F ( x ) P ( X x ) P ( X xi )
i
Oekivana
vrijednost
E ( X ) xf ( x)dx
Varijansa
x2 [( x E ( X )] 2 f ( x)dx
E ( X ) xi p i
i
158
[( xi E ( X )] 2 pi
2
x
F(x)=P(X=x)
1-F(x)
159
P(a<x<b)
F(b)
F(a)
160
f ( x)
( x )2
2 2
gsje su:
- matemetika konstanta priblino jednaka 3,14159;
e - matematika konstanta (baza prirodnog logaritma)
prblino jednaka 2,71828;
- aritmetika sredina normalne sluajne varijable
- standardna devijacija normalne sluajne varijable
(3.2.5.3)
161
f(x)
N(,x2)
162
163
164
f(x)
{
{
{
{
1
2
z2
2
-<z<+
166
(3.2.5.4)
0,3
0,2
0,1
-3
-2
-1
+1
+2
+3
F ( z 0 ) P( Z z 0 )
0,3
0,2
0,1
-3
-2
-1
+1
z0 +2
+3
ispod
F ( z0 )
z2
2
dz
0,2
0,1
z1=-1,5
z2=+2,25
168
0,2
0,1
-1
+1
0,2
F(-z)
1-F(z)
0,1
-z
+z
(3.2.5.5)
(3.2.5.6)
SD
Dok je originalna sluajna varijabla bila izraena u odreenim mjernim
jedinicama (u ovom sluaju to su asovi) primjenom formule 3.2.5.6. nova
sluajna varijabla Z ima standardizovanu skalu koja je nezavisna od mjernih
jedinica. Na ovaj nain, bez obzira na mjerne jedinice i kombinaciju
parametara podaci se uvijek mogu prevesti u standardizovane.
170
x1
z2
x2
Z
P
20
20
P(2 Z 0,5) F (0,5) F (2) 0,3085 0,0227 0,2758
N()
N(0,1)
x1
x2
z1
x1
z2
x2
0,0
0,1
0,2
0,3
0,4
0,5
0,8
1,0
1,3
0,399
0,397
0,391
0,381
0,368
0,352
0,290
0,242
0,171
1,5
1,8
2
2,3
2,5
2,8
3,0
3,4
3,5
0,129
0,079
0,054
0,030
0,018
0,008
0,004
0,001
0,001
1P
0,000
0,080
0,158
0,236
0,311
0,383
0,451
0,516
0,683
0,806
P
1,000
0,920
0,842
0,764
0,689
0,677
0,548
0,484
0,317
0,194
z
1,5
1,8
2,0
2,3
2,5
2,8
3,0
3,4
3,5
3,8
1-P
0,866
0,928
0,954
0,979
0,988
0,995
0,997
0,9993
0,999
0,9999
P
0,134
0,072
0,46
0,21
0,12
0,005
0,003
0,0007
0,001
0,0001
Primjeri:
Primjer 1:
Kolika se vjerovatnoa ostvaruje u intervalu od a) 1,00 SD; b) 1,96 SD
i c) 2,58 SD?
Da bi se dobila vjerovatnoa eljene povrine, iznos vjerovatnoe koja
odgovara granici zed vrijednosti proita se iz tablice povrina (tablica 3.2.) i
pomnoi za dva.
a) i = 1,00 SD
z=1,0 p = 0,3413*2 = 68,26%
b) i = 1,96 SD
z=1,96 p = 0,7450*2 = 95,00%
c) i = 2,58 SD
z=2,58 p = 0,4951*2 = 99,02%
Primjer 2:
U kom intervalu se ostvaruje vjerovatnoa od a) 0,6826; b) 0,95; c) 0,9902?
U ovom primjeru postupak je obrnut.
Vjerovatnoa se najprije dijeli sa dva. Zatim se dobijena vrijednost
(najpriblinija) trai u tablici 3.1. i oita se odgovarajua zed vrijednost.
172
a) p = 0,6826/2=0,3413
b) p = 0,95/2=0,4750
c) p = 0,9902/2=0,4951
z=1,0 i = 1,00 SD
z=1,96 i = 1,96 SD
z=2,58 i = 2,58 SD
Primjer 3:
Vrijednosti tjelesne mase ispitanika rasporeene su po nrmalnoj raspodjeli.
Ako je aritmetika sredina skupa 70 kg, a standardna devijacija 10 kg,
procijeniti vjerovatnou da sluajno izabrana osoba ima tjelesnu masu:
a)
izmeu 60 i 70 kg;
b)
izmeu 50 i 60 kg;
c)
izmeu 65 i 75 kg;
d)
preko 85 kg;
e) manje od 95 kg.
Najprije se empirijske vrijednosti standardizuju tj. transformiu u zed
vrijednosti, na osnovu kojih se iz tablice 3.1. proitaju vjerovatnoe
graninog odstupanja a zatim se izrauna vjerovatnoa povrine.
60 70
a) z
pz = 0,3413
1
10
50 70
b) z1
pz1 = 0,4772
2
10
60 70
pz2 = 0,3413
z2
1
10
p=p1-p2=0,4772-0,3413=0,1359
65 70
c) z1
pz1 = 0,1915
0,5
10
75 70
pz2 = 0,1915
z2
0,5
10
p = p1 + p2 =2p=2*0,1915=0,3830
85 70
d) z
pz = 0,4332
1,5
10
p = 0,5 pz =0,5-0,4332=0,0668
95 70
2,5
e) z
pz = 0,4938
10
p=0,5+pz=0,5+0,4938=0,9938
173
175
10
2
2 2!(5 2)! 2 *1(3 * 2 *1)
Prosti sluajni uzorci su slijedei parovi elemenata:
(A, B)
(A, C)
(A, D)
(A, E)
(B, C)
(B, D)
(B, E)
(C, D)
(C, E)
(D, E)
Svaki od ovih parova ima istu vjerovatnou pojavljivanja, koja je ovdje
jednaka 1/10.
Navedeni postupak izbora jedinica u uzorak nazivamo izborom bez
ponavljanja, a na ovaj nain izabrani uzoram naziva se uzorkom bez
ponavljanja. Jedinicu iz osnovnog skupa koju izaberemo u prvom izvlaenju
ne vraamo u osnovni skup, tako da slijedei element uzorka biramo izmeu
preostalih jedinica osnovnog skupa. Zbog toga izbor jednog elementa u
uzorak mijenja vjerovatnou izbora preostalih elemenata u slijedeem
izvlaenju. U naem primjeru vjerovatnoa izbora jednog odreenog
elementa u prvom izvlaenju je 1/5, dok bi vjerovatnoa izbora u drugom
izvlaenju bila 1/4. Zakljuuje se da su uzastopni izbori elemenata u uzorku
bez ponavljanja meu sobom statistiki zavisni.
Napomenimo da pri izboru u uzorak bez ponavljanjaobino zanemarujemo
redoslijed izvlaenja. Uzorke smatramo razliitim ako se oni razlikuju u bar
jenom elementu, zbog ega, na primjer, uzorke (A, B) i (B, A) smatramo
identinim.
176
74730
77510
89987
13582
50027
17838
34318
97855
53894
15857
66221
98448
55429
91130
16366
89227
43256
94031
48491
36676
75262
69451
11845
69033
79940
31348
03709
99050
23473
19338
49237
67025
31890
91207
95393
70707
20526
02503
97689
08247
22943
00310
11293
05332
55552
49623
54485
84022
13856
83636
X
i 1
(4.2.1)
n
sama je jedna sluajna varijabla. Dakle, za razliku od parametara osnovnog
skupa koji su konstante, statistike uzorka su sluajne varijable.
Pretpostavimo da smo izabrali jedan uzorak. Elementi izabranog uzorka
predstavljaju realizovane vrijednosti sluajnih varijabli Xi (i=1, 2, ..., n) u
185
x
i 1
n
Kao prosjek n numerikih vrijednosti, aritmetika sredina izabranog uzorka
je konstanta. Dakle statistika uzorka X je sluajna varijabla, a njena
realizovana vrijednost u uzorku, x je konstanta.
187
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
(5,1)
(5,1)
(5,3)
(5,4)
(5,5)
188
xf
x f
1,0
1,0
1,0
1,5
3,0
4,5
2,0
6,0
12,0
2,5
10,0
25,0
3,0
15,0
45,0
3,5
14,0
49,0
4,0
12,0
48,0
4,5
9,0
40,5
5,0
5,0
25,0
25
75,0
250,0
P( X x)
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
0,04
0,08
0,12
0,16
0,20
0,16
0,12
0,08
0,04
1,00
* fi
75
3
K
25
Dakle, aritmetika sredina aritmetikih sredina svih uzoraka jednaka je
aritmetikoj sredini odnovnog skupa.
x X
i 1
x2
f
i 1
* (xi )2
K
* xi
250
32 1
25
2
1 x2 . Ovaj odnos vai i u potem sluaju, odnosno: Varijansa
n
2
aritmetikih uzoraka sa ponavljanjem jednaka je koliniku varijanse
osnovnog skupa i veliine uzorka.
x2
(4.2.3)
n
Standardna devijacija aritmetikih sredina uzoraka je pozitivan kvadratni
korjen iz varijanse:
k
f
i 1
* (xi x )2
K
f
i 1
* (xi )2
K
SE x
n
gdje je SE - standard error (engl. standardna greka)
(4.2.4)
Var X [ x i E ( X )]2 * P( X x i )
n
Na slici 4.2.2. prikazana je distribucija statistike X . Ako je usporedimo sa
distribucijom osnovnog skupa (slika 4.2.1.) vidi se da su ove distribucije
meu sobom veoma razliite. Dok je distribicja osnovnog skupa uniformna,
oblik distribucije aritmetikih sredina uzoraka je simetrian i unimodalan.
Oblik distribucije aritmetikih sredina nije jedinstven ve zavisi od oblika
distribucije osnovnog skupa iz kojeg su uzorci izabrani i od veliine uzarka.
Sa porastom veliine uzorka, distribucija postaje vie zvonasta, i za dovoljno
veliko n pribliava se normalnoj distribuciji.
.
n
Navedena pravila mogu se objediniti na slijedei nain:
Ako je X : N ( , 2 ) , onda je X : N ( ,
2
n
(4.2.5)
68%
P( X X X ) 0,68
P( 1,96 * X X 1,96 * X ) 0,95
P( 2,58 * X X 2,58 * X ) 0,99
95%
99%
X
2,58 X
1,96 X
X
X
2,58 X
1,96 X
),
n
(4.2.6)
194
f(x)
f(x)
P(x)
f(x)
0,40
0,20
Normalna
Uniformna
Asimetri~na
(eksponencijalna)
Bimodalna
f (X )
P( X )
f (X )
0,36
0,16
f (X )
f (X )
P( X )
f (X )
1,0
2,0
3,0
f (X )
f (X )
P( X )
f (X )
1,0
2,0
3,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
1
1
2
2
2
1
1
10
xf
x f
1,5
2,0
5,0
6,0
7,0
4,0
4,5
30,0
2,3
4,0
12,5
18,0
24,5
16,0
20,3
97,5
P( X x)
1,5
0,10
2,0
0,10
2,5
0,20
3,0
0,20
3,5
0,20
4,0
0,10
4,5
0,10
1,00
196
izabranih
sa
(4.2.7)
Tako se dobije:
(2/2)*(5-2)/(5-1)=1*3/4=0,75
Dakle, u sluaju izbora uzoraka bez ponavljanja vai slijedei izraz:
2 N n
2
(4.2.8)
x
*
n N 1
Vrijednost pfks zavisi od odnosa veliine osnovnog skupa i veliine uzorka.
Sa porastom veliine uzorka, vrijednost popravnog faktora se smanjuje i za
n=N iznednaava se sa nulom. U tom sluaju je i x2 0 jer se osnovni skup
i uzorak poklapaju pa je razlika izmeu x i jednaka 0. S druge strane, ako
je osnovni skup relativno veliki u odnosu uzorak, pfks je priblino jednak 1.
Zbog toga, ako varijansu x2 izraunavamo primjenom izraza (4.2.8), pfks
po pravilu ne koristimo ako uzorak sadri manje od 5% elemenata osnovnog
skupa, tj, ako je tzv. stopa izbora n/N < 0,05.
Napomenimo da Centralna granina teorema ne vai za uzorke iz konanih
osnovnih skupova. Ipak, za praktine potrebe, distribuciju aritmetikih
sredina uzoraka moemo grubo aproksimirati normalnom distribucijom.
Uslov za primjenu Centralne granine teoreme je da iz velikih osnovnih
skupova biramo velike uzorke, pri emu obim uzorka treba biti manji od
N/2.
Primjer.
Posmatra se osnovni skup od 10000 studenata, ija je prosjena starost 22,3
godine i varijansa 1,44 godine2. Ako iz osnovnog skupa biramo prost
sluajan uzorak od 30 studenata, postavlja se pitanje koliko e iznositi
prosjena starost u izabranom uzorku.
Prije izbora uzorka ne moe se tano odrediti vrijednost njegove aritmetike
sredine x , ali se moe donijeti probabilistiki zakljuak. Za to nam je
potrebna distribucija vjerovatnoe aritmetikih sredina uzoraka. Budui da
izvlaima veliki uzorak (n=30), na osnovu Centralne granine teoreme
zakljuujemo da distribucija aritmetikih sredina uzoraka tei normalnoj, tj.
X : N ( x , x2 ) . U naem primjeru dobijamo
x 22,3 i x2
2
n
1,44
0,048 .
30
198
X x
(4.2.9)
x x
22 22,3
0,3
1,37 , pa slijedi da je
1,2
0,219
n
30
P( X 22) 1 F (1,37) 1 0,0853 0,9147 . Dakle, vjerovatnoa da
emo izabrati uzorak ija je aritmetika sredina vea od 22 jednaka je
0,9147. Drugim rijeima, od svih uzoraka veliine n=30 koje moemo
izabrati iz datog osnovnog skupa, njih 91,47% ima aritmetiku sredinu veu
od 22.
199
-2,283
21,8
x 22,3
22,5
0,913
200
slijedi da je:
x 2 z * x
x1 z * x
i
Zamjenom odgovarajuih vrijednosti izraunavamo granice intervala:
x1 22,3 1,96 * 0,219 21,871 i x 2 22,3 1,96 * 0,219 22,729
Tako dobijamo sljedei rezultat:
P(21,871 X 22,729) 0,95
Sa vjerovatnoom od 0,95 atirmetika sredina sluajno izabranog uzorka
nai e se u intervalu od 21,871 do 22,729. Ukupno 95% izabranih uzoraka
ima vrijednost aritmetike sredine koja se nalazi u ovom intervalu.
201
1
1
(1 )
.
Var ( Pr ) P2r ( ) 2 * Var ( X ) ( 2 ) * n (1 )
n
n
n
Pr: priblino N ( ; (1 ) )
(4.2.13)
203
n
0,05 ), za izraunavanje se koristi
N
popravni faktor konanog skupa (pfks).
95%
99%
2,58P
P
P
2,58P
1,96P
P
1,96P
P
(1 )
n
0,463 0,46 ; pa je
(1 )
0,30 * 0,70 0,0648
n
50
P(Pr < 0,27) = F(-0,46)=0,3228. Vjerovatnoa da e proporcija studentica u
sluajno izabranom uzorku biti manja ili najvie jadnaka 0,27 iznosi 0,3228.
Drugim rijeima, od svih uzoraka veliine n=50, u 32,28% uzoraka
proporcija studentica iznosi najvie 0,27 (ilustracija je data na slici 4.2.8).
0,3228
0,27
=0
0,3228
-0,46
205
P( p1 Pr p2 ) P( z Z z) 2F ( z) 1 0,99 .
Iz tablica je z=2,575 2,58, i kako su:
p
p
z 1
i z 2
Sistematski uzorak:
Neka sluajan poetak ostane isti i pri izboru sistematskog uzorka tj. neka je
to cifra 1.
Od ovog poetka iz okvira uzorka bira se svaka K-ta vrijednost tj. svaka peta
jer je korak izbora 5 (K=N/n=50/10=5).
Sistematski uzorak glasi:
1 - 6 - 11 - 16 - 21 - 26 - 31 - 36 - 41 - 46
5,1 5,3 5,4
5,7
5,5
5,5
5,4
5,3
5,5
5,4
Aritmetike sredine uzorka su:
x 53,5
5,35
n
10
x 54,1
xs
5,41
n
10
x ps
SD ps
SDs
x x
x2 2
x
n
0,129
0,11
10
292,91
29,27 0,14
10
SD
0,11
0,03
10
SD 0,14
SE s.
0,04
n
10
ps
x ps t * SE x
5,35 0,06 X
5,29 X
ps
5,2 X
ps
ps
ps
5,35 0,06
5,41
5,5
208
x p.s.
x s. t * SE x X s. x s. t * SE x
5,33 X s. 5,49
5,3 X s. 5,5
209
N 7000
n 100
x 20
SDx 2
t 1,96 (jer je verovatnoa 0,95)
SE x
SD
n
2
100
0,2
x t * SE x X x t * SE x
20 0,392 X 20 0,392
19,608 X 20,392
19 X 21
t * SD
n0
Sa E je oznaena preciznost.
U datom primjeru najprije se mora odrediti eljena preciznost.
Ona iznosi 0,02 (tj. 2%) od aritmetike sredine uzorka odnosno 0,4
(E=2*20/100=0,4).
Prva aproksimacija veliine uzorka je:
2
1,96 * 2
t * SD
n0
96,04
E
0,4
a veliina uzorka iznosi:
N
7000
n
94,75 95
N 1
7000 1
1
1
n0
96,04
Veliina uzorka za preciznost od 0,392 ( E t * SE x 1,96 * 0,2 0,392 )
iznosila je 100, a za preciznost 0,4 iznosi 95 bolesnika.
Kao to se vidi uzorak izabran sa preciznou 0,392 je vei od uzorka ija je
preciznost manja, tj. 0,4.
Prema tome to je preciznost manja, manji je i uzorak i obrnuto, odnosno
preciznost i veliina uzorka su direktno proporcionalni.
Primjer 3:
Iz osnovnog skupa od 5000 osoba izabran je uzorak od 400 osoba i ocijenjen
je postotak pothranjenih osoba koji je iznosio 16%.
a) Ocijeniti interval povjerenja za postotak pothranjenih u
osnovnom skupu sa jverovatnoom od 0,99.
b) Ocijeniti interval u kome se nalazi broj pothranjenih osoba u
osnovnom skupu sa istom vjerovatnoom (0,99).
c) Kolika je potrebna veliina uzorka ako se eli preciznost
ocjene od 6%.
Dato je:
N 5000
n 400
p 0,16
211
SE p
p*q
0,16 * 0,84
0,02
400
p t * SE p P p t * SE p
0,16 2,58 * 0,02 P 0,16 2,58 * 0,02
0,16 0,05 P 0,16 0,05
0,11 P 0,21
11% P 21%
Proporcija pothranjenih osoba u osnovnom skupu (P) procijenjena na osnovu
proporcije uzorka (p) sa vjerovatnoom od 0,99 kree se u intervalu od 11%
do 21%.
b) Ukupan broj, odnosno total (NP) procjenjuje se na osnovu intervala
povjerenja koje glasi:
N p t * SE p NP N p t * SE p
248,50
E2
0,06 2
E
236,74 237
N 1
5000 1
1
1
n0
248,5
Primjer 4:
Na osnovu prikupljenih podataka o ulkusnoj bolesti za sto sluajeva dobijena
je distribucija frekvencija u odnosu na godine ivota.
Godine ivota Broj bolesnika
20,0-29,9
30,0-39,9
20
40,0-49,9
44
50,0-59,9
24
60,0-69,9
10
Ukupno
100
213
Rjeenje:
a)
Sa
x1
fx1
fx1
24,9
34,9
44,9
54,9
64,9
Ukupno
2
20
44
24
10
100
49,80
698,00
1975,60
1317,60
649,00
4690,00
1240,00
24360,20
88704,40
72336,20
42120,10
228760,90
fx1 4690
46,9
f
100
2
fx1
x
f
2
SD x
SE x
SD x 9,4
n
100
228760,9
46,9 2 9,4
100
0,94
x t * SE x X x t * SE x
45,1 X 48,7
0,22
f 100
q 1 p 1 0,22 0,78
p
SE p
p*q
0,22 * 0,78
0,04
100
p t * SE p P p t * SE p
214
216
d
SE d
Ze
x X x X
SD x
SE x
n
Primjer 1.
U cilju procjene zdravstvenog stanja bolesnika primljenih na lijeenje u
bolnicu odreivana je, izmeu ostalog i, vrijednost leukocita.
217
Rjeenje
Normalna vrijednost leukocita iznosi 6x109/l (SDx=0,8x109/l).
Kako je odstupanje leukocita od normalne vrijednosti u oba smjera
nepoeljno uticaj bolesti na broj leukocita testiramo dvosmjernim tipom
testiranja.
Poto je uzorak na osnovu koga se vri ispitivanje veliki (n=100>30) a
strandardna devijacija osnovnog skupa poznata (SDx=0,8*109/l) znaajnost
razlike aritmetikih sredina uzorka i osnovnog skupa moe se procijeniti na
osnovu z-testa.
Ze
x X
76
1
12,5
SDx
0,8
0,08
100
n
SE p0
P0 * Q0
n
Ze
p p0
SE p0
Primjer 2.
Farmaceutska firma preporuuje novi preparat protiv osteomalacije tvrdei
da smanjuje procenat neuspjeha ispod 10%. Od 125 djece lijeene ovim
preparatom kod 12 su na kontrolnom pregledu naeni diskretni znaci
osteomalacije. Da li se novi preparat moe preporuiti?
Rjeenje
Novi preparat se moe preporuiti ako se ispitivanjem odbaci nulta hipoteza,
tj. ako se dokae da je procenat oboljenja u uzorku ispitanika ljeenih ovim
preparatom znaajno nii od 10%.
U postupku procjene uspjenosti preparata najprije treba ispitati uslove za
primjenu z-testa.
Kako je pretpostavljena proporcija osnovnog skupa P0 10% 0,1 tada je
m 12
0,096
n 125
SE P0
P0 * Q0
0,1 * 0,9
0,027
n
125
0,148
SE P0
0,027
Empirijska vrijednost z-testa (Ze=0,148) manja je od teorijske vrijednosti
(Zt=1,64 jer se procjenjuje jedan smjer, snienje) za nivo sigurnosti od 0,95
prihvata se nulta a odbacuje radna hipoteza i zakljuuje da razlika proporcija
osnovnog skupa i uzorka nije znaajna (p>0,05).
219
n2 60 )
Primjer
Podaci se odnose na vrijednost serumske amilaze kod dvije grupe ispitanika.
Prva grupa je kontrolna (zdravi ispitanici), a druga je sastavljena od
hospitalizovanih ispitanika, za koje se zna da im obolenje utie na vrijednosti
serumske amilaze.
U prvoj grupi bilo je 15 ispitanika ( n1 15 ).
je x 2 96 sa SD2 35 jedinica/ml.
Oigledno, aritmetike sredine ove dvije grupe su razliite. Jedna iznosi 96,
a druga 120.
Meutim, nas interesuje da li je ta razlika znaajna, odnosno, da li je
posljedica djelovanja sistematskog faktora.
U ovom sluaju taj sistematski faktor bi bio razlog hospitalizacije ispitanika.
Ako razlika izmeu ovih srednjih vrijednosti nije znaajna prihvatie se
pretpostavka da je sluajna.
Da se donese odluka potrebno je da se izrauna empirijska vrijednost t-testa.
Pri tome koristimo sljedei izraz:
x1 x 2
t emp.
n1 SD n2 SD n1 n2
*
n1 n2 2
n1 * n2
2
1
2
2
120 96
15 * 40 22 * 35 15 22
*
15 22 2
15 * 22
2
1,88
DF n1 n2 2 nalazi se
DF n1 n2 2 15 22 2 35
slobode:
221
t gr 2,03; p 0,05
t gr 2,72; p 0,01
x1 3820 grama
SD2 250
x 2 3760 grama
grama
Da li se prosjene tjelesne teine novoroenadi majki domaica i majki
radnica znaajno razlikuju?
Rjeenje
U ovakvim sluajevima koristi se sljedei izraz za izraunavanje empirijske
vrijednosti t-testa:
x1 x 2
SD12 SD22
n1
n2
3820 3760
200 2 250 2
400
500
60
4
15
Primjenom ovoga izraza dobijamo: t=4 pri emu je broj stepeni slobode
DF n1 n2 2 tj. DF 898 .
Veliina izraunate empirijske vrijednosti t-testa ukazuje da se prihvati radna
hipoteza.
Ona tvrdi da postoji znaajna razlika u prosjenim teinama novoroenadi
pri emu je vjerovatnoa nulte hipoteze
222
p 0,01 .
x X 22 25
t
1,41
SE
45
10
Usporeivanjem dobijene vrijednosti sa onom iz tablice za broj stepeni
slobode DF=n-1=9 zakljuuje se da nema razloga da se odbaci nulta
hipoteza, tj. srednji nivo ispitivanog enzima vjerovatno je 25.
U okviru ovog primjera skree se panja na sljedee:
vrlo esto nije mogue znati varijabilitet ispitivanog obiljeja u itavoj
populaciji.
Tada se zadovoljavamo sa varijabilitetom koji je mogue procijeniti samo na
osnovu uzorka.
223
x dif
SE dif
gdje je
x dif
(x
SE dif
i2
xi1 )
n
SDdif
n 1
sa
SDdif
( xi 2 xi1 ) x dif
Primjer
Deset ispitanika uestvovalo je u eksperimentu koji je imao za cilj da utvrdi
efikasnost utvrene dijete, kombinovane sa programom vjebi u smanjenju
ukupnog holesterola u krvi.
Holesterol (mmol/l) je mjeren prije i poslije takvog tretmana:
224
ispitanik
1 2
3
4
5
6
7 8 9 10
holesterol prije 5,13 4,98 7,01 3,33 4,05 4,37 5,20 8,11 3,45 4,12
holesterol poslije 3,15 3,56 5,22 2,13 3,33 4,44 4,32 3,15 3,93 3,66
-1,98 -1,42 -1,79 -1,20 -0,72 0,07 -0,88 -4,96 0,48 -0,46 -12,86
-3,27 -2,71 -3,08 -2,49 -2,01 -1,22 -2,17 -6,25 -0,81 -1,75 -25,72
10,67 7,32 9,46 6,18 4,02 1,48 4,69 39,01 0,65 3,05 86,54
x dif
SDdif
SEdif
(x
i2
xi1 )
1,29(mmol / l )
( xi 2 xi1 ) x dif
2,94(mmol / l )
n
SDdif
0,98(mmol / l )
n 1
pa je
x dif
1,31
SEdif
225
foi ft i
i 1
ft i
gdje je:
i - broja (modaliteta ispitivanog obiljeja);
fo - opservirane, posmatrane frekvencije iz ispitivanja;
ft - oekivane (teorijske) frekvencije, tj. one koje se oekuju za
istinitost nulte hipoteze
k - ukupan broj modaliteta .
Simbol (sigma) u formuli znai da Hi kvadrat test ima kumulativni
karakter.
227
350
50
100
foi ft i
i 1
ft i
foi
ft i
foi
ft i
foi
ft i
fo
ft
350
400
-50
2500
6,25
50
50
100
50
50
2500
50
2
emp
2
f ti
56,25
gr2 9,210 .
2
gr
9,210
prihvata se radna a
Ispitivana osobina
osobina postoji
ne postoji
Ukupno
Strukturna
Jedna grupa
a+b
dihotomija
Druga grupa
c+d
a+c
b+d
a+b+c+d=n
Ukupno
230
Funkcionalno obiljeje
Strukturno
Ukupno
obiljeje
I gradacija
II gradacija
III gradacija
Prva gradacija
a+b+e
Druga gradacija
c+d+f
Svega
a+c
b+d
e+f
a+b+c+d+e+f=n
oboljeli
eksponirani
uzorak
nisu oboljeli
oboljeli
neeksponirani
nisu oboljeli
231
Faktor rizika
(ekspozicija)
Eksponirani
Neeksponirani
Ukupno
Stanje zdravlja
Oboljeli
Zdravi
a
b
c
d
a+c
b+d
Ukupno
a+b
c+d
a+b+c+d=n
H1:
a
c
ab cd
b) Prospektivne studije:
U ovim studijama polazi se od uzroka (faktora rizika) i ide prema posljedici
(bolesti)
Kod ovih studija tablica kontingencije 2x2 ima opti oblik:
Stanje
zdravlja
Oboljeli
Nisu oboljeli
Ukupno
Uzrok ekspozicija
da
ne
a
b
c
d
a+c
b+d
Ukupno
a+b
c+d
a+b+c+d=n
H1:
a
b
ac bd
Primjer 1:
Razmatra se klasian primjer povezanosti puenja i oboljevanja od raka
plua.
Istraiva je sluajnom metodom odabrao 500 zdravstvenih kartona u slubi
opte medicine (odraslo i starije stanovnitvo).
Pregledom kartona ustanovljeno je:
232
Ca plua
75
(a)
10
(c)
85
(a+c)
Zdravi
150
(b)
265
(d)
415
(b+d)
Ukupno
225
(a+b)
275
(c+d)
500
Definisanje hipoteza.
H0: Izmeu puenja i raka plua ne postoji veza.
H1: Izmeu puenja i raka plua postoji veza.
Drugi korak: Odreuje se novo znaajnosti od p=0,05 (5%).
Trei korak: Primjenjuje se Hi kvadrat test, tj. formula
foi ft i
i 1
ft i
233
Vrijednost svake elije tabele moe se dobiti tako da se zbir kolone (K)
kojoj pripada posmatrana elija, podijeli za unupnom veliinom uzorka
(a+b+c+d=n) i pomnoi sa zbirom rada (R) kome pripada elija.
Ovo pravilo vrijedi za izraunavanje teorijskih frekvencija i za tablice
kontingencije koje nisu tipa 2x2.
Za tablicu kontingencije 2x2 teorijske frekvencije, prema datom pravilu
iznose:
( K )
ac
f at
* ( R)
( a b)
N
abcd
( K )
bd
f bt
* ( R)
( a b)
N
abcd
( K )
ac
f ct
* ( R)
(c d )
N
abcd
f dt
( K )
bd
* ( R)
(c d )
N
abcd
85
225 38,25
500
414
f bt
225 186,75
500
85
f ct
275 46,75
500
415
f dt
275 228,25
500
f at
ft
foi ft i
f o i f t i 2
( f oi f ti ) 2
f ti
75
38,25
36,75
1350,56
35,31
150
186,75
-36,75
1350,56
7,23
10
46,75
-36,75
1350,56
28,89
265
228,25
36,75
1350,56
500
500
234
5,92
2
=77,35
gr2 3,841 .
esti korak: Usporeuju se empirijska i granina vrijednost Hi kvadrata i
donosi zakljuak.
Kako je empirijska vrijednost Hi kvadrata
2
em
77,35 vea od teorijske
2
N 2
R 1
R
ili
K 1
K
odnosno
2 1
0,5 0,707
2
2
77,35
0,37
2
N
500 77,35
235
Grip
da
34
9
43
ne
49
45
94
Ukupno
83
54
137
236
Oekivana frekvencija moe se izraziti kao funkcija tj. dio cjeline i tako
odrediti frekvencija pri nultoj hipotezi za obe grupe (koje se usporeuju) u
osnosu na njihov broj:
ac
a
c
N
ab cd
U naem primjeru je
a c 43
Znai, u obe grupe bi trebalo da ispitanici obole od gripa ako bi bila tana
nulta hipoteza. Tj. u grupi koja je dobila mrtvu vakcinu trebalo bi da bude
83*0,314 ispitanika (=26), a onih koji nisu oboljeli 83*0,686 (=57), itd.
Uopteno govorei oekivane frekvencija za tablice kontigencije dobiju se
na osnovu:
a ba c
a bb d
f ta
f tb
n
n
c d b d
c d a c
f da
f tc
n
n
Sad se pristupa formiranju radne tabele
i
fo
ft
foi ft i
f o i f t i 2
( f oi f ti ) 2
f ti
34
26
-8
64
2.46
17
-8
64
3.76
49
57
64
1.12
45
37
64
1.73
2
emp
. 9.07
237
1
3
13
84
100
Tip ishrane
2
3
12
27
62
36
26
37
100 100
4
49
48
3
100
Ukupno
91
159
150
400
fo
ft
foi ft i
f oi ft i 2
( f oi f ti ) 2
f ti
1
2
3
4
5
6
7
8
9
10
11
12
3
12
27
49
13
62
36
48
84
26
37
3
22,7
22,7
22,7
22,7
39,7
39,7
39,7
39,7
37,5
37,5
37,5
37,5
-19,7
-10,7
4,3
26,3
-26,7
22,3
-3,7
8,3
46,5
-11,5
-0,5
-34,5
388,1
114,5
18,5
691,7
712,9
497,3
13,69
68,9
2162,2
132,25
0,25
1190,2
2
emp
17,1
5,04
0,8
30,1
17,9
12,5
0,3
1,7
57,6
3,5
0,007
31,7
178,247
238
i 1
i 1
239
10
11
50
55
60
65
70
75
80
85
90
95
100
61
61
59
71
80
76
90
106
98
100
114
242
120
100
80
60
40
20
0
0
20
40
60
80
100
120
Y
i 1
(a bX i ) F (a, b)
2
(
Y
Y
)
i
i
n
Na osnovu datih izraza odreuju se:
- najbolja ocjena parametra b, koji se naziva i regresioni parametar:
243
xy
X Y
i i
2
i
( X i )( Yi )
n
( X i ) 2
n X i Yi ( X i )( Yi )
n X i2 ( X i ) 2
XY
X2
Y2
50
61
3050
2500
3721
55
61
3355
3025
3721
60
59
3540
3600
3481
65
71
4615
4225
5041
70
80
5600
4900
6400
75
76
5700
5625
5776
80
90
7200
6400
8100
85
106
9010
7225
11236
90
98
8820
8100
9604
10
95
100
9500
9025
10000
11
100
114
11400
10000
12996
825
916
71790
64625
80076
Xsr
Ysr
1.12364
-1
75.000
83.273
Y 1.000 1.124 X
jednaina za koju vai da je suma kvadriranih rezidualnih odstupanja
(Y Y )
(Y Y )
jednaine
poiva
na
tumaenju
koeficijenta
2
2
C x C REG (Yi Y ) 2
( X i Yi
X Y )
2
i
n
( X i ) 2
b xy
Variranje
Disperzija (suma
DF (broj
kvadrata
stepeni
odstupanja)
slobode)
CUKUPNO
n-1
CREG
CREZ
n-2
Varijansa
(srednja kvadratna greka)
Ukupno
[Yi - Y ]
Linearna
regresija
2
SDRSEG
[ Yi Y ]
Rezidualno
[Yi - Yi ]
246
2
SDREG
CREG
DFREG
C REZ
SDYX
DFREZ
( X i X ) 2 X i2
X
n
64625
825 2
2750000
11
Y
9162
CUKUPNO (Yi Y ) 2 Yi 2 i 80076
3798,182
n
11
( X
Y)
825 * 916
CREG b xy b( X iY i i i 1.123 * (71790
3472,036
n
11
C REG
C
REG 3472.036
DFREG
1
C
326,145 326,145
REZ
36,238
DFREZ
n2
9
2
SDREG
2
SDREZ
2
SDREG
3472,036
95,812
2
SDREZ
36,238
Kako je tablina vrijednost Fa(1),1,9=5,12 manja od Femp 95,812 odbacuje se
nulta a prihvata alternativna hipoteza i zakljuuje da se vrijednost
izraunatog nagiba statistiki znaajno razlikuje od nule.
Srednja kvadratna greka reziduala (standardna greka ocjene ili standardna
greka reziduala) oznaava se sa SEXY i izraunava se prema:
Femp
2
SEYX SDREZ
36,238 6,0198
Konano, regresiona jednaina se moe napisati i u obliku:
247
SEb
2
SEYX
(X
X )2
jer je varijansa od
SE
2
b
2
SEYX
(X
X )2
Uz
2
SEYX
36,238
SEb
0.115
2
2750
(Xi X )
slijedi da je:
t
b c 1,124 0
9,774
SEb
0,115
a gornja
L2 = b + t(1-a/2), (n-2) Sb,
Kako je tablina vrijednost za t(1-/2),
konano
L1 = 1,1235 2,262x0,115 = 0,8631
L2 = 1,1235 + 2,262x0,115 = 1,38377
odnosno:
[L1 L2] : [0,8631 1,38377]
(n-2)
SE
Y YX
(X i X )2
2 1
SE
[
]
YX n
(X i X )2
1
X
SE a SE [
]
n ( X i X )2
2
YX
y t (1 / 2) SEYX
( X p X )2
1
n ( X i X )2
249
gdje je t tablina vrijednost za DF=n-2=11-2=9 i p=0.05, koja iznosi t(1a/2);0.05 = 2.262. SEYZ je standardna greka predikcije koja iznosi:
(Y Y ) 2
326,145
SEYZ i
36,238 6,020
n2
11 2
Odavde slijedi da je interval povjerenja za predvianje dat sa
1 (70 75) 2
Y 77.655 2.262 * 6.020
77.655 4.306
11
2750
Y a
X i
b
Na osnovu ove jednaine je
y = 73,35 x=x0.
Poreenje dvije linije regresije
Poreenje dvije (ili vie) linija regresije est je problem, bilo da su u pitanju
odnosi istih varijabli u dvije razliite populacije (ee) ili vie razliitih
populacija (rjee). Pri tome se mogu porediti samo odsjeci (a), nagibi (b) ili
zajedno i jedni i drugi.
(A)
(B)
(C)
(D)
250
2
( SDYX
)p
( ( X i X ) 2 )1
2
( SDYX
)2
( ( X i X ) 2 ) 2
Uzorak 2
1579,86
2138,71
4413,42
3245,68
13325,3
5981,25
N
B
CREZ
26
2,79
996,51
30
1,52
1055,65
DFREZ
24
28
(X i X )
xy ( X
y
Uzorak 1
X )(Yi Y )
(Yi Y ) 2
251
b1
(3245,68)2
1055,65
2138,71
996,51 1055,65
2
SDYX
39,46
24 28
39,46
39,46
2,79 1,52
SEb1 b2
0,21 t
6,05
1579,86 2138,71
0,21
(SDyx)2p = 39,46
SEb1-b2 = 0,2
t = 6,05
Za DF = 52 tablina vrijednost t0.05;52 = 2,007. Na osnovu svega odbacuje se
H0 jer je p < 0,001, to znai da se vrijednosti regresionih koeficijenata
statistiki znaajno razlikuju jedna od druge.
C2 5981,25
Primjer 2.
U tabeli 5 prikazani su rezultati dovijeni primjenom dvije metode mjerenja I
i II. Usporedbom nagiba b1 i b2 i odsjeaka a1 i a2 donijeti zakljuak o
mogunosti zamjene jedne metode mjerenja drugom.
Tabela 5. Dvije metode mjerenja
n
1
2
3
4
5
6
7
8
9
10
11
12
13
X1
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
3,25
3,5
Y1
10
8
12
12
14
12
14
18
17
20
18
20
21
X1Y1
5
6
12
15
21
21
32
40,5
42,5
55
54
65
73,5
X2
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
3,25
3,5
252
Y2
15
14
15
12
13
15
16
17
20
19
20
21
22
X2Y2
7,5
10,5
15
15
19,5
26,25
32
38,25
50
52,25
60
68,25
77
Parametar
Metod I
Metod II
13
13
Suma X
26.00
26.00
Suma X2
63.375
63.375
Suma Y
198.000
219.000
Suma Y
3.226.000
3.815.000
Suma XY
442.500
471.500
Xsr
2.000
2.000
Ysr
15.231
16.846
( X i X )2
Primjer 3.
Eksperiment je tako planiran da daje podatke o uinku odreenog lijeka na
smanjenje broja otkucaja srca u minuti. U njemu je uestvovalo 6 odraslih
ispitanika. Nezavisno promjenjiva veliina je doza lijeka u miligramima, a
zavisno promjenjiva veliina je razlika izmeu broja otkucaja poslije i prije
davanja (istog) lijeka:
Doza X
Redukcija broja
(mg)
otkucaja srcaY
10
12
12
14
16
253
Doza (mg)
SD xy
b
a y b x
SD x2
dok su:
y
y
n
x
x
n
xy
SDxy
xy
n
x2 2
SD
x
n
2
x
y
10
8
12
12
14
16
72
x2
1
4
9
16
25
36
91
254
y2
100
64
144
144
196
256
904
xy
10
16
36
48
70
96
276
r=0,907; r 2 0,822
Zamjenom izraunatih vrijednosti konstanti a=7,205 i b= 1,37, dobijamo da
je: y=7,205+1,37x
Ovo je linearna jednaina koja opisuje povezanost izmeu ispitivanih
obiljeja. Da bi smo ovu pravu linju ucrtali u dijagram rasturanja potrebne su
dvije koordinate, koje emo dobiti ako za dvije proizvoljno odabrane
vrijednosti nezavisno promjenjive (tj. doze ispitivanog lijeka), izraunamo
vrijednost redukcije broja otkucaja srca u minuti:
za x=1 y=8,575
za
x=3 z=11,315
y=7,205+1,37*x
1
6
y 12
1
2
1
6
Doza
lijeka
(mg)
255
Zadaci za vjebu:
Zadatak 1.
Nacrtati dijagram rasturanja i izraunati parametre prave linije koja najbolje
odgovara sljedeim podacima:
Godine X
s. k. p. Y
30
30
30
40
40
40
40
50
50
50
108
110
106
125
120
118
119
132
137
134
60
60
60
60
60
70
70
70
70
70
148
145
146
147
144
162
156
164
158
159
y 68,78 1,3 * x
Zadatak 2.
Sljedei podaci pokazuju optiku gustinu odreene supstance na razliitim
nivoima koncentracije:
Nivo konc. X 80
120
520
Op. gustina Y 0,08 0,12 0,18 0,21 0,28 0,28 0,38 0,4
0,6
y 0,012 0,0011* x
y c y
2
r
2
y i y
256
yi
y
yi y c
yc
yc y
yi y
x
Slika 6.4. Ilustracija uz procjenu linije regresije
Bliskost ovog koeficjenta jedinici oznaava adekvatnost opisivanja
prikupljenih podataka ba tom pravom linijom, a bliskost izraunatog
koeficjenta determinacije nuli znai da je ova prava linija potpuno
neprikladna. Tada je vjerovatno rije o nekom drugom tipu povezanosti koji
nije linearan.
U primjeru 6.1.2.1. izraunaemo i koeficjent determinacije. Da bi olakali
izraunavanje formuliemo radnu tabelu:
yc 7,205 1,37 x
yi y
( yi y) 2
yc y
( yc y) 2
10
8,575
-2
-3,425
11,731
9,945
-4
16
-2,055
4,223
12
11,315
-0,685
0,469
12
12,685
0,685
0,469
14
14,055
2,055
4,223
16
15,425
16
3,425
11,731
40
257
32,846
32,846
0,82
40
Rezultat koji smo dobili znai da linija regresije dobro opisuje prikupljene
podatke. Dobijena vrijednost koeficjenta determinacije tumai se pomou
tablica na strani 196/7. Detaljna upotreba tablice bie objanjena u 6.1.6.
r2
162 168
258
x2
xy
-4
132
16
-528
-3
136
-408
-2
143
-286
-1
146
-146
154
158
158
160
320
162
486
168
16
672
1359
60
268
x0
y 151
SD x2 6,67
SD xy 29,78
b 4,46
a 151
259
165
162
160
158
156
154
146
143
136
132
Godine
1969 1970 1971 1972 1973 1974 1975 1976 1977
Primjer
Podaci se odnose na vrijednosti krvnog pritiska, itane pomou dvije metode
kod ispitanika sa esencijalnom hipertenzijom. U ispitianju je uestvovalo 8
ispitanika.
Ispitiva je elio utvrditi jainu veze izmeu ova dva naina mjerenja
(oznaeni su sa metoda 1 i metoda 2):
260
Metoda 1.
Metoda 2.
132
130
138
134
144
132
146
140
152
144
158
150
130
122
162
160
Prije svega odreuje se jednaina regresije, tj. prava linija koja najbolje
odgovara dobijenim podacima:
y 6,25 x
Koeficjent determinacije
2
y c y
951,5 0,922
r2
2
103,2
y i y
y1 y
yc y
x2
y2
xy
yc
132
130
17424
16900
17160
125.75
81
175.5625
138
134
19044
17956
18492
131.75
25
52.5625
144
132
20736
17424
19008
137.75
49
1.5625
146
140
21316
19600
20440
139.75
0.5625
152
144
23104
20736
21888
145.75
25
45.5625
158
150
24964
22500
23700
151.75
121
162.5625
130
122
16900
14884
15860
123.75
289
232.5625
162
160
26244
25600
25920
155.75
441
280.5625
1162
1112
169726
155600
162468
1032
951.5
261
262
6. 4. Zakljuak
a) Upoznali smo se sa linearnom regresijom i korelacijom.
b) Naglasili smo metod identifikovanja modela, tj. oznaili smo u kojim
situacijama regresija, a u kojim korelacija daje odgovor na pitanje koje nas
interesuje.
c) Opisali smo proces dobijanja jednaine regresije.
d) Uoli smo postupak za procjenu dobijene linearne regresije pomou
koeficjenta determinacije.
e) Upoznali smo se sa linearnim trendom, koji predstavlja poseban sluaj
linije regresije.
f) Na kraju smo otkrili jainu veze meu ispitivanim obiljejima pomou
koeficjenta linearne korelacije.
6. 5. Korelacija ranga
U neparametarske analitike metode ubraja se i korelacija ranga. Ovo je
jednostavan ali manje pouzdan metod ispitivanja paralelizma a upotrebljava
se u onim situacijama kad se ne smije koristiti odgovarajui parametarski
korelacioni metod.
Primjena neparametarskih metoda analize, od kojih je jedna i
neparametarska korelacija, karakteristina je za slijedee sluajeve:
a) Kada su klasni intervali naglaeno nejednaki;
b) Kada postoje suvie veliki ekstremi;
v) Kada mjerno-numeriki nisu potpuno definisani (zna se samo da je jedan
lan vei ili manji od prethodnih).
Metod korelacije ranga sastoji se u procjeni jaine povezanosti dvije
distribucije rangova empirijskih podataka. Procedura ispitivanja stepena
povezanosti primjenom ovog metoda sastoji se od:
- formiranje distribucije rangova promjenjivih veliina;
- odreivanje koeficijenta korelacije ranga;
- procjena vrijednosti koeficijenta korelacije ranga.
Prvi korak u ovom metodu ispitivanja jaine povezanosti je formiranje
distribucije ranga posebno za svaku promjenjivu veliinu. To znai da
podatke jedne promjenjive veliine treba transformisati u rang (numeriki
izraz rastueg ili opadajueg redoslijeda).
Pri rangiranju, mora se voditi rauna o:
a) broj rangova mora biti jednak broju podataka;
b) jedinice posmatranja koje imaju vrijednost obiljeja moraju imati i isti
rang. Rang istih vrijednosti obiljeja posmatranja (vezani rang) predstavlja
263
6 * * d i2
i 1
2
n(n 1)
Spirmanov koeficijent dobija se na slijedei nain:
1. Rangiraju se vrijednosti i jednog i drugog obiljeja od 1 do n (n-broj
podataka);
2. Uspostavi se razlika u rangovima d za isti par podataka oduzimanjem
ranga za Y od ranga X;
3. Tako dobijena razlika kvadrira se, a potom se svi kvadrati saberu;
4. Izrauna se ;
5. Protumai se dobijeni koeficjent korelacije ranga pomou tablice.
Kada je broj parova n 10 znaajnost dobijenog koeficjenta korelacije
ocjenjuje se pomou kriterijuma t-testa. Vrijednost t izraunava se iz izraza:
n2
t *
1 2
Znaajnost veze procjenjuje se pomou t-tablica za n-2 stepeni sloboda. to
je vjerovatnoa nulte hipoteze p manja, veza izmeu obiljeja je jaa.
Zapravo, nulta hipoteza podrazumijeva da izmeu rangova dva poreena
obiljeja nema veze (korelacije). Kada je empirijska t-vrijednost vea od
tabline t-vrijednosti za odabranu vjerovatnou nulte hipoteze (0,05 ili 0,01)
kod n-2 stepena slobode, veza (korelacija) je ubjedljiva.
264
Primjer 1.
U ispitivanju povezanosti izmeu godina starosti i nalaza EEG-a uestvovalo
je 20 ispitanika, podaci su dati u tabeli:
godine X 20 21 22 24 27 30 31 33 35 38 40 42 44 46 48 51 53 55 58 60
EEG Y 98 75 95 100 99 65 64 70 85 74 68 66 71 62 69 54 63 52 67 55
rang X
rang Y
d2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
20
21
22
24
27
30
31
33
35
38
40
42
44
46
48
51
53
55
58
60
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
98
75
95
100
99
65
64
70
85
74
68
66
71
62
69
54
63
52
67
55
18
15
17
20
19
7
6
12
16
14
10
8
13
4
11
2
5
1
9
3
-17
-13
-14
-16
-14
-1
1
-4
-7
-4
1
4
0
10
4
14
12
17
10
17
289
169
196
256
196
1
1
16
49
16
1
16
0
100
16
196
144
289
100
289
0,76 * a * t 4,99
Kako je empirijska t-vrijednost t=4,99 vea od tabline t-vrijednosti tj.
t=2,88 za vjerovatnou nulte hipoteze od 0,01 kod DF = 18 (stepen slobode)
zakljuujemo da je veza (korelacija) vrlo jaka. Negativan predznak oznaava
da je povezanost obrnutog smjera izmeu ispitivanih obiljeja.
265
Primjer 2.
Grupa od 9 ispitanika odgovarala je na testove inteligencije i kreativnosti.
Rezultati ovih testova dati su u sledeoj tabeli:
Skor 1 (X)
100
110
102
101
115
118
120
119
119
Skor 2 (Y)
30
28
20
20
20
18
35
32
26
Rx
Ry
d2
100
30
-6
36
110
28
-2
102
20
101
20
-1
115
20
118
18
25
120
35
119
7,5
32
-0,5
0,25
119
7,5
26
2,5
6,25
76,5
266
7. Statistike tablice
4758
5754
9994
7267
5134
7896
7830
1855
1356
5375
2906
1971
6479
8110
6890
0945
6726
9288
0906
8775
5508
4999
4812
0878
0535
9790
3983
8425
8431
8883
9604
9072
1920
2759
8051
6200
3010
3679
2751
8289
0916
9107
6683
1756
2524
7824
4745
5967
1713
3804
4892
8484
6266
9469
6207
0274
2925
2702
4350
0864
6848
5851
5106
7657
9569
6196
9499
4098
6790
0362
4139
4224
4331
8034
4650
0739
7321
2113
0121
1719
0106
7201
4001
8964
0829
3103
5434
8935
1712
6168
7508
6079
2041
4531
1073
8268
3539
9093
8375
3746
1615
3030
3704
4347
6537
5031
8994
5461
6463
6895
1692
8330
8062
3962
6743
0442
7792
4714
7347
4709
4941
9217
3767
9192
7094
9855
3893
1148
3515
7037
3518
8577
8248
0113
7401
3926
0368
2170
2034
1785
3070
8418
5587
0712
5105
3590
1707
7531
4151
8954
8296
5103
5984
6151
8180
4965
5725
4171
3593
6849
1696
2761
5678
5603
1671
4242
2302
7598
5258
0292
0302
0155
1081
1778
5302
2424
5724
5719
4820
3355
3053
8665
2925
1271
2724
3419
4943
0807
7271
7074
5009
7585
6212
4947
4855
5593
8272
6790
0234
8753
8154
7178
7049
9839
4306
6560
6096
6538
2487
5856
6813
5228
8793
7847
1075
7697
0102
7837
0157
4974
2897
9309
9018
8991
5729
7620
9393
8785
4526
4640
4111
3714
6987
3020
0295
6763
9750
0321
5142
2945
3339
2352
9766
6702
0823
2681
2052
1702
0121
6423
8991
2735
3357
9100
3143
7632
2955
0107
1464
0726
7381
7001
5046
8143
2495
9797
5873
9153
2452
4981
6124
4499
2866
7380
6590
9123
6247
9842
7847
1803
4833
5038
6916
4253
3601
4665
8768
8916
5475
7361
7401
8915
3255
6930
8691
8186
2581
5589
8970
5202
0091
2920
3771
3214
9387
5193
9793
6861
5774
9595
8051
2323
6138
6525
9071
2150
2760
6896
8398
1271
3944
0446
4409
8050
7337
5601
1527
3207
7271
6274
2023
0942
3580
0705
5522
0638
9572
8665
9892
4813
267
xx
SD
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
0000
0398
0793
1179
1554
1915
2257
2580
2881
3159
3413
3643
3849
4032
4192
4332
4452
4554
4641
4713
0040
0438
0832
1217
1519
1950
2291
2611
2910
3186
3438
3665
3869
4049
4207
4345
4463
4564
4649
4719
0080
0478
0871
1255
1628
1985
2324
2642
2939
3212
3461
3686
3888
4066
4222
4357
4474
4573
4656
4726
0120
0517
0910
1293
1664
2019
2357
2673
2967
3238
3485
3708
3907
4082
4236
4370
4484
4582
4664
4732
0160
0557
0948
1331
1700
2054
2389
2704
2995
3264
3508
3729
3925
4099
4251
4382
4495
4591
4671
4738
0199
0596
0987
1368
1736
2088
2422
2734
3023
3289
3531
3749
3944
4115
4265
4394
4505
4599
4678
4744
0239
0636
1026
1406
1772
2123
2454
2764
3051
3315
3554
3770
3962
4131
4279
4406
4515
4608
4686
4750
0279
0675
1064
1443
1808
2157
2486
2794
3078
3340
3577
3790
3980
4147
4292
4418
4525
4611
4693
4756
0319
0714
1103
1480
1844
2190
2517
2823
3106
3365
3599
3810
3997
4162
4306
4429
4335
4625
4699
4761
0359
0753
1141
1517
1879
2224
2549
2852
3133
3389
3621
3830
4015
4177
4319
4441
4545
4633
4706
4767
2,0
4772 4778 4783 4788 4793 4708 4803 4808 4812 4817
2,1
4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2,2
4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2,3
4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2,4
4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2,5
4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2,6
4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2,7
4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2,8
4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2,9
4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3,0
4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
3,1
4900 4991 4991 4991 4992 4992 4992 4992 4993 4993
3,2
4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3,3
4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3,4
4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3,6
4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
3,9
4999
4,0
49997
4,5
4999966
5,0
499999713
268
Studentova t-distribucija
Stepen
slobode
1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
22
24
26
28
30
40
60
80
100
120
0,10
6,31
2,92
2,35
2,13
2,02
1,94
1,90
1,86
1,83
1,81
1,78
1,76
1,75
1,73
1,72
1,72
1,71
1,71
1,70
1,70
1,68
1,67
1,66
1,66
1,66
1,645
nivo greke = p
0,05
0,01
0,001
12,70 63,70 637,00
4,30
9,92
31,60
3,18
5,84
12,90
2,78
4,60
8,61
2,57
4,03
6,86
2,45
3,71
5,96
2,36
3,50
5,40
2,31
3,36
5,04
2,26
3,25
4,78
2,23
3,17
4,59
2,18
3,06
4,32
2,14
2,98
4,14
2,12
2,92
4,02
2,10
2,88
3,92
2,09
2,84
3,85
2,07
2,82
3,79
2,06
2,80
3,74
2,06
2,78
3,71
2,05
2,76
3,67
2,04
2,75
3,65
2,02
2,70
3,55
2,00
2,66
3,46
1,99
2,64
3,42
1,98
2,63
3,39
1,98
2,62
3,77
1,96
2,576
3,291
269
Hi-kvadrat distribucija
Stepeni slobode
p=0,10
p= 0,05
p=0,01
p=0,001
2.706
3.841
6.635
10.827
4.605
5.991
9.210
13.815
6.251
7.815
11.341
16.268
7.779
9.488
13.277
18.465
9.236
11.070
15.086
20.517
10.645
12.592
16.812
22.457
12.017
14.067
18.475
24.322
13.362
15.507
20.090
26.125
14.684
16.919
21.666
27.877
10
15.987
18.307
23.209
29.588
11
17.275
19.675
24.725
31.264
12
18.549
21.026
26.217
32.909
13
19.812
22.362
27.688
34.528
14
21.064
23.685
29.141
36.123
15
22.307
24.996
30.578
37.697
16
23.542
26.296
32.000
39.252
17
24.769
27.587
33.409
40.790
18
25.989
28.869
34.805
42.312
19
27.204
30.144
36.191
43.820
20
28.412
31.410
37.566
45.315
21
29.615
32.671
38.932
46.797
22
30.813
33.924
40.289
48.268
23
32.007
35.172
41.638
49.728
24
33.196
36.415
42.980
51.179
25
34.382
37.652
44.314
52.620
26
35.563
38.885
45.642
54.052
27
36.741
40.113
46.963
55.476
28
37.916
41.337
48.278
56.893
29
39.087
42.557
49.588
58.302
30
40.256
43.773
50.892
59.703
270
1
161,45
18.512
10.129
7,71
6.607
5.987
5.591
5.317
5.117
4.965
4.844
4.747
4.667
4.600
4.543
4.494
4.451
4.414
4.381
4.351
4.325
4.301
4.279
4.260
4.242
4.225
4.210
4.196
4.183
4.183
4.085
4.001
3.946
24
249,04
19.453
8.638
5.774
4.527
3.841
3.410
3.116
2.900
2.737
2.609
2.505
2.420
2.349
2.288
2.235
2.190
2.150
2.114
2.083
2.054
2.028
2.005
1.984
1.965
1.947
1.930
1.915
1.901
1.901
1.793
1.700
1.608
254,32
19.496
8.527
5.628
4.365
3.669
3.230
2.928
2.707
2.538
2.405
2.296
2.207
2.131
2.066
2.010
1.961
1.917
1.878
1.843
1.812
1.783
1.757
1.733
1.711
1.691
1.672
1.654
1.638
1.638
1.509
1.389
1.254
3.841
2.996
1.517
1.000
2.605
2.372
2.214
2.098
271
1.938
1.752
n-k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
1
4052,1
98.495
34.117
21.200
16.258
13.744
12.346
11.295
10.561
10.044
9.647
9.330
9.074
8.862
8.683
8.532
8.400
8.285
8.184
8.096
8.017
7.944
7.881
7.823
7.770
7.722
7.677
7.636
7.597
7.563
7.314
7.077
6.851
24
6234,2
99.464
26.597
13.930
9.467
7.313
6.074
5.279
4.730
4.327
4.021
3.780
3.586
3.427
3.294
3.181
3.083
2.999
2.925
2.859
2.801
2.749
2.702
2.659
2.620
2.585
2.551
2.522
2.494
2.469
2.287
2.115
1.950
6366,5
99.504
26.122
13.464
9.019
6.880
5.650
4.859
4.311
3.909
3.602
3.361
3.165
3.005
2.869
2.753
2.653
2.566
2.489
2.421
2.360
2.305
2.256
2.210
2.169
2.132
2.096
2.064
2.034
2.006
1.805
1.601
1.380
6.635
4.605
1.791
1.000
3.782
3.320
3.017
2.802
272
2.511
2.182
n-k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
Stepeni
slobode
2
3
1
18,00 26,70
2
6,09 8,28
3
4,50 5,88
4
3,93 5,00
5
3,61 4,54
6
3,46 4,34
7
3,34 4,16
8
3,26 4,04
9
3,20 3,95
10
3,15 3,88
11
3,11 3,82
12
3,08 3,77
13
3,06 3,73
14
3,03 3,70
15
3,01 3,67
16
3,00 3,65
17
2,98 3,62
18
2,97 3,61
19
2,96 3,59
20
2,95 3,58
24
2,92 3,53
30
2,89 3,48
40
2,86 3,44
60
2,83 3,40
120
2,80 3,36
2,77 3,32
Vrijednosti Q za p=0,05
Broj grupa
4
5
6
7
32,80 37,20 40,50 43,10
9,80 10,89 11,73 12,43
6,83 7,51 8,04 8,47
5,76 6,31 6,73 7,06
5,18 5,64 5,99 6,28
4,90 5,31 5,63 5,89
4,68 5,06 5,35 5,59
4,53 4,89 5,17 5,40
4,42 4,76 5,02 5,24
4,33 4,66 4,91 5,12
4,26 4,58 4,82 5,03
4,20 4,51 4,75 4,95
4,15 4,46 4,69 4,88
4,11 4,41 4,64 4,83
4,08 4,37 4,59 4,78
4,05 4,34 4,56 4,74
4,02 4,31 4,52 4,70
4,00 4,28 4,49 4,67
3,98 4,26 4,47 4,64
3,96 4,24 4,45 4,62
3,90 4,17 4,37 4,54
3,84 4,11 4,30 4,46
3,79 4,04 4,23 4,39
3,74 3,98 4,16 4,31
3,69 3,92 4,10 4,24
3,63 3,86 4,03 4,17
273
8
45,40
13,03
8,85
7,35
6,52
6,12
5,80
5,60
5,43
5,30
5,20
5,12
5,05
4,99
4,94
4,90
4,86
4,83
4,79
4,77
4,68
4,60
4,52
4,44
4,36
4,29
9
47,30
13,54
9,18
7,60
6,74
6,32
5,99
5,77
5,60
5,46
5,35
5,27
5,19
5,13
5,08
5,03
4,99
4,96
4,92
4,90
4,81
4,72
4,63
4,55
4,47
4,39
10
49,10
13,99
9,46
7,83
6,93
6,49
6,15
5,92
5,74
5,60
5,49
5,40
5,32
5,25
5,20
5,15
5,11
5,07
5,04
5,01
4,92
4,83
4,74
4,65
4,56
4,47
274
0,268
0,263
0,259
0,254
0,25
0,246
0,242
0,239
0,235
0,232
0,229
0,226
0,223
0,22
0,217
0,215
0,212
0,21
0,207
0,205
0,203
0,201
0,199
0,197
0,195
0,19
0,186
0,182
0,178
0,174
0,171
0,168
0,165
0,162
0,159
0,154
0,15
0,145
0,142
0,138
0,124
0,113
0,105
0,098
0,092
0,088
0,08
0,074
0,069
0,065
0,062
0,348
0,341
0,336
0,330
0,325
0,320
0,315
0,310
0,306
0,302
0,298
0,294
0,290
0,286
0,283
0,280
0,276
0,270
0,273
0,267
0,264
0,262
0,259
0,256
0,254
0,248
0,242
0,237
0,232
0,228
0,223
0,219
0,215
0,212
0,208
0,202
0,196
0,190
0,185
0,181
0,162
0,148
0,137
0,128
0,121
0,115
0,105
0,097
0,091
0,086
0,081
275
276
277
8. Literatura
1.
2.
3.
4.
279