You are on page 1of 143

1.

UVOD

1.1 POJAM STATISTIKE

Suvremeni čovjek je bombardiran informacijama iz mnogobrojnih izvora.Gotovo je


nemoguće ukloniti im se.A kad je već tako,onda je najbolje pokušati upotrijebiti ih na
najbolji mogući način.I za takovu odluku mu trebaju informacije,ili preciznije
kazano,umijeće „informiranog potrošača informacija“.Tim umijećem može ovladati
pomoću statistike.Obistinilo se“proročanstvo“ koje je 1912. navijestio H.G. Wells rekavši:
„Statistički način mišljenja jednog će dana za svakodnevni život građana postati
jednako neophodan kao znanje čitanja i pisanja“.
Prije no što navedemo neke od postojećih,a ima ih više od 100,definicija statistike,dobro
bi bilo navesti mišljenje jednog statističara (Mainland) koji kaže:“Nijedna definicija ne
znači mnogo tako dugo dok nismo proučili ono na čemu radimo,a tada je svaka definicija
gotovo nepotrebna.
Statistika je znanstvena disciplina koja na organizirani način
prikuplja,selekcionira,grupira,prezentira,analizira i interpretira rezultate provedene
analize brojčanih i nebrojčanih činjenica,koje zovemo podacima.
Značenje same riječi statistika,koja vuče latinske korijene,se mijenjalo s vremenom.Kako
su počeci statistike vezani za državne potrebe,nije neobično što se jako dugo,preciznije
sve do sredine XIX stoljeća,ona koristila za označavanje državi značajnih brojčanih i
nebrojčanih podataka.Danas ista riječ može značiti:
 znanost prikupljanja,organizacije i interpretacije podataka
 skup uređenih brojčanih podataka o ljudima,predmetima i pojavama
prikupljanjem kojih se bave specijalizirane stručne,znanstveno-istraživačke i
druge ustanove
 brojčane pokazatelje izračunate na osnovu vrijednosti iz uzorka koji predstavljaju
ocjenu parametara osnovnog statističkog skupa.

1.2 RAZVOJ STATISTIKE

Statistika se razvijala u ovisnosti o dva ,međusobno neovisna,čimbenika.Jedan od njih je


država odnosno potrebe države za podacima o njenom pučanstvu u svrhu uspješnog
prikupljanja poreza ili popunjavanja vojnih postrojbi.Takovo sustavno prikupljanje
podataka je zabilježeno već u staroj Kini,Egiptu,Grčkoj i Rimu,a slična praksa je
nastavljena i poslije.Drugi,za razvoj statistike,odlučujući čimbenik je bio razvoj
znanosti,kako prirodnih tako i društvenih te njihove potrebe za statističkim podacima.
Posebnu ulogu je pri tome imao razvoj matematike,točnije rečeno,jedne njene discipline i
to teorije vjerojatnosti,koji se zbio u prvoj polovici prošlog vijeka.

1.3 VRSTE STATISTIKE

Statističke informacije,analitičke metode i modeli su neizostavni dio proučavanja


prirodnih i društvenih pojava.Teško je naći područje ljudske djelatnosti koje ne koristi
statistički „servis“.Obzirom na način obuhvata problema,razlikujemo dvije vrste statistike:
 deskriptivnu
 inferencijalnu

1
Deskriptivna statistika se odlikuje potpunim obuhvatom statističkog skupa.Prosudbe
koje se pri tome donose odnose se isključivo na prikupljeni statistički materijal.
Metodama sažimanja raspoložive podatke pokuša učiniti što preglednijim,
razumljivijim,podesnijim za daljnju obradu.Pri tome se koriste metode grafičke
analize kako za prikaz sređene statističke građe tako i za predočavanje rezultata
provedene obrade iste.
Inferencijalnu statistiku odlikuje nepotpuni (parcijalni) obuhvat statističke građe.Tu
se osobine osnovnog skupa (populacije) procjenjuju pomoću rezultata analize
provedene na dijelu tog skupa (uzorku).U pravilu,statistička građa je izrazito obimna
pa bi njeno prikupljanje i obradu pratili visoki materijalni troškovi.Odabir te
„reprezentacije“ statističkog skupa prate ograničenja vezana uz stupanj
reprezentativnosti te predstavničke skupine podataka.Naravno,tu je i neizbježan rizik
pri poopćavanju,tako dobivenih rezultata,na čitav skup.Rizik i nesigurnost ovog
induktivnog postupka se procjenjuju uz pomoć metoda teorije vjerojatnosti.

1.4 DEFINICIJE NEKIH POJMOVA

Statistički skup tvore statističke jedinice (ljudi,predmeti,pojave) koje se odlikuju sličnim


zajedničkim svojstvima.Upravo ta svojstva su predmet statističkog istraživanja.Zbog toga
je veoma važno precizno definirati uvjete kojima moraju udovoljiti jedinice da bi pripale
skupu,preciznije,skup je nužno definirati:

 pojmovno
 prostorno
 vremenski

Pojmovno definirati statistički skup znači navesti osobine koje mora imati jedinica da bi
bila obuhvaćena tim skupom. Prostornom definicijom statističkog skupa se označava
prostor uz koji su vezane sve jedinice statističkog skupa,a vremenskom definicijom
statističkog skupa određuje se vrijeme uz koje su vezane sve promatrane statističke
jedinice (malodobne osobe u Hrvatskoj,stanje 31.prosinca 2008.g.).Statistički skup je
homogen ako je sastavljen od statističkih jedinica koje zadovoljavaju sva tri zahtjeva
gornje definicije.Samo homogeni skupovi mogu biti predmet statističke analize.
Ponekad se svjesno reducira pojmovna,prostorna ili pak jedna i druga
istovremeno,definicija statističkog skupa.Smanjenje troškova postupka je razlog tog
svjesnog isključivanja iz obrade dijela jedinica statističkog skupa.
Obilježja jedinica statističkog skupa su svojstva po kojima te jedinice sliče ili se
međusobno razlikuju.Statistička obrada se provodi samo na obilježjima koja se odlikuju
varijabilnošću.Ona se manifestira u različitim pojavnim oblicima (modalitetima) tog
obilježja.
Brojevi kojima se iskazuje učestalost pojedinog modaliteta,bilo u apsolutnom,bilo u
relativnom iznosu,zovu se apsolutnim,odnosno relativnim frekvencijama.
Svojstva jedinica statističkog skupa se mjere.Riječ je o postupku kojim se jedinicama
statističkog skupa pridjeljuju slovne ili brojčane oznake u skladu s pojavnim oblikom
mjerenog obilježja,a prema utvrđenim pravilima koje zovemo mjernim skalama.
Razlikujemo nominalnu,ordinarnu,intervalnu i omjernu skalu.
Nominalna skala je dana u obliku nenumeričkog skupa,odnosno niza naziva
(atributa,kategorija,slovnih oznaka) koji se pridjeljuju statističkim jedinicama u skladu s

2
izmjerenim obilježjem.Modaliteti se najčešće navode abecednim redom ili prema
učestalosti istih ili na neki drugi način.Iznimno,modalitetima nominalnog obilježja se

mogu pridijeliti i brojčane oznake.Ti brojevi imaju značenje „naljepnice“,obične oznake te


zbog toga nad njima nisu dopustive računske operacije.
Ordinarna skala pridružuje jedinicama statističkog skupa brojeve,slovne oznake ili
simbole.Skup modaliteta ove skale je uvijek uređen skup.Mjesto unutar njega,odnosno
položaj na skali modaliteta za svaku statističku jedinicu je određen intenzitetom
izmjerenog obilježja.Ni nad brojevnim oznakama modaliteta ove skale nisu dozvolile
računske operacije.
Intervalna i omjerna skala koriste isključivo brojeve za označavanje modaliteta
promatranog obilježja.Razlikuju se u tretmanu nule i relativnih odnosa brojeva s tih
skala.Kod intervalne skale položaj nule i mjerna jedinica se određuju dogovorno.Tipičan
primjer takove skale je temperaturna skala.Nula je jedna od mogućih vrijednosti
izmjerenog obilježja.Kod omjerne skale nula znači odsustvo promatranog svojstva,a
omjeri izmjerenih vrijednosti imaju smisleno značenje ( stanje na bankovnom računu je
primjer takovog obilježja).Nad modalitetima obilježja koja se vezuju uz intervalnu i
omjernu skalu dopuštene su osnovne računske operacije,a njihovi rezultati imaju smisleno
značenje.

1.5 VRSTE OBILJEŽJA ( VARIJABLI )

Razlikujemo kvantitativna od kvalitativnih obilježja.Kvalitativna su ona kod kojih se


svojstva jedinica statističkog skupa najčešće iskazuju nenumerički.Među kvalitativna
obilježja se ubrajaju nominalna i redoslijedna (obilježja ranga).Nominalna se dijele na
atributivna i geografska (prostorna) obilježja.Nominalna obilježja su vezana uz
nominalnu skalu.Modalitetima atributivnog obilježja se iskazuje svojstvo (atribut)
statističke jedinice (nacionalnost,spol,vjerska pripadnost,vrsta djelatnosti itd…).
Modaliteti geografskog obilježja su iskaz veze jedinica statističkog skupa sa prostorom
djelovanja (mjesto boravka,državljanstvo,konzularna predstavništva itd..).
Alternativno obilježje je vrsta nominalnog obilježja koje se javlja samo u dva modaliteta
(spol).Ordinarno obilježje (varijabla) je vezano uz ordinarnu skalu (školska
sprema,stupanj kvalifikacije,ocjena na ispitu,stupanj ekonomske razvijenosti idt).Ponekad
je primjereno modalitete ordinarne varijable zamijeniti brojevima ili pak brojčano
iskazane modalitete supstituirati drugim brojevima.Zamjenu treba provesti tako da ne
bude turbulentna tj.da ne uzrokuje mijenjanje redoslijeda.
Kvantitativna obilježja su vezana uz intervalnu i omjernu skalu.Vrijednosti izmjerenog
obilježja se isključivo iskazuju brojevima.Kvantitativna obilježja kod kojih se jedinicama
statističkog skupa pridjeljuju vrijednosti pomoću omjerne skale zovu se numerička
obilježja. Numeričko obilježje koje može poprimiti konačan broj vrijednosti zove se
diskretno obilježje.Modaliteti diskretnog obilježja ne moraju nužno biti cjelobrojni (broj
cipela).Numeričko obilježje je kontinuirano ako može teorijski poprimiti sve vrijednosti
iz nekog intervala (visina,težina,duljina,mjesečna primanja..).Odabirom prikladne mjerne
jedinice moguće je kontinuirano obilježje transformirati u diskretno i obratno,diskretno u
kontinuirano.Radni staž je tipično kontinuirano obilježje.Ali ako za modalitete obilježja
proglasimo navršene godine radnog staža,ono postaje diskretno numeričko obilježje.ili
pak,ako diskretna varijabla poprima jako puno vrijednosti,ima razloga tretirati ju kao
kontinuirano obilježje.Rezultati osnovnih računskih operacija koje su dozvoljene nad
modalitetima numeričkog obilježja imaju smisleno značenje.

3
Pored kvalitativnih i kvantitativnih varijabli postoji i vremenska varijabla vezana uz
kronološki uređenu skalu modaliteta.

1.6 STATISTIČKO ISTRAŽIVANJE

Svako ozbiljno statističko istraživanje se provodi u nekoliko faza.Može se govoriti o


gruboj ili posve detaljnoj raščlambi samog postupka.Neizostavni koraci su:

 Precizna definicija cilja i detaljno razrađen plan statističke studije


 Organizirano prikupljanje statističkih podataka
 Sređivanje,odnosno grupiranje prikupljenih informacija
 Tablično i grafičko prikazivanje sređene statističke građe
 Statistička analiza i interpretacija provedene obrade podataka

Svaki od ovih koraka je veoma važan i treba ga provoditi s dužnom pažnjom.Posebno se


to odnosi na prvi od navedenih.Loše i neprecizno definiran cilj i nejasan plan rada može
rezultirati potpunim ili djelomičnim promašajem,besmislenim trošenjem vremena i
sredstava izvođača i naručitelja projekta.U okviru prve faze statističkog istraživanja se
odvija precizna definicija statističkog skupa,odabire izvođač projekta,određuje kratnost
istraživačkog postupka,točnost očekivanog rezultata,tim za prikupljanje podataka,način
prikupljanja istih te izvori podataka i izvori iz kojih će se financirati projekt.

2. UNOS,GRUPIRANJE,TABLIČNO I GRAFIČKO
PRIKAZIVANJE STATISTIČKIH PODATAKA

2.1 UNOS STATISTIČKIH PODATAKA

Prikupljeni statistički podaci su ishodišna točka statističke obrade kojoj prethodi


formiranje datoteke.Pokretanjem programa MS Excel na ekranu će se pojaviti radni list
(Scheet) u obliku dvodimenzionalne tablice koja ima 65536 redaka (označenih prirodnim
brojevima počevši od 1za prvi red do 65536 za posljednji) i 256 stupaca (označenih
slovima od A do IV).Radni listovi su dio knjige (Book) u koju ćemo pohraniti prikupljene
podatke i sve ostale informacije koje se odnose na definirani statistički skup.Svaki uređeni
par retka i stupca (a takovih kombinacija ima 16 777 216 na samo jednom radnom listu)
predstavlja jedinstvenu ćeliju (cell).Ovaj impozantan broj je dovoljna garancija dostatnosti
prostora za ispis nekih novih podataka bez preklapanja sa postojećim zauzetim ćelijama.
Pri unosu podataka preporučljivo je držati se nekih pravila uobičajenih za pisanje
statističkih tablica.Neka od njih su:
 U jedan stupac unositi podatke za jedno obilježje.Prvi,zaglavni redak se obično
koristi za tumačenje sadržaja redaka.Pri tome nije preporučljivo korištenje
skraćenica za naslove jer,u slučaju više obilježja,može doći do zabune.
 Ako se podaci odnose na kvalitativna obilježja,zbog specifičnosti samog
programskog paketa (o tome će biti poslije riječ),preporučljivo je modalitete
obilježja zamijeniti brojčanim oznakama.

4
 Ako kvantitativno kontinuirano obilježje ima vrijednost 0,nulu treba i napisati.Ni u
kom slučaju zamijeniti je praznom ćelijom koja u MS Excelu znači odsustvo
promatranog obilježja.
 Decimalni brojevi se pišu s decimalnim zarezom.Broj decimala ovisi o
konkretnom slučaju.Preporučljivo je podatke i rezultate homogenizirati obzirom na
taj moment te taj ujednačen broj decimala svesti na razumnu mjeru ( obično dva ili
tri decimalna mjesta osim u slučaju vrlo malih brojeva).
 Iz sigurnosnih razloga dobro je,s vremena na vrijeme,podatke pohraniti u vanjsku
memoriju.

Primjer 2.1

Studij
Filozofski=1
Medicina=2
Veterina=3 Godine
Redni broj Prezime i ime Strojarstvo=4 studiranja
1 Brčić Mate 4 4
2 Miščić Mia 1 5
3 Kadić Tina 2 6
4 Turić Tadej 3 5
5 Cvitić Florijan 3 7
6 Dragić Karolina 2 4
7 Pavlović Ana 1 5
8 Runje Rino 1 5
9 Križanac Krsto 3 4
10 Karlović Drago 4 7

2.2 GRUPIRANJE STATISTIČKIH PODATAKA

Nakon prikupljanja informacija i formiranja datoteke,u pravilu,smo „zatrpani“množinom


podataka brojčane i nebrojčane prirode.Kako nam predstoji grafički i tablični prikaz
prikupljene statističke građe te njihova daljnja obrada,poželjno je podatke učiniti što
preglednijim.Grupiranjem podataka se upravo to postiže.Riječ je o postupku kojim se
statistički skup od N elemenata,nastao prema zadanom obilježju,raščlanjuje u k
disjunktnih podskupova navezanih na k prethodno utvrđenih modaliteta aktuelnog
obilježja i to uz uvažavanje principa iscrpnosti i isključivosti.Isključivost je posljedica
disjunktnosti podskupova ( svaka statistička jedinica se može pojaviti u samo jednom od
podskupova i to samo jednom).Iscrpnost postupka znači sveobuhvat sirove statističke
građe tj.ni jedan od podataka se ne smije isključiti iz obrade.Opseg podskupa,odnosno
broj jedinica i-tog modaliteta se zove apsolutna frekvencija fi .Obzirom na način
formiranja podskupova jasno je da je opseg samog statističkog skupa jednak zbroju
opsega svih podskupova tj.
k
∑ fi
N = i=1
Statistički niz je skup svih uređenih parova utvrđenih modaliteta promatranog obilježja i
pripadnih apsolutnih frekvencija
( ai , fi ) i=1 ,2,...,k

5
Strukturu podataka je moguće proučavati određivanjem udjela pojedinih modaliteta u
opsegu skupa.U tu svrhu se koriste relativne frekvencije
f ( ai )
k
fi
∑fj
pi = p(ai ) = N = j =1 , i = 1,2,….,k
Radi lakšeg tumačenja,često se relativne frekvencije iskazuju u postocima (množe se sa
100) ili,nešto rjeđe,u promilima (množe se sa 1000).
f ( ai )
100
Pi = P(ai ) = p(ai ) 100 = N
2.2.1 GRUPIRANJE KVANTITATIVNIH PODATAKA

Kvantitativni podaci koje najčešće obrađujemo su numeričkim podaci. Razlikujemo:

 Grupiranje diskretnih podataka


 Grupiranje diskretnih podataka u razrede
 Grupiranje kontinuiranih podataka

Statistički niz koji nastaje grupiranjem statističkih jedinica prema numeričkom


obilježju,zove se numerički statistički niz.Grupiranjem prema numeričkom obilježju
nastaju grupe različitih vrijednosti obilježja.Te numeričke grupe se obično navode od
manjih prema većim vrijednostima obilježja.Rjeđe obrnuto.U slučaju malog broja
modaliteta,svaki od njih može predstavljati zasebnu grupu zajedno sa pripadajućom
apsolutnom frekvencijom.Taj uređeni niz parova je distribucija frekvencija:

( xi ,fi ) , i = 1,2,…,k
k
∑ fi
i=1 = N

Osim apsolutnih fi i relativnih pi frekvencija koriste se i kumulativni nizovi


frekvencija.Kumulativni niz „manje od“ nastaje uzastopnim zbrajanjem,kumuliranjem,
frekvencija od prve prema zadnjoj u nizu.Kumulativni niz „veće od“ nastaje postupnim
zbrajanjem frekvencija i to od zadnje u nizu prema prvoj.Pojedini član ki niza
kumulativnih frekvencija „manje od“ ( „veće od“ ) znači broj jedinica statističkog skupa
koje imaju vrijednost obilježja manju ili jednaku ( veću ili jednaku) od vrijednosti
obilježja xi.

Primjer 2.2
Podaci o broju gostiju u malom obiteljskom hotelu Plava laguna u gradu X tijekom srpnja
i kolovoza 2008.godine dani su slijedećom tablicom:

6
Tablica 2.1.

Datum Broj gostiju Datum Broj gostiju Datum Broj gostiju Datum Broj gostiju
1.07. 5 16.07. 12 1.08. 15 16.08. 15
2.07. 5 17.07. 12 2.08. 15 17.08. 10
3.07. 10 18.07. 12 3.08. 15 18.08. 10
4.07. 10 19.07. 12 4.08. 15 19.08. 10
5.07. 10 20.07. 12 5.08. 15 20.08. 15
6.07. 10 21.07. 14 6.08. 15 21.08. 10
7.07. 15 22.07. 15 7.08. 15 22.08. 10
8.07. 15 23.07. 15 8.08. 15 23.08. 10
9.07. 15 24.07. 15 9.08. 15 24.08. 10
10.07. 15 25.07. 14 10.08. 15 25.08. 15
11.07. 15 26.07. 14 11.08. 15 26.08. 15
12.07. 15 27.07. 14 12.08. 15 27.08. 15
13.07. 15 28.07. 14 13.08. 10 28.08. 10
14.07. 15 29.07. 15 14.08. 10 29.08. 10
15.07. 12 30.07. 15 15.08. 15 30.08. 10
31.07. 15 31.08. 10

a) Formirajte razdiobu frekvencija za dane podatke te interpretirajte jednu od frekvencija.


b) Izračunajte relativne frekvencije i pripadajući kumulativni niz.Interpretirajte po jednu
frekvencija u svakom od tih nizova.
c) Formirajte kumulativne nizove „manje od“ i „više od“ te interpretirajte po jednu od
kumulativnih frekvencija iz svakog od tih nizova.

Rješenje:

a) Najprije ćemo unijeti podatke u novi radni list programa MS Excel i to u stupac A od
A2 do A63.U ćeliju A1 upišemo naslov Broj gostiju.Prije pokretanja postupka
grupiranja podataka,moramo utvrditi modalitete našeg obilježja.Najmanji broj gostiju
je 5,a najveći 15.Ne vjerujemo li svojoj moći zapažanja,te brojeve ćemo dobiti
pomoću funkcija za izračun maksimuma i minimuma (=MAX(raspon podataka),
=MIN(raspon podataka) ).Naslov iz ćelije A1 kopiramo u ćeliju B1.U ćeliju B2
upišemo najmanju vrijednost modaliteta,a zatim,redom,do zaključno sa ćelijom
B12,preostale modalitete prema rastućim vrijednostima.

7
Procedura koju koristimo za grupiranje podataka zove se Histogram.Nalazi se u sklopu
Data Analysis koji aktiviramo klikom lijevom tipkom miša sa padajućeg izbornika Tools.
Napomena:Moguće je da opcija Dana Analysis ne bude u ponudi padajućeg izbornika
Tools.U tom slučaju na istom izborniku biramo Add-Ins,pa u ponuđenom okviru
označimo opcije Analysis ToolPak i Analysis ToolPak-VBA.OK je potvrda
izbora.Kliknemo li ponovo na Tools,njegov izbornik će imati i nama potrebnu opciju Data
Analysis.U njenoj ponudi je Histogram koji ćemo označiti i potvrditi izbor.Na ekranu će
se pojaviti dijaloški okvir Histograma koji se sastoji iz dva dijela. U prvom dijelu ( Input )
unosimo podatke koje želimo obraditi,a u drugom ( Output options ) biramo mjesto i
rezultate koje želimo dobiti.

Kliknuli smo unutar okvira gornjeg dijela dijaloškog okvira i unijeli adrese ćelija koje
sadrže naše podatke (A1:A63).Slično,nakon klika u okvir Bin Range upisali smo adrese
ćelija sa modalitetima (B1:B12).Zbog obuhvata ćelija sa naslovima ( A1 i B1 ),moramo na
to upozoriti računalo aktiviranjem opcije Labels.U protivnom će se pobuniti jer će ih
tretirati kao podatke nenumeričke prirode kojima procedura Histogram nije vična.

8
U drugom dijelu dijaloškog okvira Histogram – Output options odabrali smo mjesto
tablice s grupiranim podacima.Kako je želimo imati na istom radnom listu,jer tu gužve
očito nema,mišem smo označimo opciju Output Range.U prozorčić koji smo na taj način
otvorili,upisali smo adresu ćelije koju želimo kao krajnu lijevu gornju ćeliju dijela radnog
lista na kojem će biti smještena tablica sa rezultatima obrade (D3).Rezultate smo mogli
smjestiti i na novi radni list naše radne knjige.Za takav izbor je potrebno odabrati opciju
New Worksheet Ply.U slučaju da rezultate trebamo u novoj radnoj knjizi,koristit ćemo
opciju New Workbook.Od tri ponude iz donjeg dijela Output Options
 Pareto (sorted histogram) - u izlaznoj tablici frekvencije razvrsta u padajući niz
 Cumulative Percentage - tablicu proširi nizom kumulativnih frekvencija
 Chart Output – uz izlaznu tablicu da i grafički prikaz grupiranih podataka
odabrali smo,u skladu sa traženjem,drugu od navedenih.

Tablica.2.2

Broj Frequenc
gostiju y
5 2
6 0
7 0
8 0
9 0
10 17
11 0
12 6
13 0
14 5
15 32
More 0
62

Interpretacija:
Dobili smo numerički statistički niz odnosno distribuciju frekvencija.Jedna od numeričkih
grupa je (15,32).Znači da 32 statističke jedinice imaju vrijednost obilježja 15.Preciznije
kazano,čak u 32 dana, tijekom srpnja i kolovoza u malom obiteljskom hotelu u gradu X,je
bravilo po 15 gostiju.

b) U MS Excelu ne postoji funkcija za direktni izračun relativnih frekvencija.Stoga to


moramo sami uraditi pomoću odgovarajuće formule
fi
pi = N * 100 , i = 1,2,..,k
k
∑ fi
N = i=1
Opseg statističkog skupa N je zbroj apsolutnih frekvencija koje se nalaze u stupcu E u
izlaznoj tablici.U zaglavnoj ćeliji E1 tablice sa rezultatima grupiranja piše Frequency i
odnosi se na apsolutne frekvencije.Znači trebamo zbroj podataka iz bloka ćelija E4:E15.
(„modalitetu“ More će,zbog principa iscrpnosti,pripasti apsolutna frekvencija 0).
Najjednostavnije ćemo ga dobiti tako da označimo te ćelije,a zatim kliknemo na ikonicu
Σ na vrpci sa alatima Standard.U ćeliji E16 dobit ćemo traženi opseg 62.Znali smo ga i
prije,ali nije na odmet provesti ovaj izračun i kao kontrolu postupka grupiranja.Istu stvar

9
smo mogli uraditi i pomoću naredbe za zbrajanje = SUM(E4:E15) koju možemo upisat u
E16.Pritiskom na tipku Enter,u istoj ćeliji,pojavi se tražena suma.Relativne frekvencije
ćemo
interpolirati između stupca apsolutnih i stupca kumulativnih frekvencija.S tom nakanom
ćemo na to mjesto umetnuti stupac.Najprije označimo stupac F klikom na njegovu
oznaku,a zatim Insert/Column na padajućem izborniku.U „novu“ ćeliju F3 upišemo
Rel.Frekv.U F4 ćemo upisati =F4/$E$16 i unos potvrditi pritiskom na tipku
Enter.Dobivene brojeve ćemo pretvoriti u postotke pomoću ikonice % na vrpci sa alatima
Formating. Na istoj vrpci imamo i ikonicu za podešavanje broja decimala u skladu sa
željenom točnošću rezultata.Ostale relativne frekvencije ćemo odrediti korištenjem jedne
od prednosti programa MS Excela koji nam omogućava određivanje niza vrijednosti koje
se računaju pomoću iste formule na način da izračunamo samo jednu od njih,a ostale
dobijemo kopiranjem.Kopiranje postupka se provede tako da označimo ćeliju izračuna (u
našem slučaju F4),a zatim pokazivač miša dovučemo do donjeg desnog kuta iste ćelije do
pojave križića (+),te „prošetajmo“ njime kroz ćelije u kojima očekujemo preostale
relativne frekvencije.Kontrole radi,zbrojimo upravo dobivene vrijednosti.Zbroj mora biti
100.Apsolutna adresa ćelije sa opsegom statističkog skupa je upotrijebljena kako bi se pri
kopiranju osigurala postojanost njenog sadržaja (opsega skupa).Kumulativni niz relativnih
frekvencija već imamo u prvoj varijanti „izlazne“tablice.

Tablica 2.3
Broj gostiju Broj dana Rel.Fekv. Cumulative %
5 2 3,23% 3,23%
6 0 0,00% 3,23%
7 0 0,00% 3,23%
8 0 0,00% 3,23%
9 0 0,00% 3,23%
10 17 27,42% 30,65%
11 0 0,00% 30,65%
12 6 9,68% 40,32%
13 0 0,00% 40,32%
14 5 8,06% 48,39%
15 32 51,61% 100,00%
More 0 0,00% 100,00%
62 100,00%

Interpretacija:
U 6 dana promatranog razdoblja,u malom obiteljskom hotelu u gradu X, bilo je 12 gostiju
što znači da je učestalost (apsolutna frekvencija) modaliteta a = 12 iznosi f = 6.Udio tih
dana u ukupnom broju N = 62 iznosi 9,68% (pripadna relativna frekvencija.Pripadna
kumulativna frekvencija iznosi 40,32% i znači udio dana u kojima je bilo najviše 12
gostiju u tom hotelu,odnosno udio dana u kojima broj gostiju nije premašio 12.

c)Pripremit ćemo mjesta za tražene kumulativne nizove frekvencija.Smjestit ćemo ih


ispred kumulativnog niza relativnih frekvencija.Umetnut ćemo dva potrebna stupca na
poznati način.Označit ćemo stupac G i nastaviti sa Insert/Columns te ponoviti postupak.U
ćelije G3 i H3 upisujemo,redom,pripadne naslove Kumulativni niz „manje od“ i
Kumulativni niz “više
od“.Nakon toga u ćeliju G4 kopiramo apsolutnu frekvenciju iz E4 a u G5 unesemo
=G4+E5 i potvrda sa Pritiskom tipke Enter.Ostale članove ovog niza ćemo dobiti
kopiranjem mišem sadržaja ćelije G5.Posljednji član niza mora biti opseg skupa 62.U

10
stupcu H počevši od posljednje ćelije kreiramo niz „više od“.U H15 upisujemo 0,a u
prethodnoj ćeliji H14 pišemo
=H15+E14.Potvrda sa Enter i kopiranje ćelije H14 u preostale ćelije ovog stupca tablice
do H4 u kojoj mora pisati opseg skupa.

Tablica 2.4

Interpretacija:
Broj dana, u kojima broj gostiju u malom obiteljskom hotelu u gradu X tijekom srpnja i
kolovoza,nije bio veći od 12 iznosi 25,dok tijekom 43 dana u istom hotelu ,u istom
razdoblju, je boravilo 12 ili više od 12 gostiju.

U prethodnom primjeru smo grupirali diskretno numeričko obilježje.Svaka vrijednost


obilježja (modalitet) je bila zasebna numerička grupa za koju frekvencija znači učestalost
pojavljivanja*.
U slučaju kontinuiranog numeričkog obilježja,ili u slučaju diskretnog obilježja velikog
raspona vrijednosti,grupiranje vršimo po razredima.Ako je riječ o diskretnom
obilježju,formirat ćemo posebne grupe za one modalitete koji se javljaju osjetno više od
drugih (tj. one koji imaju veće frekvencije),a za vrijednosti obilježja znatno manje
učestalosti,formirat ćemo zajedničke grupe koje se zovu razredi.Razred će obuhvatiti one
statističke jedinice čija vrijednost obilježja nije manja od donje granice razreda i,
istovremeno,ne premašuje gornju granicu istog razred.Pokazat ćemo na slijedećem
primjeru.

________________________________________________________
*Napomena:Ubuduće će nam frekvencije značiti apsolutne frekvencije

11
Primjer 2.3
Podaci o broju djece po obiteljima su dani slijedećom tablicom:

Tablica 2.5

Broj djece Broj obitelji


1 18
2 15
3 4
4 1
5 1
6 0
7 0
8 1

Kako prva dva modaliteta napadno dominiraju nad ostalima,opravdano je sve


modalitete,osim prva dva,smjestiti u jedan razred.Tablica tako grupiranih podataka će biti:

Tablica 2.6
Broj djece Broj obitelji
1 18
2 15
(3–8) 7

U slučaju izrazito velikog broja različitih vrijednosti koje može poprimiti diskretno
numeričko obilježje,svi modaliteti će se predočiti razredima.Bit će to razredi sa nepravim

(nominalnim) granicama.Riječ je o razredima kod kojih se donja granica promatranog


razreda razlikuje od gornje granice prethodnog razreda za jedinicu mjere promatranog
obilježja.

Primjer 2.4
Podaci o broju osoba u naselju X koje nisu starije od 30 godina su dani tablicom:

Navršene godine života Broj osoba


0-7 17
8 - 15 29
16 - 22 24
23 - 30 41

Modaliteti kontinuiranog numeričkog obilježja se uvijek formiraju kao


razredi.Distribucija frekvencija takovog obilježja je skup uređenih parova razreda
( DGi ,GG i ]

12
i njima pridruženih frekvencija fi .Razredi koji se formiraju za kontinuirano numeričko
obilježje imaju prave ili precizne granice što znači da broj kojim završava jedan razred je
ujedno broj kojim počinje slijedeći razred.Među razredima nema diskontinuiteta.

Primjer 2.5
Podaci o kaznama za prometne prekršaje načinjene tijekom jednog vikenda u mjestu X
dani su tablicom:
Tablica 2.8
Iznos kazne Broj počinitelja
300 - 500 12
500 - 800 7
800 - 1200 5
1200 - 2000 5
2000 - 4

U slučaju da razredi vezani za modalitete kontinuiranog obilježja nemaju prave


granice,prije statističke obrade tih podataka,nominalne granice se zamjenjuju preciznim
granicama.Zamjenu je moguće provesti na nekoliko načina.Najjednostavniji je
„kompromis“ kod kojeg se sve donje granice smanje ,a gornje povećaju za polovinu
razmaka susjednih razreda.Razredi numeričkog obilježja su većinom zatvoreni (to znači
da imaju donju i gornju granicu).Ima situacija kada nije moguće odrediti jednu,ili
obje,ekstremalne vrijednosti obilježja.Ako se to odnosi na najmanju vrijednost,onda će
prvi razred biti bez donje granice.Analogno,ako ne znamo maksimalnu vrijednost,onda će
nam posljednji razred biti otvoren.U najgorem slučaju,dogodit će se jedno i drugo.Ti
„ispadi“ granica uzrokuju otvorene razrede.Ponekad to može biti čak i
prednost.Međutim,u većini slučajeva,otvoreni razredi kompliciraju
situaciju.Točnije,nismo u stanju izračunati veličine koje pretpostavljaju poznate granice
razreda.Radi toga,statističkoj obradi mora prethoditi procjena nedostatnih granica.
Veličina razreda je razlika gornje i donje granice razreda,točnije to je razlika prave gornje
i prave donje granice razreda.
Obzirom na širinu razreda,grupiranje podataka je moguće obaviti dvojako.Jedan način
pretpostavlja razrede jednake širine.Uobičajeno ga je koristiti kod podataka ujednačene
varijabilnosti tj. kod simetričnih,ili približno simetričnih,razdioba.
Ako su podaci asimetrično raspoređeni oko srednjih vrijednosti,tada je preporučljivo
koristiti razrede različitih veličina i to,na mjestima velike gustoće podataka,uske razrede,a
široke razrede na mjestima velike raspršenosti podataka.
Sredina je aritmetička sredina donje i gornje granice razreda.
DG i +GG i
i=
m 2 .
Pri statističkoj obradi podataka,veoma često,sredine razreda zamjenjuju sve ostale
vrijednosti u razredu.Tu zamjensku ulogu će uspješno obaviti u onim slučajevima koji se
odlikuju ravnomjernim rasporedom veličina unutar razreda.Grupiranje podataka u razrede
je kompromisni čin.Njegova dobra strana je osjetno povećana preglednost
podataka.Cijena kojom to plaćamo je neizbježna greška nastala zamjenskom ulogom
razredne sredine.Odabir razreda je veoma važan.Smanjenjem širine razreda možemo
smanjiti neizbježnu grešku.Pri tome ne treba pretjerivati da ne bi žrtvovali prilično skupo
plaćenu preglednost.Optimalan izbor je onaj koji uravnotežuje prednosti i mane postupka
ne gubeći iz vida svrhu same statističke obrade.

13
Primjer 2.6

Podaci o duljini „neradnog“ staža nezaposlenih osoba u gradu X dani su tablicom:

Tablica 2.9

Redni broj Vrijeme čekanja Redni broj Vrijeme čekanja Redni broj Vrijeme čekanja
(u mjesecima) (u mjesecima) (u mjesecima)
1 5 31 14 61 8
2 21 32 13 62 18
3 7 33 33 63 22
4 13 34 25 64 20
5 9 35 24 65 34
6 10 36 21 66 29
7 21 37 22 67 19
8 28 38 17 68 16
9 35 39 11 69 10
10 18 40 7 70 7
11 6 41 3 71 4
12 2 42 1 72 14
13 11 43 21 73 18
14 14 44 16 74 21
15 10 45 19 75 29
16 4 46 11 76 23
17 5 47 8 77 19
18 9 48 6 78 18
19 9 49 22 79 9
20 12 50 2 80 10
21 17 51 13 81 13
22 22 52 15 82 17
23 21 53 15 83 42
24 30 54 25 84 4
25 32 55 39 85 7
26 39 56 31 86 12
27 28 57 34 87 13
28 21 58 22 88 25
29 20 59 39 89 22
30 19 60 21 90 30

a) Grupirajte podatke u razrede i interpretirajte jednu od dobivenih frekvencija.


b) Formirajte kumulativne nizove frekvencija „manje od“ i „više od“,te interpretirajte po
jednu iz svakog od nizova.
c) Izračunajte relativne frekvencije,iskažite ih u postocima te odredite pripadni
kumulativni niz.Interpretirajte po jedan član u svakom od tih nizova.
d) Tablicom predočite sve dobivene rezultate.

Rješenje:

a) Prije statističke obrade unijet ćemo podatke u stupac B,stupac A ćemo upotrijebiti za
unos rednih bojeva.Zaglavne ćelije koristimo za odgovarajuće naslove.I ovo je slučaj
diskretnog numeričkog obilježja.Podaci bi bili osjetno pregledniji ako ih grupiramo u

14
razrede.U tu svrhu moramo znati ekstremalne vrijednosti obilježja koje ćemo dobiti
pomoću odgovarajućih funkcija ( =MIN(B2:B91) odnosno =MAX(B2:B91)) koje ćemo
unijeti u neku ćeliju sa strane ( recimo A93 i A94).Traženi ekstremi su 1 i 42.Sada
moramo donijeti odluku o širini razreda.Pri tome ne treba pretjerivati ni u kom
smislu.Preuzak razred ne doprinosi preglednosti,a preširok bi doveo do odveć neprecizne
tablice.Kompromisni izbor bi mogao biti 6 (mjeseci).Nakon te odluke ćemo načiniti i
posljednji pripremni korak tako da naslov iz B1 kopiramo u C1 a u blok ćelija počevši od
C2 (6) do C8 (42) upišemo gornje granice razreda.I sada pokrećemo proceduru iz
prethodnog primjera.To znači biramo Tools na glavnom izborniku,Data Analysis na
njegovom padajućem izborniku i Histogram u dobivenom okviru.U gornjem dijelu
otvorenog prozora,u okviru Input Range mora stajati B2:B91 a u Bin Range C2:C8
Naslove smo izostavili pa ne trebamo označiti Labels.U Output Range neka bude E2 u
otvorenom prozorčiću.Ne smijemo zaboraviti označiti tražene Cumulative Percentage.

Tablica 2.10

Preporučljivo je „dotjerati“ izlaznu tablicu.U tu svrhu smo u E2 Bin zamijenili sa Vrijeme


čekanja na posao,a frekvencijama dali odgovarajući Broj nezaposlenih.U stupcu E su
razredi zastupljeni sa svojim gornjim granicama.Ne bi bilo na odmet navesti i donje
granice tako da u E3 umjesto 6 napišemo 0 - 6,u D4 umjesto 12 pišemo 6 - 12
itd.Provjerit ćemo i opseg skupa zbrajanjem frekvencija u stupcu F.
Interpretacija:
Između 90 nezaposlenih osoba 22 njih čeka na posao najmanje 19 mjeseci odnosno
najviše dvije godine (24 mjeseca).

b) Da bi načinili mjesto za tražene kumulativne nizove frekvencija i relativne


frekvencije,označit ćemo stupac G i onda na uobičajeni način (Insert/Columns) umetnuti
tri stupca.U zaglavne ćelije G2,H2 i I2 upisat ćemo,redom,pripadajuće
naslove:Kumulativni niz „manje od“, Kumulativni niz „veće od“,Relativne
frekvencije.Sada generiramo tražene nizove frekvencija.Počinjemo sa ćelijom G3 u koju
ćemo kopirati frekvenciju iz F3.U slijedećoj ćeliji G4 „obrazac“ za izračun =F4+G3.Enter
i kopiranje sadržaja iste ćelije u blok ćelija od G5 do,zaključno,G10.
Sada ćemo izgraditi i drugi traženi kumulativni niz.Ovaj se gradi od kraja.U H10 upišemo
0,a zatim u H9 upišemo =H10+F9.Enter i kopiranje sadržaja ove ćelije u „predšasnički“
blok H8 do H3.

15
Interpretacija: Među nezaposlenim osobama u gadu X,broj onih koje čekaju na posao
maksimalno dvije godine (24 mjeseca) ili manje od toga,iznosi 71,dok 41 osoba na posao
čeka najmanje dvije godine ili više od toga.

c) Mjesto za relativne frekvencije smo već pripremili.Preostaje nam odrediti ih.U F11 smo
pohranili opseg skupa pa ćemo u I3 upisati =F3/$E$11.Nastavak je poznat (Enter i
kopiranje upisanog sadržaja u blok I4:I10).Nakon toga ćemo ih zbrojiti.
Interpretacija: Udio osoba koje čekaju na posao najviše dvije godine (24 mjeseca) i ne
manje od 19 mjeseci,iznosi 24,44%.

Tablica 2.11

Prethodna dva primjera su nam pokazala kako se može formirati distribucija frekvencija
diskretnog numeričkog obilježja.U prvom slučaju smo imali numeričko obilježje čija je
svaka vrijednost (modalitet) tvorila zasebnu numeričku grupu.U drugo slučaju,zbog
znatno većeg boja tih vrijednosti i očekivane glomaznosti tablice,formirali smo razrede
kako bi dimenzije rezultirajuće tablice smjestili u poželjne okvire.Naravno,mogli smo se
zadovoljiti i sa manje „elegantnom“ (čitaj:preglednom) tablicom.
Takovih dilema nećemo imati u slučajevima kontinuiranog numeričkog
obilježja.Grupiranje u razrede je, u tom slučaju, naš usud.Postupak je posve analogan
onom koji smo upravo upoznali sa posebnim osvrtom na nešto drugačiju prirodu granica
razreda koja je usklađena sa kontinuiranim karakterom obilježja.

2.2.2 GRUPIRANJE KVALITATIVNIH PODATAKA

Histogram ne barata sa nenumeričkim podacima.Zbog toga,formiranje statističkih nizova


za kvalitativna obilježja,na način kako smo to do sada radili za numerička obilježja,nije
moguć.Ali je zato moguća prilagodba naših,nebrojčano iskazanih modaliteta,zahtjevima
Histograma.Podacima damo privremeno „brojčano ruho“ kako bi primjena Histograma
bila moguća,te,po izvršenom grupiranju,vratimo stare oznake.

16
Primjer 2.7
U poduzeću X 80 zaposlenika planira mjesec u kojem želi koristiti godišnji odmor.Plan
„želja“ za 2005.godinu je dan slijedećom tablicom:

Tablica 2.12

Redni broj Mjesec Redni broj Mjesec Redni broj Mjesec Redni broj Mjesec
1 veljača 21 kolovoz 41 siječanj 61 ožujak
2 lipanj 22 prosinac 42 siječanj 62 travanj
3 lipanj 23 prosinac 43 svibanj 63 ožujak
4 srpanj 24 rujan 44 kolovoz 64 studeni
5 kolovoz 25 listopad 45 kolovoz 65 kolovoz
6 siječanj 26 srpanj 46 srpanj 66 kolovoz
7 siječanj 27 srpanj 47 srpanj 67 prosinac
8 svibanj 28 srpanj 48 srpanj 68 kolovoz
9 kolovoz 29 prosinac 49 kolovoz 69 srpanj
10 kolovoz 30 kolovoz 50 kolovoz 70 srpanj
11 srpanj 31 kolovoz 51 kolovoz 71 srpanj
12 srpanj 32 lipanj 52 kolovoz 72 srpanj
13 srpanj 33 srpanj 53 srpanj 73 kolovoz
14 kolovoz 34 srpanj 54 srpanj 74 siječanj
15 kolovoz 35 srpanj 55 srpanj 75 siječanj
16 srpanj 36 srpanj 56 srpanj 76 svibanj
17 srpanj 37 srpanj 57 rujan 77 lipanj
18 srpanj 38 siječanj 58 rujan 78 kolovoz
19 travanj 39 svibanj 59 listopad 79 lipanj
20 lipanj 40 siječanj 60 veljača 80 rujan
a)Grupirajte podatke prema mjesecima u godini i objasnite značenje dobivenog podatka za
srpanj.
b)Izračunajte relativne frekvencije i objasnite dobivenu vrijednost za siječanj.

Rješenje:
Kvalitativnim modalitetima (mjeseci u godini) pridijelit ćemo privremene brojčane
„naljepnice“.Najjednostavnije bi bilo mjesecima pridružiti njihove redne brojeve:siječanj
= 1,veljača = 2 idt do prosinac = 12.Tablica tako „maskiranih“ podataka će biti:

17
Tablica 2.13

siječanj=1 siječanj=1 siječanj=1 siječanj=1


veljača=2 veljača=2 veljača=2 veljača=2
ožujak=3 ožujak=3 ožujak=3 ožujak=3
travanj=4 travanj=4 travanj=4 travanj=4
svibanj=5 svibanj=5 svibanj=5 svibanj=5
srpanj=7 srpanj=7 srpanj=7 srpanj=7
kolovoz=8 kolovoz=8 kolovoz=8 kolovoz=8
rujan=9 rujan=9 rujan=9 rujan=9
listopad=10 listopad=10 listopad=10 listopad=10
studeni=11 studeni=11 studeni=11 studeni=11
Redni prosinac=12 Redni prosinac=12 Redni prosinac=12 Redni prosinac=12
broj broj broj broj
1 2 21 8 41 1 61 3
2 6 22 12 42 1 62 4
3 6 23 12 43 5 63 3
4 7 24 9 44 8 64 11
5 8 25 10 45 8 65 8
6 1 26 7 46 7 66 8
7 1 27 7 47 7 67 12
8 5 28 7 48 7 68 8
9 8 29 12 49 8 69 7
10 8 30 8 50 8 70 7
11 7 31 8 51 8 71 7
12 7 32 6 52 8 72 7
13 7 33 7 53 7 73 8
14 8 34 7 54 7 74 1
15 8 35 7 55 7 75 1
16 7 36 7 56 7 76 5
17 7 37 7 57 9 77 6
18 7 38 1 58 9 78 8
19 4 39 5 59 10 79 6
20 6 40 1 60 2 80 9
Ovako transformirane podatke ćemo unijeti na novi radni list i to u stupac A redne brojeve
a u stupac B oznake mjeseca prema željama ispitanika.Kao i obično,zaglavne ćelije ćemo
iskoristiti za odgovarajuće naslove.Nakon toga možemo u potpunosti ponoviti poznati
postupak. Znači,u ćeliju C1 kopirati naslov iz ćelije B1.Modalitete u blok ćelija C2:C13
redom počevši od 1 u C2 do 12 u C13.Potom poznati slijed koraka.Tools na glavnom
izborniku,Data Analysis na pripadnom padajućem izborniku i Histogram u ponuđenom
prozorčiću.Iznenađenja neće biti ni nakon toga.Klik unutar okvira Input Range i zapis
raspona podataka B1:B81.Potom se „odšetamo¨do okvira Bin range kojem damo adrese
modaliteta C1:C13 .Ne zaboravimo da smo uključili i naslove.Stoga kvačica na
Labels.Ako slučajno to zaboravimo,Histogram će odbiti nastaviti sa radom.U drugom
dijelu dijaloškog okvira zatražit ćemo ispis rezultata na postojećem radnom listu te u
otvorenom prozorčiću locirati ćeliju koju želimo kao krajnju gornju lijevu izlazne
tablice.Neka to bude F4.I potvrda svega rečenog.OK.

18
Tablica 2.14

Interpretacija: U srpnju (sedmom mjesecu) 26 ispitanika planira svoj godišnji odmor.

Možemo načiniti preinaku u izlaznoj tablici kao:u F4 Bin zamijeniti sa Mjeseci,a u G4


upisati Broj uposlenika,oznake modaliteta u stupcu F zamijeniti imenima mjeseci.

b) Relativne frekvencije moramo sami izračunati.Stoga najprije odredimo mjesto za


njih.Neka to bude stupac H.U H4 naslov (Relativne frekvencije),zatim zbroj apsolutnih
frekvencija iz stupca G u ćeliju G18 i u H5 zapis rutine =G5/$G$18.Enter.Sadržaj te
ćelije ćemo mišem kopirati u blok H6:H17.Dobivene brojeve pomoću odgovarajuće
ikonice pretvorimo u postotke te im priskrbimo dvije decimale.Reda radi,zbrojimo
izračunate relativne frekvencije.Suma mora biti 100%.

19
Tablica 2.16

Interpretacija:
Udio zaposlenika koji planiraju godišnji odmor u siječnju iznosi 10%.

2.3 TABLIČNO PRIKAZIVANJE STATISTIČKIH PODATAKA

Statističke tablice su neizostavni dio statističke obrade podataka.Veoma su prikladne za


jasan i pregledan prikaz prikupljene i grupirane statističke građe,te na taj način postaju i
prikladna osnova za grafički prikaz i daljnju analizu iste.
Naslov tablice je sama definicija statističkog skupa.Tekstualni dio zaglavnog
retka,odnosno predstupca, tumači sadržaj stupaca,odnosno redaka.Brojčani ili numerički
dio tablice je sastavljen od apsolutnih ili relativnih frekvencija.Izvor podataka je nužan za
moguću provjeru ispravnosti podataka.
Pri sastavljanju tablice je preporučljivo pridržavati se nekih pravila kao što su
izbjegavanje glomaznih tablica jer su one prijetnja preglednosti podataka,zatim podatke
unositi pregledno,uniformirano,prikladnim odabirom jedinice izbjeći velike brojeve.Nije
preporučljivo u numeričkom dijelu tablice ostavljati prazna mjesta.Oblik i vrsta tablice su
u skladu s prikupljenim podacima i postavljenim ciljevima.Ovisno o tome da li istom
tablicom želimo predočiti jedan ili više statističkih nizova nastalih iz jednog ili više
statističkih skupova prema jednom ili više obilježja,govorimo o različitim vrstama
tablica.Jednostavnim tablicama predočujemo jedan statistički niz,nastao grupiranjem
jednog statističkog skupa, prema jednom obilježju.Složene tablice sadrže dva ili više
statističkih nizova.Ako su ti nizovi nastali grupiranjem dva ili više statističkih skupova
prema istom obilježju,onda se ta složena tablica zove skupna. U slučaju kombinirane
složene tablice statistički nizovi koje ona sadrži su nastali grupiranjem istog statističkog
skupa prema dva ili više obilježja.U MS Excelu procedura Pivot table i Pivot Chart
Report omogućuju dobivanje jedne vrste kombinirane tablice koju zovemo pivot tablicom.

20
2.3.1 DVODIMENZIONALNA PIVOT TABLICA

Primjer 2.8
Podaci o bolničkom liječenju i iznosu participacije za 90 bolesnika internog odjela bolnice
Novi život u gradu X dani su tablicom:

Tablica 2.17

Iznos Iznos Iznos


Redni Broj participacije Redni Broj participacije Redni Broj participacije
broj dana ( kn ) broj dana ( kn ) broj dana ( kn )
1 6 680 31 32 2650 61 22 2400
2 14 1200 32 7 1300 62 13 3130
3 10 1100 33 9 1520 63 1 60
4 20 2200 34 16 2300 64 1 60
5 5 430 35 24 2850 65 2 80
6 8 700 36 35 3180 66 3 130
7 32 3300 37 6 490 67 14 1620
8 14 1500 38 2 350 68 14 1060
9 13 1330 39 13 920 69 7 580
10 10 1200 40 17 1190 70 9 630
11 6 510 41 28 1830 71 5 610
12 3 150 42 10 1380 72 12 1150
13 2 110 43 5 230 73 21 1730
14 15 1510 44 3 300 74 30 2370
15 18 1580 45 15 790 75 27 2800
16 22 1970 46 12 1200 76 9 720
17 13 1100 47 21 3000 77 11 750
18 12 1130 48 35 1830 78 13 1270
19 17 2090 49 6 130 79 10 1300
20 43 3280 50 4 270 80 14 1180
21 21 1980 51 1 50 81 22 2130
22 14 1300 52 8 320 82 5 780
23 6 730 53 18 1370 83 13 1680
24 3 920 54 24 1630 84 11 970
25 8 830 55 33 2800 85 18 2250
26 11 1020 56 2 80 86 2 80
27 15 1690 57 17 2000 87 3 150
28 14 2200 58 11 620 88 7 580
29 20 2790 59 13 570 89 9 1520
30 28 3030 60 15 820 90 23 1890
a) Formirajte dvodimenzionalnu razdiobu danih podataka.Broj dana grupirajte u razrede
širine 7 a iznos participacije u razrede širine 800.Grupirane podatke predočite
tablicom.Interpretirajte dvije dobivene frekvencije.
b) Formirajte tablice s relativnim frekvencijama odnosno relativnim brojevima strukture
redaka,odnosno stupaca.Interpretirajte po jednu frekvenciju u svakoj od rezultirajućih
tablica.

21
Rješenje

a) Počinjemo unosom podataka.Prve ćelije stupaca A,B i C ćemo upotrijebiti za tumače


sadržaja stupaca i to,redom:Redni broj,Broj dana,Iznos participacije(kn).nakon toga
punimo stupce odgovarajućim podacima.Proceduru Pivot Table and Pivot Chart Report,
namijenjenu formiranju višedimenzionalnih distribucija u MS Excel-u,pokrećemo s
padajućeg izbornika Data.U prvom koraku,u okviru

je već obavljen potrebni izbor ( točnije navedeno je mjesto pohrane podataka koji su
spremni za obradu-Mirosoft Excel list or database i svrha obrade-Pivot Table).Next je
prijelaz na drugi korak.U otvorenom prozorčiću dobivenog okvira upisat ćemo adrese
bloka ćelija sa podacima.Preciznije,to su adrese krajnjih ćelija lijeve glavne dijagonale tog
bloka B1:C91.

Opet Next za nastavak postupka.

22
Sada smo u prilici „dizajnirati“ našu tablicu i izabrati izlaznu „lokaciju“.Radni list je
dovoljno prostran te ćemo i rezultate smjestiti na njemu.Potvrdimo tu odluku klikom na
Existing Worksheet te upišemo adresu E4.Da bi odredili izgled tablice moramo pokrenuti
Layout.Dobit ćemo mogućnost razmještanja obilježja čiji nazivi se nalaze u okvirima na
desnoj strani otvorenog prozora po osobnom izboru.

Kliknut ćemo lijevom tipkom miša na Broj dana i,držeći tipku,mišem „odvući“ to
obilježje u polje Row.Postupajući na isti način,Iznos participacije ćemo smjestiti u polje
Column.Jedno od raspoloživih obilježja mora biti i u središnjem polju Data.U našem
slučaju su oba obilježja jednako prikladna za taj izbor.Poželjno bi bilo u središnje
područje smjestiti „nesumabilno“obilježje jer,bez obzira na ponudu obilježja,nužno je
kreirati tablicu tako da se varijabla u polju Data javi s opcijom Count.Svako od naših
obilježja nosi sa sobom opciju Sum pa ćemo Broj danae „odvući“ u Data.Nakon toga
moramo provesti zamjenu opcija Sum i Count,jer ne trebamo ukupan zbroj svih dana već
distribuciju njihovih frekvencija.Zamjena počinje dvostrukim klikom mišem na Sum of
Broj dana.U otvorenom dijaloškom prozoru

23
biramo Count.OK.Finish.

Tablica 2.18

Tablicu smo dobili.Doduše nije baš odveć prikladna za korištenje.Točnije,prilično je


glomazna.Grupiranjem vrijednosti obilježja u razrede doskočiti ćemo tim opravdanim
zamjerkama.Cijena kojom ćemo to platiti bit će smanjena preciznost rezultirajuće
tablice.Počnimo sa Iznosom participacije.Desnom tipkom miša ćemo kliknuti na sivo
polje tablice u kojem je Iznos participacije i na tako dobivenom plutajućem izborniku
odabrati opcije Group and Outline,podopcija Group.Dobit ćemo slijedeći dijaloški okvir

24
Iznosi participacije se kreću od 50 do 3300 kuna.Zadana širina razreda je 800 kuna.Zbog
toga ćemo zamijeniti ekstremalne vrijednosti višekratnicima širine razreda imajući na umu
princip iscrpnosti.Za početnu vrijednost uzmemo prvi takav višekratnik širine razreda
manji od startne vrijednosti,a za završnu vrijednost prvi broj djeljiv s širinom razreda,i
istovremeno veći od najveće vrijednosti obilježja.Dakle,umjesto 50 pišemo 0,umjesto
3300 pišemo 4000 sa korakom 800.OK.
Na analogan način grupiramo i Broj dana.Znači,desni klik miša na sivo polje Broj dana.A
onda Group and Outline/Group.Ekstreme 1 i 41 zamjenjujemo sa 0 i 49 jer je korak 7.OK.

Tablica 2.19

Interpretacija:

17 osoba je boravilo u bolnici između 7 i 14 dana i za to platilo participaciju u iznosu


između 800 i 1600 kuna,dok su svega 3 osobe za bolničko liječenje u trajanju od 28 do 35
dana platile participaciju u iznosu između 2400 i 3200 kuna.

b) Tražene relativne frekvencije ćemo izračunati na novom radnom listu (Sheet


2).Trebamo tri kopije izlazne tablice sa grupiranim podacima..Najprije ćemo označiti
tablicu na način pokazivač miša dovučemo do krajnje lijeve gornje ćelije F4 pivot
tablice.Kada on poprimi oblik „boldane“strelice → ,lijevi klik miša „oboji“ tablicu u
plavo.Onda uobičajeni slijed Edit/Copy i,na novom radnom listu, sa Edit/Paste
“zalijepimo“ kopije u C2,C12,C22.
Prvu kopiju ćemo upotrijebiti za izračun relativnih frekvencija.Desnim klikom miša na
krajnju gornju sivu lijevu ćeliju tablice dobit ćemo plutajući izbornik u kom ćemo odabrati
Field Settings

25
U otvorenom dijaloškom okviru

Kliknut ćemo na Options te,u otvorenom donjem dijelu istog okvira,pomoću strelice na
desnom kraju prvog dijela polja Show data as konačno dobiti mogućnost izbora tražene
opcije

26
Biramo % of total.OK.Kopija naše pivot tablice je postala tablica relativnih frekvencija.U
donjem desnom kutu,u kojem se sastaju dva Grand totala stoji 100% ,kao što,uostalom,i
mora biti.

Tablica 2.20

Interpretacija:
Udio ispitanika koji su boravili u bolnici između 7 i 14 dana i za to platili između 800 i
1600 kuna participacije,iznosi 18,89%.
Strukturu redaka ćemo dobiti ponavljanjem gornjeg postupka na drugoj kopiji Pivot
tablice.Jedina razlika od gornjeg postupka je u izboru % of row u izborniku Show data as.

27
Tablica 2.21

Interpretacija:
Među bolesnicima koji su u bolnici boravili između 21 i 28 dana,0% njih je u troškovima
liječenja participiralo između 0 i 800 kuna.
I još jednom,sada na trećoj kopiji ponovimo isti postupak uz jedinu razliku u posljednjem
koraku kada ćemo odabrati % of column.Na taj način ćemo dobiti tablicu sa određenom
strukturom stupaca.

Tablica 2.22

Interpretacija:
Među bolesnicima koji su na ime participacije za bolničko liječenje platili između 2400 i
3200 kuna,40% je onih koji su u bolnici boravili između 21 i 28 dana.

2.3.2 VIŠEDIMENZIONALNA PIVOT TABLICA

Primjer 2.9

Tablicom 2.23 dani su podaci o spolu,mjestu ljetovanja,duljini odmora i troškovima


smještaja 50 turista u ljetu 2006. na području X županije.

a)Formirajte kombiniranu tablicu apsolutnih frekvencija.Duljinu odmora grupirajte u


razrede širine 6 a Troškove smještaja u razrede širine 600.Interpretirajte jednu od
dobivenih vrijednosti.
b)Formirajte tablicu relativnih frekvencija iskazanih u postocima te odredite relativne
brojeve strukture.

28
Tablica 2.23

Redni Spol Duljina Mjesto Troškovi Redni Spol Duljina Mjesto Troškovi
broj odmora odmora smještaja broj odmora odmora smještaja
1 M 5 Split 1500 26 Ž 7 Brela 1360
2 M 7 Hvar 1600 27 M 7 Brela 1500
3 Ž 14 Brela 2000 28 Ž 7 Hvar 1600
4 M 21 Makarska 3000 29 Ž 7 Hvar 1700
5 M 6 Split 1600 30 M 3 Hvar 800
6 Ž 7 Hvar 1700 31 M 3 Makarska 500
7 Ž 7 Makarska 1600 32 M 7 Makarska 1200
8 Ž 14 Hvar 2100 33 Ž 7 Makarska 1300
9 M 14 Milna 2000 34 Ž 14 Split 2100
10 M 7 Milna 1300 35 Ž 14 Split 2200
11 M 7 Hvar 1700 36 M 20 Makarska 2800
12 M 3 Split 700 37 Ž 12 Makarska 2000
13 Ž 3 Split 600 38 Ž 12 Makarska 1700
14 M 14 Hvar 2500 39 M 3 Split 700
15 Ž 14 Brela 2500 40 M 3 Hvar 1000
16 M 7 Brela 1500 41 Ž 5 Hvar 1500
17 M 7 Milna 1600 42 Ž 3 Hvar 900
18 Ž 3 Milna 700 43 Ž 10 Makarska 1600
19 Ž 3 Hvar 900 44 Ž 3 Makarska 600
20 Ž 14 Hvar 2100 45 M 5 Makarska 800
21 M 14 Hvar 2100 46 M 10 Brela 2300
22 M 21 Makarska 2800 47 Ž 10 Brela 2000
23 M 21 Makarska 3000 48 M 14 Hvar 2600
24 M 14 Brela 2000 49 Ž 10 Hvar 2800
25 Ž 14 Brela 2100 50 Ž 5 Hvar 1400

Rješenje:

Podatke ćemo unijeti na uobičajeni način.Znači,u stupac A Redni broj,u stupac B


Spol,Mjesto odmora u stupac C te Troškove smještaja u stupac D.Postupak je posve
analogan onom koji smo primijenili za dvodimenzionalnu razdiobu.Dakle,Data/Pivot
Table and Pivot Chart Report.Kako nema potrebe za intervencijom u prvom koraku ( jer
je sve potrebito već urađeno),nastavit ćemo sa drugim korakom u okviru kojeg upisujemo
adrese ćelija sa glavne dijagonale bloka ćelija sa podacima
B1:E51.Stupac A nije obuhvaćen jer ne sadrži podatke.

Next.I već smo u prilici odrediti mjesto na kojem želimo izlaznu tablicu.Neka bude
postojeći radni list,dolje desno počevši od ćelije H2.

29
Pomoću opcije Layout presudit ćemo,po osobnom izboru, o izgledu tablice.Kako smo to
već radili,mišem razmjestimo obilježja.Spol i Duljinu odmora ćemo odvući među retke,a
ostala dva obilježja (Mjesto odmora i Troškove smještaja) ćemo smjestiti u stupce.Za
polje Data „konkuriraju“ sva četiri obilježja,ali u prednosti su kvalitativna (Spol i Mjesto
odmora).
Odabrat ćemo Spol.

“Elegantnu“,preglednu tablicu ne možemo očekivati.Ako ni zbog čega drugog,ono zbog


razilaženja između njene dimenzije (4) i dimenzije radnog lista (2).“Gužva“ je
sigurna.Stvar možemo barem formalno popraviti tako da ne zahtijevamo ispis baš svih
rezultata.Tablica će biti jednako informativna i bez silnih Totala koje sadrži.Najprije ćemo
kliknuti na Options i potom „deaktivirati“ Grand Totals for Columns i Grand Totals for
Rows.
I sada: Finish.

Tablica 2.24

30
Unatoč posljednjoj intervenciji,ona je i dalje glomazna i ne baš pregledna.
Možemo poraditi na njenoj preglednosti i skrivanjem podtotala.To ćemo obaviti tako da
desnim klikom,na ma koji od njih (i to jednom u retku,a nakon toga u stupcu)
„prizovemo“ plutajući izbornik u kojem sada biramo Hide.

Grupiranjem vrijednosti koje to dopuštaju,tablica će postati neusporedivo


preglednija,istina ,i znatno manje precizna.Ponovo trebamo plutajući izbornik koji smo
netom koristili.Sada ćemo ga dobiti desnim klikom na sivo polje Duljina odmora.Nakon
toga Group and outline/Group.
Treba formirati razrede širine 7.Ekstremalne vrijednosti ovog obilježja su 1 i 21 što znači
da jedino moramo korak prepraviti na 7.Analogno postupimo i sa Troškovima smještaja.
Ekstremalne vrijednosti ćemo,u skladu s traženim korakom od 800 kuna,zamijeniti s 0 i
3200.Potvrda izbora,i imamo tablicu sa grupiranim podacima.

31
Tablica 2.25

Interpretacija:
U Hvaru su 2 muškarca provela odmor u trajanju između 1 i 7 dana uz troškove smještaja
između 1600 i 2400 kuna.

b)Tablica relativnih frekvencija i tablice struktura redaka i stupaca se određuju posve


analogno kao i u slučaju dvodimenzionalnih distribucija.Kao i u navedenom
slučaju,najprije ćemo na novom radnom listu prirediti tri kopije naše pivot tablice.Znači
pokazivač miša dovučemo do krajnje gornje lijeve ćelije pivot tablice,pričekamo
strelicu,klik lijevom tipkom i tablica je označena.Nastavak svo već nekoliko puta imali -
Edit/Copy i „šetnja“ do novog radnog lista te „lijepljenje“ sa Edit/ Paste kopija sa
počecima u B5,B16 i B27.Ni nastavak ne donosi iznenađenja.Klik desnom tipkom miša na
krajnje lijevo gornje sivo polje prve kopije i slijed Field Settings/Options /Show data as/%
of total,odnosno % of row,odnosno % of column,ovisno od toga koju opciju trebamo.

2.4 GRAFIČKO PRIKAZIVANJE STATISTIČKIH


PODATAKA
Grafički prikaz statističkih podataka,kao i statističke tablice,ima za cilj predočiti na što
jednostavniji i preglednije način strukturu prikupljane statističke građe i rezultate rezultate
obrade iste.I ovdje je cijena,kojom je to plaćeno,gubitak preciznosti prikaza.Zbog toga je
poželjno da se grafički prikazi javljaju u pratnji s tablicama s preciznim podacima o
svojstvima promatranih pojava.Da bi zadovoljio očekivanja,svaki grafikon ima
naslov,oznake mjernih jedinica promatranih obilježja,oznake modaliteta te,po
potrebi,tumač ili legendu i izvor podataka. Grafički prikazi se dijele u četiri skupine:

 površinski grafikoni (jednostavni stupci-uspravni ili položeni,dvostruki i višestruki


stupci,strukturni stupci,strukturni krugovi ili polukrugovi,histogram)
 linijski grafikoni (poligon frekvencija-apsolutnih,relativnih i kumulativnih)
 točkasti grafikoni (dijagram točaka,dijagram rasipanja)
 kartografi (dijagramske karte,statističke karte,piktogrami) .

2.4.1 Strukturni krug.Jednostavni stupci

Veoma se često koriste zbog svoje jednostavnosti i preglednosti.


Primjer 2.10

32
Podaci o turističkoj ponudi grada X u Splitsko-Dalmatinskoj županiji krajem prosinca
2006.godine dani su narednom tablicom:

Tablica 2.26
Vrsta objekta Broj objekata
Sobe u privatnom smještaju 80
Apartmani u privatnom smještaju 100
Hotelske sobe *** 420
Hotelski apartmani 130
Obiteljske vile 10

a)Navedene podatke prikažite strukturnim krugom.


b)Iste podatke predočite jednostavnim stupcima.

Rješenje:
Podatke ćemo smjestiti u prva dva stupca zadržavši ćelije A1 i B1 za pripadne
naslove.Modalitete ćemo unijeti u blok ćelija A2:A6 a pripadne frekvencije u blok
B2:B6.Počinjemo označavanjem bloka ćelija sa podacima A2:B6 (naslove i totale ne
zahvaćamo) te uključivanjem „crtača“ klikom lijevom tipkom miša na ikonicu Chart
Wizard na vrpci sa alatima.Pojavit će se dijaloški okvir

sa ponudom vrste (Chart type) i podvrste (Chart sub-type) grafikona.Kako smo se odlučili
za strukturni krug,odabrat ćemo Pie i to prvi podtip (krajnji gornji lijevi).Prvi korak je
učinjen,stoga Next za prelazak na drugi u kojem imamo mogućnost preliminatornog uvida
u traženi grafički prikaz te,po potrebi,a na osnovu viđenog,eventualno mijenjali način
učitavanja podataka (po recima ili stupcima).Opet Next i pokrenuli smo treću fazu
grafičkog prikaza u kojoj ćemo ga opskrbiti naslovom i,po potrebi,tumačenjima sadržaja

33
osi ili nekim drugim dopunama.Zbog prirode našeg grafikona nećemo trebati obrazlagati
što je na osima.Naslov je neophodan.Stoga biramo Titles te,u otvoreni prozorčić upišemo
naslov po želji (to bi trebala biti precizna definicija statističkog skupa).Poželjno bi bili
znati i udio pojedinih modaliteta.Apsolutne frekvencije ,jer o njima je riječ,ovdje
jednostavno dobijemo pomoću Percentage unutar opcije Data Labels.Tumač oznaka je
nužan.Dobit ćemo ga pomoću Show legend sa kartice Legend.U zadnjem koraku biramo
mjesto na kojem želimo rezultate prethodnih koraka.Ostat ćemo na istom radnom listu (As
object in).Finish.

Eventualne „kozmetičke“ zahvate (bojenje,micanje,povećanje ili smanjenje …) na


grafikonu ćemo obaviti prema osobnim željama imajući stalno u vidu svrhu s kojom je sve
rađeno.
Želimo li mijenjati veličinu samog kruga,kliknut ćemo izvan njega,unutar zamišljenog
opisanog kvadrata.Nakon pojave 0pisanog kvadrata,a uz pomoć hvataljki u vrhovima i na
njegovim stranicama,možemo na krugu raditi željene preinake.
b) Kao i u prethodnom slučaju,najprije ćemo označiti blok ćelija A2:B6 i kliknuti na istu
ikonu Chart Wizard .Od ponuđenog ćemo sada odabrati tip Column,podtip iz krajnjeg
lijevog gornjeg kuta.Next.Podatke ćemo učitati po stupcima.Nakon toga ćemo grafikonu
dodati naslov i potrebna tumačenja sadržaja osi.Podaci su isti što znači da je i naslov kao u
prethodnom slučaju.Upisat ćemo ga u prozorčiću koji se otvara klikom na Chart
title .Naziv obilježja Vrsta objekta ćemo upisati u okvir Category (X) axis a Broj objekata
u okvir Value (Y) axis.Legenda je nepotrebna te ćemo je isključiti micanjem kvačice sa
Show legend.Želimo li grafikon na istom radnom listu,u posljednjem koraka nećemo ništa
mijenjati.Finish.Da bi grafikon ispunio zadaću,mora biti i prikladno „zapakiran“.U tu
svrhu,a sa željom da grafički prikaz podataka bude i oku ugodan,podesimo veličinu slova
u tekstualnom dijelu grafikona.

34
35
2.4.2 Položeni stupci

Ova vrsta grafičkog prikaza je izuzetno prikladna za obilježja s velikim brojem


modaliteta.
Prednost ovo grafičkog prikaza je još izrazitija ako zapisi modaliteta uključuju relativno
veliki broj znakova.

Primjer 2.11

Godišnji izvještaj o dijelu dežurstava medicinskog osoblja u splitskoj bolnici Firule (stanje
31.prosinca 2006.g.) dan je slijedećom tablicom:

Tablica 2.27
Odjel Broj dežurstava
otorinolaringologija 730
hitni kirurški 1200
ginekologija 1600
kardiovaskularni 1360
ortopedija 1000
okulistika 650
psihijatrija 1400
onkologija 2160
nuklearna medicina 360
pedijatrija 950
interna-gastro 770
interna-endokrinologija 710
interna-hepatobilijarna 760
hematologija 720
radiologija i RTG dijagnostika 750
dermatologija 520
neurlogija 1310
traumatologija 1100
jedinica intenzivne njege 2050
kirurgija 1300

Podatke iz ove tablice treba predočiti položenim stupcima.

Rješenje:

Modalitete unosimo u stupac A,a pripadne frekvencije u stupac B.Zaglavne ćelije A1 i B1


zadržimo za odgovarajuće naslove.Kao i u prethodnim slučajevima,proces počinje
označavanjem bloka ćelija sa podacima A2:B21 i pokretanjem Chart Wizard .Naravno,ni
nastavak ne sadrži nikakvu bitnu novinu.Razlika je u odabranom tipu grafikona.Kako se
traži grafikon položenih stupaca,to se moramo opredijeliti za Bar i,opet,prvi podtip (ista
„lokacija“).U drugom koraku ćemo opet birati učitavanje podataka po stupcima
(Columns),a u trećem koraku pridružimo naslov ( u Chart title –Razdioba dežurstava
medicinskog osoblja u splitskoj bolnici Firule tijekom 2006.g), oznake na osima (na Y osi
se uvijek nalaze frekvencije što znači da ćemo u pripadni prozorčić za Value ( Y ) axis
upisati Broj dežurstava,naziv obilježja Odjeli upisujemo u otvor uz Category ( X ) axis ).
Legendu ćemo isključiti jer nije potrebna u ovom slučaju.Odlučimo li se za smještaj
grafikona na postojećem radnom listu,možemo zaključiti postupak.Finish.

36
Zbog velikog broja modaliteta,neki od njih neće biti navedeni.Ako želim da na grafikonu
budu svi,morat ćemo dodatno intervenirati.S tom nakanom,grafikon ćemo
povečeti,točnije,“izdužiti“pomoću hvataljki koje se nalaze na polovištima gornje i donje
stranice.Njih,kao i sve ostale, ćemo mu priskrbiti označavanjem.Rastezati ćemo ga u vis
tako dugo dok se ne pojave imena svih odjela navedenih u tablici.Naravno,od pomoći će
nam biti i odabir prikladne veličine slova u tekstualnom dijelu grafikona.Pomoću trake s
alatima Formatting možemo provesti željene preinake.Obično koristimo font Ariel.Što se
veličine slova tiče,obično je 12 za naslov,9 za oznake na osima.U slučajevima kao što je
ovaj,umjesto 9 ćemo odabrati 6,ponekad čak i nešto manji.

37
2.4.3 Histogram

Rutinu ovog naziva smo već koristili za formiranje statističkih nizova.Međutim,njene


grafičke mogućnosti nismo koristili do sada.Naime,istovremeno sa grupiranjem podataka
moguće je iste predočiti grafikonom uspravnih stupaca i to odvojenih u slučaju
kvalitativnog i diskretnog numeričkog obilježja,te spojenim stupcima u slučaju
kontinuiranog numeričkog obilježja.
Primjer 2.12
U poduzeću X 80 zaposlenika planira mjesec u kojem želi koristiti godišnji odmor.Plan
„želja“ za 2005.godinu je dan slijedećom tablicom.
Podatke predočite histogramom.

38
Tablica 2.5

Redni broj Mjesec Redni broj Mjesec Redni broj Mjesec Redni broj Mjesec
1 veljača 21 kolovoz 41 siječanj 61 ožujak
2 lipanj 22 prosinac 42 siječanj 62 travanj
3 lipanj 23 prosinac 43 svibanj 63 ožujak
4 srpanj 24 rujan 44 kolovoz 64 studeni
5 kolovoz 25 listopad 45 kolovoz 65 kolovoz
6 siječanj 26 srpanj 46 srpanj 66 kolovoz
7 siječanj 27 srpanj 47 srpanj 67 prosinac
8 svibanj 28 srpanj 48 srpanj 68 kolovoz
9 kolovoz 29 prosinac 49 kolovoz 69 srpanj
10 kolovoz 30 kolovoz 50 kolovoz 70 srpanj
11 srpanj 31 kolovoz 51 kolovoz 71 srpanj
12 srpanj 32 lipanj 52 kolovoz 72 srpanj
13 srpanj 33 srpanj 53 srpanj 73 kolovoz
14 kolovoz 34 srpanj 54 srpanj 74 siječanj
15 kolovoz 35 srpanj 55 srpanj 75 siječanj
16 srpanj 36 srpanj 56 srpanj 76 svibanj
17 srpanj 37 srpanj 57 rujan 77 lipanj
18 srpanj 38 siječanj 58 rujan 78 kolovoz
19 travanj 39 svibanj 59 listopad 79 lipanj
20 lipanj 40 siječanj 60 veljača 80 rujan
Rješenje:
Podatke već imamo pohranjene u računalu,kako izvorne tako i tablicu sa zamjenskim
oznakama modaliteta koje smo supstituirali brojčanim oznakama

39
siječanj=1 siječanj=1 siječanj=1 siječanj=1
veljača=2 veljača=2 veljača=2 veljača=2
ožujak=3 ožujak=3 ožujak=3 ožujak=3
travanj=4 travanj=4 travanj=4 travanj=4
svibanj=5 svibanj=5 svibanj=5 svibanj=5
srpanj=7 srpanj=7 srpanj=7 srpanj=7
kolovoz=8 kolovoz=8 kolovoz=8 kolovoz=8
rujan=9 rujan=9 rujan=9 rujan=9
listopad=10 listopad=10 listopad=10 listopad=10
studeni=11 studeni=11 studeni=11 studeni=11
Redni prosinac=12 Redni prosinac=12 Redni prosinac=12 Redni prosinac=12
broj broj broj broj
1 2 21 8 41 1 61 3
2 6 22 12 42 1 62 4
3 6 23 12 43 5 63 3
4 7 24 9 44 8 64 11
5 8 25 10 45 8 65 8
6 1 26 7 46 7 66 8
7 1 27 7 47 7 67 12
8 5 28 7 48 7 68 8
9 8 29 12 49 8 69 7
10 8 30 8 50 8 70 7
11 7 31 8 51 8 71 7
12 7 32 6 52 8 72 7
13 7 33 7 53 7 73 8
14 8 34 7 54 7 74 1
15 8 35 7 55 7 75 1
16 7 36 7 56 7 76 5
17 7 37 7 57 9 77 6
18 7 38 1 58 9 78 8
19 4 39 5 59 10 79 6
20 6 40 1 60 2 80 9

Podatke ćemo smjestiti u stupac A,a modalitete u stupac B.Naslov iz zaglavne ćelije A1
kopiramo u ćeliju B1.Ponovimo poznatu proceduru:Tools/Data
Analysis/Histogram.OK.Ni u nastavku ništa bitno novo.Adrese ćelija sa podacima su
A2:A81 (Input Range),a adrese ćelija sa modalitetima (Bin Range) su B2:B13.Grafikon
ćemo smjestiti na istom radnom listu počevši od D2.Naslove nismo obuhvatili te ne
trebamo kvačicu na prozorčić uz Labels,ali je zato trebamo na Chart Output.OK.

40
Grafikon ćemo dotjerati kako bi bio što informativniji.Počinjemo sa krajnje bezličnim
naslovom.Klik na bezlični Histogram te,nakon pojave okvira,zamjena starog naslova
novim (po mogućnosti što bližim definiciji statističkog skupa):Distribucija planiranih
godišnjih odmora zaposlenika poduzeća X za 2005.godinu.Jednako tako bezličan Bin
zamijenimo sa oznakom obilježja Mjesec,a Frequency sa Broj zaposlenika.Veličinu slova
prilagoditi željama i ukloniti nepotrebnu legendu.

41
Primjer 2.13

Podatke iz tablice 2.3 prikažite grafički histogramom.

Tablica 2.3

Redni broj Vrijeme čekanja Redni broj Vrijeme čekanja Redni broj Vrijeme čekanja
(u mjesecima) (u mjesecima) (u mjesecima)
1 5 31 14 61 8
2 21 32 13 62 18
3 7 33 33 63 22
4 13 34 25 64 20
5 9 35 24 65 34
6 10 36 21 66 29
7 21 37 22 67 19
8 28 38 17 68 16
9 35 39 11 69 10
10 18 40 7 70 7
11 6 41 3 71 4
12 2 42 1 72 14
13 11 43 21 73 18
14 14 44 16 74 21
15 10 45 19 75 29
16 4 46 11 76 23
17 5 47 8 77 19
18 9 48 6 78 18
19 9 49 22 79 9
20 12 50 2 80 10
21 17 51 13 81 13
22 22 52 15 82 17
23 21 53 15 83 42
24 30 54 25 84 4
25 32 55 39 85 7
26 39 56 31 86 12
27 28 57 34 87 13
28 21 58 22 88 25
29 20 59 39 89 22
30 19 60 21 90 30

Rješenje:

Postupak primijenjen pri grupiranju ovih podataka u razrede (širine 6) ponavljamo gotovo
u cijelosti.Razlika je jedino u tome što što ćemo u donjem dijelu odgovarajućeg dijaloškog
okvira staviti kvačicu u otvor uz Chart Output.
Grafikon dodatno dotjeramo kao i u prethodnom slučaju.Naslov:Razdioba nezaposlenih
osoba u gradu X prema vremenu čekanja na posao.Na x osi ćemo napisati:Vrijeme
čekanja na posao,a na Y osi:Broj nezaposlenih.Opcija More ovdje nema odveć smisla pa
ćemo je ukloniti kao i nepotrebnu legendu.Svi podaci grupirani u razrede ,neovisno o
tome da li je riječ o diskretnom ili kontinuiranom numeričkom obilježju,se predočuju
grafikonom spojenih stupaca.MS Excel to neće sam uraditi pa smo prisiljeni na
intervenciju u vidu dvostrukog klika lijevom tipkom miša na ma koji od ponuđenih

42
stupaca.U dobivenom dijaloškom okviru biramo Data Series i karticu Options.Razdaljinu
stupaca svedemo na nulu sa Gap width.

43
2.4.4 Grafički prikaz podataka iz pivot tablice višestrukim stupcima

Skup podataka koji se odnose na dvije ili više varijabli smo grupirali pomoću rutine Pivot
Table and Pivot Chart Report.Tako sređene podatke je moguće i grafički prikazati.

Primjer 2.14
Podatke iz primjera 2.8 grafički prikažite višestrukim stupcima.

Iznos Iznos Iznos


Redni Broj participacije Redni Broj participacije Redni Broj participacije
broj dana ( kn ) broj dana ( kn ) broj dana ( kn )
1 6 680 31 32 2650 61 22 2400
2 14 1200 32 7 1300 62 13 3130
3 10 1100 33 9 1520 63 1 60
4 20 2200 34 16 2300 64 1 60
5 5 430 35 24 2850 65 2 80
6 8 700 36 35 3180 66 3 130
7 32 3300 37 6 490 67 14 1620
8 14 1500 38 2 350 68 14 1060
9 13 1330 39 13 920 69 7 580
10 10 1200 40 17 1190 70 9 630
11 6 510 41 28 1830 71 5 610
12 3 150 42 10 1380 72 12 1150
13 2 110 43 5 230 73 21 1730
14 15 1510 44 3 300 74 30 2370
15 18 1580 45 15 790 75 27 2800
16 22 1970 46 12 1200 76 9 720
17 13 1100 47 21 3000 77 11 750
18 12 1130 48 35 1830 78 13 1270
19 17 2090 49 6 130 79 10 1300
20 43 3280 50 4 270 80 14 1180
21 21 1980 51 1 50 81 22 2130
22 14 1300 52 8 320 82 5 780
23 6 730 53 18 1370 83 13 1680
24 3 920 54 24 1630 84 11 970
25 8 830 55 33 2800 85 18 2250
26 11 1020 56 2 80 86 2 80
27 15 1690 57 17 2000 87 3 150
28 14 2200 58 11 620 88 7 580
29 20 2790 59 13 570 89 9 1520
30 28 3030 60 15 820 90 23 1890

Rješenje:
Problem možemo riješiti pomoću opcije Pivot Chart (with Pivot Table).Međutim,mi ćemo
to uraditi na nešto jednostavniji način.U tu svrhu trebamo posebnu kopiju pivot tablice i to
onu koja će biti tablica alfanumeričkih podataka,oslobođenu „duha“ postupaka koji su je

44
stvorili.Postupak počinje označavanjem tablice (sjetimo se:pokazivač miša na krajnju
lijevu gornju ćeliju te,nakon što se pojavi ona strelica,klik lijevom tipkom miša,i tablica je
plava,tj.označena).Nastavak već poznat:Edit/Copy i klik na ćeliju koju smo odabrali kao
krajnju gornju lijevu naše kopije (F15).Nastavak uključuje neke promjene.Na padajućem
izborniku Edit umjesto dosadašnjeg Paste sada biramo Paste Special.Među ponuđenim
opcijama Odabrat ćemo Values.OK.Dobivena kopija je posve zadovoljavajuća.Doduše
nema okvira,pa ako nam se to ne sviđa,možemo ih osigurati ponavljanjem prethodne
procedure s tom razlikom što ćemo u zadnjem koraku odabrati Formats umjesto
Values.Ovo je čisto
„kozmetička“ intervencija važna jedino za formalno obličje naše kopije.Slijed narednih
koraka je već viđen.Prvi od njih je označavanje podataka u našoj kopiji (blok F16:P24)
I klik na Chart Wizard.U ponudi biramo Columns i prvi podtip (gornji krajnji lijevi).U
drugom koraku donosimo odluku o načinu učitavanja podataka.Sada ćemo odabrati
Columns.U trećem koraku slijedi tekstualna dorada u vidu naslova (Razdioba frekvencija
bolesnika liječenih u bolnici Novi život,prema duljini bolničkog liječenja i iznosu
participacije),oznake na koordinatnim osima (Broj dana na x osi i Broj bolesnika na Y
osi).Nema potrebe otvarati novi radni list,pa ćemo ga smjestiti na istom.Finish

Ponovimo li gornji postupak s jedinom razlikom u trećem koraku ( biramo Series in Rows
i,sukladno tome,na x os pišemo Iznos participacije),dobit ćemo slijedeći grafikon:

45
Zadaci za vježbu 1.

1.Anketirani su studenti Sveučilišta u Splitu školske godine 2005/2006 vezano za sportske


utakmice kojima najradije prisustvuju.Ponuđeni odgovori su dani tablicom :

Sport Broj studenata


nogomet 1150
košarka 1010
rukomet 720
mali nogomet 110
vaterpolo 270
ragbi 180

a)Odredite statistički skup


b)Odredite opseg statističkog skupa
c)Koje svojstvo jedinica statističkog skupa se ispituje?O kojem je obilježju riječ?Navedite
jedan od modaliteta.
d)Podatke iz tablice grafički predočite strukturnim krugom.Navedite sve potrebne
oznake.Odredite udio studenata koji najradije prisustvuju košarkaškim utakmicama.
2.Podaci o službenim putovanjima,obzirom na vrstu prijevoznog sredstva,u poduzeću X
na dan 31.prosinca 2005.g. dani su tablicom:

Vrsta prijevoza Broj putovanja


osobni automobil 110
službeni automobil 170
vlak 30
autobus 55
avion 88

a)Navedite što je statistički skup u ovom slučaju

46
b)Navedite obilježje i vrstu promatranog obilježja jedinica statističkog skupa
c)Navedite jedan od modaliteta.Koliko jedinica statističkog skupa ima tu vrijednost
obilježja?
d)Podatke iz tablice predočite grafički strukturnim krugom,navedite sve potrebne
oznake.Koliki je udio službenih putovanja koja su obavljena uz avionski prevoz?
3.Anketirani su članovi kluba liječenih alkoholičara u gradu X dana 1.srpnja 2004.g.
vezano za neuspjele pokušaje apstinencije.Podaci su dani tablicom:

Broj recidiva Broj članova kluba


1 3
2 7
3 6
4 9
5 12
6 10
7 13

a)Navedite što je statistički skup u ovom slučaju


b)Naznačite obilježje i vrstu obilježja te navedite barem jedan od modaliteta tog obilježja.
c)Podatke iz tablice prikažite grafički uspravnim stupcima te navedite sve potrebne
oznake.Koliki je udio članova kluba koji su načinili najmanje recidiva?
4.U trgovačkom centru Mate u gradu X planira se broj zaposlenika za slijedeću godinu.U
tu svrhu 1.12.2007.g. je anketirano 60 kupaca.Na pitanje:u kojem danu u tjednu obavljate
tjednu kupnju,dali su slijedeće odgovore:

Redni broj Dan Redni broj Dan Redni broj Dan Redni broj Dan
1 ponedjeljak 16 petak 31 petak 46 petak
2 ponedjeljak 17 subota 32 petak 47 nedjelja
3 utorak 18 subota 33 petak 48 nedjelja
4 srijeda 19 subota 34 subota 49 nedjelja
5 srijeda 20 četvrtak 35 srijeda 50 petak
6 četvrtak 21 petak 36 četvrtak 51 petak
7 četvrtak 22 petak 37 nedjelja 52 petak
8 petak 23 petak 38 utorak 53 subota
9 petak 24 nedjelja 39 utorak 54 subota
10 petak 25 nedjelja 40 utorak 55 subota
11 petak 26 nedjelja 41 ponedjeljak 56 subota
12 subota 27 nedjelja 42 ponedjeljak 57 subota
13 subota 28 srijeda 43 nedjelja 58 subota
14 subota 29 četvrtak 44 nedjelja 59 subota
15 subota 30 četvrtak 45 četvrtak 60 subota

a) Koristeći proceduru Histogram grupirajte zadane podatke.Rezultate predočite


tablicom.
b) Dobiveni statistički niz prikažite grafički jednostavnim stupcima.

5. Podaci o godinama starosti korisnika usluga Betanije,doma za starije i nemoćne


osobe,dani su donjom tablicom.

47
a) Grupirajte podatke o životnoj dobi korisnika u razrede širine 10 (godina).Rezultate
grupiranja predočite tablicom.
b) Dane podatke predočite grafički odgovarajućim grafikonom.
c) Odredite udio osoba starih između 70 i 80 godina te udio onih koji nisu stariji od 70
godina.

Redni Godine Redni Godine Redni Godine Redni Godine Redni Godine
broj starosti broj starosti broj starosti broj starosti broj starosti
1 72,3 21 41,3 41 55,7 61 27,4 81 37,3
2 77,8 22 40,6 42 45,8 62 64,9 82 44,6
3 81,3 23 43,7 43 33,5 63 76,2 83 62,7
4 88,5 24 37,8 44 28,6 64 70,9 84 66,6
5 69,8 25 33,5 45 22,7 65 86 85 45,8
6 56,8 26 34,8 46 26,8 66 83,6 86 52,3
7 66,7 27 55,9 47 37,3 67 27,6 87 20,6
8 90,2 28 62,8 48 44,6 68 92,5 88 38,8
9 81,7 29 70,5 49 62,7 69 76,9 89 46,9
10 30,5 30 84,5 50 66,6 70 90,2 90 84,8
11 25,4 31 76,7 51 37,8 71 81,7 91 80,6
12 33,1 32 88,9 52 34,8 72 30,5 92 87,4
13 45,8 33 51,8 53 29,5 73 25,4 93 57,9
14 52,3 34 46,8 54 59,5 74 37,3 94 90,2
15 20,6 35 72,6 55 68,4 75 44,6 95 81,7
16 48,9 36 77,7 56 78,5 76 62,7 96 30,5
17 58,9 37 83,2 57 71,3 77 66,6 97 25,4
18 62,7 38 86,4 58 79,4 78 45,8 98 44,6
19 74,6 39 92,3 59 85,2 79 52,3 99 62,7
20 73,2 40 29,5 60 86,7 80 20,6 100 66,6
6. Podaci o spolu i životnoj dobi malodobnih prekršitelja u gradu X, dani su tablicom:

Redni broj Spol Dob Redni broj Spol Dob Redni broj Spol Dob
1 M 17,5 16 M 16,5 31 Ž 13,4
2 M 15,7 17 Ž 12,5 32 Ž 15,3
3 Ž 16,3 18 Ž 17,2 33 M 12,8
4 Ž 17,2 19 M 13,4 34 M 16,4
5 Ž 15,2 20 M 15,3 35 Ž 16,5
6 M 13,1 21 M 12,8 36 M 12,5
7 M 14,2 22 Ž 16,4 37 M 17,2
8 M 12,9 23 Ž 17,3 38 M 13,4
9 Ž 13,7 24 M 12,2 39 M 13,7
10 M 14,8 25 M 12,9 40 M 15,3
11 M 14,3 26 M 13,7 41 M 17,4
12 M 16,5 27 M 14,8 42 Ž 14,4
13 M 12,5 28 M 14,3 43 Ž 12,7
14 M 17,2 29 Ž 16,5 44 M 16,2
15 M 13,4 30 Ž 13,4 45 M 16
a) Formirajte pivot tablicu navedenih podataka (dob grupirajte u razrede širine 2 godine)
b) Odredite udio malodobnih prekršitelja koji su muškog spola starost između 14 i 16
godina.
c) Podatke iz pivot tablice prikažite grafički dvostrukim stupcima te interpretirajte graf.

48
7.Rezultati vikend kontrola prometne policije provedenih u Splitu tijekom
2005.godine.dani su slijedećom tablicom.

Iznos naplaćenih Iznos naplaćenih


Broj Broj
Redni kazni Redni kazni
prekršaja prekršaja
broj ( u kn ) broj ( u kn )
1 2 480 16 2 1600
2 1 800 17 3 1800
3 3 900 18 6 2400
4 1 300 19 1 350
5 4 1400 20 1 500
6 2 500 21 5 1500
7 5 1650 22 3 1500
8 6 2000 23 2 800
9 3 2100 24 4 1350
10 4 1600 25 2 600
11 1 600 26 3 1500
12 7 3000 27 3 2400
13 3 2400 28 1 200
14 4 1200 29 1 350
15 2 1000 30 5 1300

a) Formirajte pivot tablicu (iznos naplaćenih kazni grupirajte u razrede širine 500,a broj
prekršaja u razrede širine 2).
b) Odredite udio prekršitelja koji su načinili između 2 i 4 prekršaja i za to platili između
1000 i 1500 kuna .

Rješenja:

1. a) Statistički skup čine studenti Sveučilišta u Splitu školske godine 2005/2006


anketirani o svom prisustvu sportskim utakmicama
b) Opseg skupa je zbroj svih frekvencija tj.broj ispitanika i iznosi 3440
c) Obilježje je kvalitativno/nominalno/atributivno; košarka
d) Udio ispitanika koji najradije prisustvuju košarkaškim utakmicama iznosi 29%

49
2. a) Statistički skup čine službena putovanja u poduzeću X stanje 31.prosinca 2005.g.
b) Promatrano obilježje je vrsta prijevoza.Riječ je o
kvalitativnom/nominalnom/atributivnom obilježju
c) Službeni automobil; 170 jedinica je tog modaliteta
d) Udio službenih putovanja koja su se odvijala avionom iznosi 19%

3. a) Statistički skup su članovi kluba liječenih alkoholičara,stanje 1.srpnja 2004.g.


b) Broj recidiva,kvantitativno/numeričko/diskretno obilježje; modaliteti su 1,2,..,7
c) Najmanja vrijednost obilježja je 1 i javlja se 3 puta što čini 5% populacije

50
4. a)
Broj
Dan kupaca
1 4
2 4
3 4
4 7
5 16
6 15
7 10
More 0

5a)

51
b)

c) Kako je opseg skupa 100 to je iznos relativnih i apsolutnih frekvencija isti te je 14%
udio osoba starosti između 70 i 80 godina,dok je 65% udio onih koji nisu stariji od 70
godina.
6. a)

b)

52
Udio malodobnih prekršitelja muškog spola starosti između 14 i 16 godina iznosi 17,78%.

c)

a)

b)

53
54
MJERE CENTRALNE TENDENCIJE

Zbog izrazite sklonosti ka gomilanju oko neke neke istaknute vrijednosti,moguće je niz
varijabilnih podataka predočiti jednom takovom,dominantnom,srednjom vrijednošću.Tu
zamjensku,predstavničku ulogu će uspješno obaviti ona vrijednost koja je krajnje tipična
varijabilnim podacima iste vrste.Obzirom na način izbora,srednje vrijednosti se dijele na
potpune i položajne.U izračun potpunih srednjih vrijednosti su uključeni svi članovi
niza.Potpune srednje vrijednosti su:

 aritmetička sredina
 geometrijska sredina
 harmonijska sredina

Položajne srednje vrijednosti su određene svojim mjestom u nizu.To su:

 mod
 medijan

Odabir srednjih vrijednosti i njihova primjena ovise o prirodi statističkih podataka i vrsti
obilježja.Naime,u slučaju kvalitativnog obilježja nisu dopuštene računske operacije nad
modalitetima te je time krajnje sužen izbor srednjih vrijednosti.Kod kvantitativnih
varijabli takovih ograničenja nema,ali zato neke od njih pokazuju izuzetnu osjetljivost na
ekstremne vrijednosti obilježja.
U programskom paketu koji koristimo postoje gotove funkcije za izračunavanje svih
srednjih vrijednosti negrupiranih podataka.Nažalost,tako nije i sa grupiranim podacima pa
ćemo morati sami to uraditi pomoću odgovarajućih formula.

3.1 Aritmetička sredina

Aritmetička sredina (obično je zovemo prosjek) je najvažnija i najčešće korištena potpuna


srednja vrijednost.Izračunava se kao omjer zbroja svih vrijednosti obilježja i opsega
statističkog skupa.Označava se,najčešće,sa x̄ .Za negrupirani niz podataka x1 ,x2 ,…..,x N
računamo jednostavnu aritmetičku sredinu kao
x + x +¿⋅¿+ x N
x̄= 1 2
N
U MS Excelu taj problem rješava funkcija

= AVERAGE ( raspon podataka )


Primjer 3.1
Podaci o navršenim godinama života osoba prijavljenih na Zavodu za zapošljavanje u
Zadru 1.srpnja 2003.g. dani su tablicom:

55
Tablica 3.1
Navršene Navršene Navršene Navršene
Redni Redni Redni Redni
godine godine godine godine
broj broj broj broj
života života života života
1 43 14 22 27 27 40 55
2 55 15 25 28 18 41 31
3 41 16 32 29 44 42 33
4 31 17 42 30 54 43 28
5 27 18 50 31 55 44 52
6 18 19 55 32 31 45 31
7 44 20 31 33 33 46 42
8 54 21 33 34 28 47 29
9 49 22 28 35 52 48 27
10 35 23 52 36 22 49 18
11 27 24 36 37 37 50 44
12 24 25 37 38 28 51 54
13 38 26 37 39 43 52 56

Izračunajte prosječnu životnu dob osoba prijavljenih na Zavodu za zapošljavanje.

Rješenje:

Već smo rekli da u MS Excelu postoje gotove funkcije za izračunavanje srednjih


vrijednosti negrupiranih podataka.Načine korištenja ćemo demonstrirati na ovom
primjeru.Podatke ćemo unijeti u stupce A i B na uobičajeni način (Redni broj u stupac
A,Navršene godine života u stupac B;odgovarajuće naslove u zaglavne ćelije).Jedan od
dva moguća počinje označavanjem ćelije u kojoj želimo traženi prosjek.Neka to bude
D2.Zatim na padajućem izborniku Insert biramo Function te u okviru Or select a category
odaberemo Statistical,a u okviru Select a function traženu AVERAGE.Trebamo li dodatne
podatke o toj funkciji,kliknut ćemo na Help on this function.OK.U dijaloškom okviru
Function Arguments upisat ćemo adrese bloka ćelija sa našim podacima B2:B53 i to u
okvir Number 1.OK.Dobili smo da je prosječna životna dob osoba prijavljenin na Zavodu
za zapošljavanje u Zadru 1.srpnja 2003.g iznosi 37,27 odnosno navršenih 37 godina
života.Broj decimalnih mjesta ćemo uskladiti sa očekivanom preciznošću rezultata.
Druga varijanta je kraća.Traženu prosječnu dob ćemo dobiti pomoću iste funkcije koju
ćemo uključiti tako da u ćeliji u kojoj želimo rezultat, upišemo:

=AVERAGE (B2:B53)
i,naravno,Enter.
Traženi prosjek je moguće odrediti i pomoću izvorne formule
x + x +¿⋅¿+ x N
x̄= 1 2
N
Tako da u ćeliji u kojoj želimo rezultat,upišemo =SUM(B2:B53).Enter.
U slučaju grupiranih numeričkih podataka,odnosno distribucije frekvencija,imamo vaganu
ili ponderiranu srednju vrijednost.Ako je riječ o distribuciji

{ }
k
( x i, f i ),i=1 , 2 ,. . ., k ; ∑ f i=N
i=1
vagana aritmetička sredina se računa po formuli

56
k
∑ f i xi
i=1
f 1 x 1 + f 2 x 2 +¿⋅¿+ f k x k k
x̄=
f 1 + f 2 + ¿⋅¿+ f k ∑ fi
= i=1 .
Apsolutne frekvencije imaju ulogu pondera.Ovaj način računanja srednje vrijednosti ćemo
morati provesti sami jer u MS Excelu ne postoji direktna formula kao u slučaju
negrupiranih podataka.
U slučaju podataka grupiranih u razrede,suočeni smo s problemom „usrednjavanja“
podataka na nivou svakog razreda s ciljem dobivanja „predstavničke“ vrijednosti,za nama
nepoznate, podatke unutar razreda.To znači da ćemo sve vrijednosti unutar razreda
¿
zamijeniti sa sredinom razreda xi (koriste se i oznake xi ili mi ) koju dobijemo kao
aritmetičku sredinu razrednih granica (donje i gornje).Formula za izračun te ponderirane
srednje vrijednosti je,formalno,ista kao i u prethodnom slučaju
k
∑ f i xi
i=1
k

x̄ =
∑ fi
i=1 .
Primjer 3.2
Podatke iz prethodnog primjera treba grupirati u razrede širine 4 te,za tako grupirane
podatke izračunati aritmetičku sredinu i usporediti je s aritmetičkom sredinom
negrupiranih podataka.Objasnite nastalu razliku.
Rješenje:
Najprije ćemo pomoću procedure Histogram grupirati podatke iz tablice 3.1 te rezultate
grupiranja smjestiti na postojeći radni list počevši od E2.Da bi pripremili podatke
potrebne za izračun tražene aritmetičke sredine u G2 ćemo upisati xi a u H2 xi *fi .Kako u
stupcu E imamo gornje granice razreda čije sredine xi trebamo za izračun traženog
prosjeka,to ćemo u G3 upisati =(16+E3)/2, u G4 =(E3+E4)/2.Razredi su jednako široki
pa možemo,na poznati način,izračunati ostale razredne sredine.To znači,mišem kopirati
sadržaj ćelije G4 u blok ćelija G5:G13.Nakon toga punimo stupac H počevši od H3gdje
upisujemo =F3*G3.Enter.I,opet,kopiranje,mišem,sada sadržaja ove ćelije u blok ćelija
H4:H13.Da bi formulu pretočili u traženi broj,trebamo sume brojeva u stupcima F i
H.Brojnik je zbroj sadržaja bloka ćelija H3:H13,a nazivnik opseg statističkog
skupa,odnosno zbroj frekvencija u bloku ćelija F3:F13.U nekoj od praznih ćelija (recimo
E18) izračunat ćemo traženi prosjek =H14/F14.Odlučimo li se za dva decimalna
mjesta,dobit ćemo da je prosječna dob računata iz grupiranih podataka jednaka
36,62.Odstupanje od prethodnog (točnog) prosjeka izvornih vrijednosti je posljedica
grupiranja podataka u razrede,što ima za posljedicu neprecizne (čitaj:netočne) ulazne
veličine (sredine razreda zamjenjuju stvarne vrijednosti iz tih razreda i time je načinjena
neotklonjiva greška koja se nužno odražava na rezultatu).
Unatoč nekim,nesumnjivim,manjkavostima zamjene stvarnih veličina „zastupnicima“ ,ma
kako oni bili pouzdani i reprezentativni,aritmetička sredina je najčešće korištena srednja
vrijednost.Zbog toga,nije na odmet,naglasiti njene prednosti i nedostatke.
Prednosti su slijedeće:

 Svaki statistički skup nastao na osnovu kvantitativnog obilježja ima jedinstvenu


aritmetičku sredinu u izračun koje su uključeni svi članovi skupa.

57
 Aritmetička sredina je uvijek barem jednaka najmanjoj vrijednosti obilježja i,
istovremeno,nikada ne premašuje maksimalnu vrijednost istog.Ustvari,ona će
podcijeniti vrijednosti obilježja dijela statističkih jedinica i istovremeno precijeniti
vrijednost obilježja drugog dijela statističkih jedinica.
 Posljedica ovog dvojakog kriterija prema vrijednostima obilježja koje imaju
statističke jedinice jest svojstvo aritmetičke sredine, koje ima jedino ona među
mjerama centralne tendencije,a to je

N
∑ ( x i− x̄ )
i=1 = 0
k
∑ f i ( x i − x̄ )
odnosno i=1 = 0 tj.

zbroj odstupanja svih vrijednosti od aritmetičke sredine je uvijek nula.Znači da


„podcjenjivanje“,odnosno „precjenjivanje“ vrijednosti radi „ujednačenim ritmom“.
 Zbroj kvadrata odstupanja pojedinih vrijednosti xi od aritmetičke sredine je uvijek
minimalan.

Nedostaci:

 Najveći nedostatak aritmetičke sredine je osjetljivost na ekstremne vrijednosti


obilježja.Kod slučajeva koje odlikuje izrazito velika varijabilnost obilježja,ona nije
dobra zamjenska vrijednost te je nije preporučljivo koristiti osim ako
manipuliramo podacima ili rezultate analize podataka prilagođavamo nekim
„muljatorskim“ ciljevima.
 Drugi značajan nedostatak aritmetičke sredine je vezan za distribuciju frekvencija
s modalitetima obilježja predočenim razredima,posebno u slučajevima otvorenih
razreda.Neotklonjive greške koje se javljaju upotrebom aproksimativnih
vrijednosti (sredine razreda i procijenjene granice otvorenih razreda) ozbiljno
ugrožavaju reprezentativnost izračunate srednje vrijednosti.

3.2 Geometrijska sredina

Koristit ćemo je samo u analizi vremenskih nizova.Može se računati iz negrupiranih i


grupiranih podataka.U slučaju negrupiranih podataka geometrijska sredina se računa
pomoću uobičajene formule


N
N
∏ xi
G = √ x 1⋅x2⋅¿⋅¿ x N = i=1
N
.
U MS Excelu geometrijska sredina se računa pomoću funkcije

= GEOMEAN ( raspon podataka)

Geometrijska sredina grupiranih podataka je vagana geometrijska sredina

G = √ x ⋅x
N f1
1
f2
2
f
¿⋅¿⋅x kk

58
3.3 Harmonijska sredina

Definira se kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti


numeričke varijable.I ona ,kao i prethodne dvije srednje vrijednosti,je iz klase potpunih
srednjih vrijednosti.Prikladna je u slučajevima kada su osobine promatrane pojave
iskazane recipročnim vrijednostima raspoloživih podataka.U slučaju negrupiranih
podataka harmonijska sredina
N N
N
1 1 1
+ +¿⋅¿⋅+ ∑ x1
H = x1 x2 xN = i=1 i
se u MS Excelu računa pomoću funkcije

=HARMEAN (raspon podataka)

U slučaju grupiranih podataka,imamo ponderiranu harmonijsku sredinu


k
∑fi
i=1
k
f
∑ xi ≠0 ∀i=1,2,...,k
H = i=1 i , xi
3.4 Mod

Mod je vrijednost obilježja s najvećom frekvencijom u nekom statističkom nizu.Zbog toga


je veoma prikladan za iznalaženje najpopularnije vrijednosti.Pored navedenog ima još
jednu prednost u odnosu na ostale srednje vrijednosti.Naime,mod je jedina srednja
vrijednost koja se može odrediti za sve vrste obilježja.Time je iscrpljena lista njegovih
prednosti.Ostale osobine su uglavnom mane.Svaka potpuna srednja vrijednost je
jedinstvena.Mod je lišen tog svojstva.Postoje razdiobe sa dva moda (bimodalne) ili više
njih (Multimodalne).U MS Excelu se računa pomoću naredbe

=MODE ( raspon podataka)

Problemi nastaju kod multimodalnih distribucija.MS Excel ih,jednostavno,ne


prepoznaje.Naime,ako među podacima imamo više različitih vrijednosti obilježja koje se
javljaju jednak broj puta (i to je ujedno maksimalna frekvencija) MS Excel će kao
modalnu „izbaciti“ prvu takovu na koju naiđe.To znači da rezultat traženja moda ovisi o
redosljedu navođenja podataka.Pojasnit ćemo na narednom primjeru.
Za podatke
34666777999
MS Excel će za modalnu vrijednost proglasiti Mo = 6.Ako iste podatke permutiramo na
ovaj način
99977766643
MS Excel će broj 9 proglasiti za modalnu vrijednost tj. Mo = 9.
Ako su podaci grupirani u razrede,najveća frekvencija se odnosi na čitav razred (modalni
razred).U tom slučaju se mod aproksimira sredinom razreda.
Primjer 3.3
Za podatke iz tablice 3.1 izračunati mod i obrazložite značenje dobivene vrijednosti.

59
Rješenje:
=MODE(B2:B53)
Enter.
Dobili smo Mo = 31.Među osobama prijavljenim na zavodu za zapošljavanje u Zadru
1.srpnja 2003.godine,najveći je broj onih koji imaju 31 godinu.
Ovaj podatak nije odveć reprezentativan za naš skup.Zapravo,prilično je atipičan.To je
svojstveno i mnogim drugim slučajevima.Zbog tako slabe zastupljenosti statističkog
skupa i zbog činjenice da mod ne pruža informacije o ostalim članovima skupa,veoma se
rijetko koristi kao srednja vrijednost.

3.5 Medijan

Medijan je srednja položajna vrijednost koja niz,po veličini poredanih brojčanih


podataka,dijeli na dva jednaka dijela.Preciznije,50% podataka ima vrijednost obilježja
manju ili jednaku medijanu a 50% njih ima vrijednost obilježja koja premašuje
medijan.Označava se sa Me a u MS Excelu,za negrupirane podatke,računa se pomoću
funkcije
= MEDIAN (raspon podataka)
Medijan se uspješno nosi sa problemima koji su stvarali poteškoće aritmetičkoj
sredini.Poput aritmetičke sredine i on je jedinstven.Ne može biti manji od najmanje
vrijednosti obilježja, niti može premašiti najveću vrijednost istog.Međutim,za razliku od
aritmetičke sredine, medijan nije osjetljiv na ekstremne vrijednosti obilježja.Čak mu ni
otvoreni razredi nisu problem,osim u slučajevima otvorenog medijalnog razreda.Medijan
je izrazito prikladna srednja vrijednost u slučajevima kada aritmetička sredina gubi na
reprezentativnosti,posebno kod izrazito asimetričnih distribucija.

Primjer 3.4
Za podatke iz tablice 3.1 izračunati medijan i obrazložite značenje dobivene vrijednosti.
Rješenje:
=MEDIAN(B2:B53)
Enter.Dobili smo Me = 35,5 Što znači da 50% osoba prijavljenih na Zavodu za
zapošljavanje u Zadru 1.srpnja 2003.g. ima najviše 35,5 godina,a %0% njih ima više od
35,5 godina.

3.6 Kvantili

Kvantili nisu srednja vrijednosti,ali su usko vezani s njima.Mogu se koristiti kao


pokazatelji veličine raspršenosti podataka.Niz,po veličini svrstanih brojčanih
podataka,dijele na jednake dijelove.Ako je broj tih dijelova q ,govorimo o kvantilima q –
tog reda.Broj p tih diobenih „punktova“ je uvijek za jedan manji od reda kvantila tj p = q
– 1.Već smo upoznali kvantil drugog reda.Bio je to medijan.Teoretski,q bi mogao biti ma
koji prirodni broj veći od 1.U praksi su najčešće slijedeći slučajevi:

 q = 2 - kvantil 2.reda ( medijan ) p = 1


 q = 4 - kvantili 4.reda ( kvartili ) p = 3
 q = 10 - kvantili 10.reda ( decili ) p = 9
 q = 100 - kvantili 100.reda (percentili ) p = 99

60
3.6.1 Kvartili

Prema već rečenom,kvartili su položajne vrijednosti koje numerički niz,po veličini


poredanih podataka,dijele na četiri jednaka dijela.Uobičajeni nazivi za te tri vrijednosti su:
 donji kvartil ( Q1)
 drugi kvartil ili,češće, medijan ( Q2= Me )
 gornji kvartil ( Q3)
Donji kvartil je medijan donje a gornji kvartil je medijan gornje polovice uređenih
podataka.Za izračunavanje kvartila negrupiranih podataka u MS Excelu se koriste
funkcije
= QUARTILE(raspon podataka;red kvartila)

3.6.2 Centili

Centili su kvantili reda 100.Ima ih 99.U MS Excelu,za negrupirane podatke,računaju se


pomoću funkcije
=PERCENTILE(raspon podataka;broj percentila)

3.6.3 Decili

Decili su kvantili reda 10.Ima ih 9.Za njihov izračun u MS Excelu ne postoji posebna
1 1
=10⋅
funkcija.Međutim,obzirom na veoma dobru „komunikaciju“ sa centilima ( 10 100 )
to ih je je moguće računati pomoću funkcije za izračun pripadnog centila.

Primjer 3.5
Za podatke dane tablicom 3.1 izračunajte i obrazložite dobivene vrijednosti:
a) donji kvartil
b) gornji kvartil
c) 13. centil
d) 3.decil

Rješenje:
a) U ćeliji gdje želimo traženu vrijednost ( F20) upišemo:
=QUARTILE(B2:B53;1)
Enter.Q1 = 28.Dakle,25% osoba prijavljenih na Zavodu za zapošljavanje nije starije od 28
godina.
b) U ćeliju F21 upisujemo
=QUARTILE(B2:B53;3)
Enter. Q3 = 45,25 što znači da 75% osoba prijavljenih na Zavodu za zapošljavanje ima
maksimalno 45,25 godina.

61
c) U ćeliju F22 upisujemo
=PERCENTILE(B2:B53;13)
Enter.P13 = 26,26.Među osobama prijavljenim na Zavodu za zapošljavanje,13% njih ima
maksimalno 26,26 godina.
d) U F23 upisujemo
=PERCENTILE(B2:B53;30)
Enter.P30 = 29,6.Među osobama prijavljenim na Zavodu za zapošljavanje,30% njih ima
maksimalno 29,6 godina.
31 MOD
MEDIJA
35,5 N

28 Q1
45,25 Q3
26,26 P13%
29,6 P30%

Primjer 3.6
Zadani su podaci o odobrenim stambenim kreditima štedišama stambeno-štedne zadruge
Stanogradnja (Tablica 3.2).
a) Izračunajte prosječni iznos odobrenih kredite
b) Kreditne iznose grupirajte u razrede širine 20000 EU te izračunajte aritmetičku
sredinu tako grupiranih podataka.Usporedite je sa aritmetičkom sredinom
izvornih podataka i obrazložite nastalu razliku.
c) Odredite koji je iznos kredite najčešće odobravan.
d) Izračunajte medijan.
e) Izračunajte donji i gornji kvartil.
f) Izračunajte koliki je maksimalno iznos prvih 70%,po veličini
razvrstanih,kredita.
g) Izračunajte 4 i 6 decil.
h) Grafički predočite dane podatke.
Obrazložite značenje svake od traženih vrijednosti.

62
Tablica 3.2
Redni Iznos kredita Redni Iznos kredita Redni Iznos kredita Redni Iznos kredita
broj ( u eurima ) broj ( u eurima ) broj ( u eurima ) broj ( u eurima )
1 80320 19 90140 37 160190 55 45950
2 50450 20 60290 38 113110 56 90250
3 110890 21 30220 39 48360 57 130380
4 150220 22 38114 40 72920 58 180950
5 200180 23 50250 41 116260 59 73390
6 45950 24 55180 42 120380 60 90180
7 90250 25 68290 43 190210 61 40290
8 130380 26 73390 44 220110 62 92120
9 180950 27 90180 45 150220 63 110390
10 220100 28 40290 46 30220 64 140400
11 130250 29 92120 47 130250 65 170200
12 140180 30 110390 48 100000 66 48360
13 110200 31 140400 49 140400 67 72920
14 100000 32 170200 50 130250 68 116260
15 88010 33 250380 51 100000 69 120380
16 90220 34 210190 52 140400 70 190210
17 100110 35 170179 53 150220 71 220110
18 70770 36 130180 54 200180 72 150000

Rješenje:
Podatke ćemo unijeti na uobičajeni način.Znači,u stupac A upisujemo redne brojeve,a u
stupac B iznose odobrenih kredita zadržavši pri tome prve ćelije,u svakom od njih,za
odgovarajuće naslove.
a) Prosječan iznos odobrenih kredita ćemo izračunati upisom
=AVERAGE(B2:B73)
u ćeliju D20.Nakon pritiska na tipku Enter dobit ćemo traženi prosjek izvornih
podataka.Iznosi 116058,79 EU.U ćeliji E20 ćemo napisati Prosječni iznos
negrupiranih podataka.
b) Sada ćemo grupirati iznose kredita u razrede širine 20000 (EU).Najprije moramo
znati iznos najmanjeg i najvećeg odobrenog kredita.Dakle,negdje sa strane,u dvije
slobodne ćelije,pomoću poznatih funkcija za izračun najveće i najmanje vrijednosti
skupa numeričkih podataka,dobi ćemo da se iznosi odobrenih kredita kreću u
granicama od najmanjeg 30220,do,najvećeg odobrenog,250380.Sada možemo
formirati granice razreda ( sjetimo se da navodimo samo gornje granice tekućih
razreda).Naslov iz B1 kopiramo u ćeliju C1,a u C2 unesemo gornju granicu prvog
razreda (40000).Potom,u C3 pišemo 60000 i,tako redom,do ćelije C13 u kojoj će biti
gornja granica zadnjeg razreda (260000).Sada smo spremni za pokretanje
Histograma.Slijed koraka znamo:Tools/Data Analysis/Histogram.U gornjem dijelu
dobivenog okvira,u prozorčić Input Range upisujemo B1:B73,a u otvor uz Bin Range
C1:C13.Obuhvatili smo i naslove,zato ne smijemo zaboraviti kvačicu uz Labels.Ostat
ćemo na istom radnom listu pa zato biramo Output Range i E2.Trebamo i grafički
prikaz,pa ćemo kliknuti i na Chart Output .Uredit ćemo ga poslije,pa ćemo ga
izmaknuti negdje desno,na radnom listu.U izlaznoj tablici možemo,eventualno,u ćeliji
F2 umjesto frekvencija napisati Broj odobrenih kredita.U G2 pišemo xi a u H2 xi* fi..
Nakon toga „punimo“ostale ćelije stupca G.U G3 pišemo sredinu pvog razreda gornje
granice 40000 (širine 20000).Naravno,to je 30000.Algoritam za izračun ostalih sredina

63
proizlazi iz njihove prirode (aritmetička sredina razrednih granica).Zato,u G4 pišemo
=(E3+E4)/2 i,kopiramo mišem do G15.Potom zbrojimo frekvencije iz stupca F i u F15
dobijemo poznati opseg skupa 72.Sada ćemo popuniti potrebna mjesta u stupcu H
počevši od H3 gdje upisujemo =F3*G3.Nakon tipke Enter,“hod“ mišem prema dole
do H15.Nakon toga zbrojimo brojeve iz stupca H i u H16 imamo brojnik razlomka
kojim ćemo,u D21izračunati aritmetičku sredinu grupiranih podataka pomoću
=H16/F16.Enter.Dobivenih 117361,11,naravno,odstupa od pravog prosjeka koji smo
dobili iz izvornih podataka jer,kao što znamo,grupiranjem podataka u razrede načinili
smo neotklonivu grešku.U E21 ćemo napisati Aritmetička sredina grupiranih
podataka.
c) Najčešće odobreni iznos kredita je ustvari modalna vrijednost pa,ne zaboravivši
slabosti ovog programskog paketa u slučaju višemodalnih distribucija,računamo
=MODE(B2:B73)
Enter.Traženu vrijednost 140400 ćemo izračunati u ćeliji D22 ,desno od koje,u E22
pišemo MOD.
d) U D23 pišemo
=MEDIAN(B2:B73)
Enter i dobili smo 110640 vrijednost sa svojstvom da 50% odobrenih kredita ne
premašuje taj iznos.U E23 upisujemo MEDIJAN.
e) U E24 i E25,redom,pišemo Donji kvartil odnosno Gornji kvartil.Računamo ih u
ćelijama D24,odnosno D25 pozivom pripadnih funkcija
=QUARTILE(B2:B73;1)
=QUARTILE(B2:B73;3)
Dobili smo 73390 za donji,odnosno 150055 za gornji kvartil što znači da 25%
odobrenih kredita ne premašuje 73390,dok 75% njih nije veće od 150055 EU.
f) U E26 pišemo P70%,a u D26
=PERCENTILE(B2:B73;70%)
P70% = 140400 znači da prvih 70%,po veličini razvrstanih kredita,ne premašuje
140400 EU.
g) Decile računamo pomoću odgovarajućih percentila.Znači,četvrti decil je
P40%,odnosno deveti decil je P90%.Stoga,redom,u D27,odnosno D28 upisujemo

=PERCENTILE(B2:B73;40%)
=PERCENTILE(B2:B73;90%)
Dobiveni iznosi su P40% = 92272,odnosno P90% = 130222 što predstavlja
maksimalne iznose prvih 40%,odnosno prvih 90% odobrenih kredita.
h) Grafikon ćemo dotjerati na uobičajeni način ( naslov,oznake na osima).Ono što je
bitno,ne smijemo zaboraviti.To se odnosi na položaj stupaca koji obavezno
moraju biti spojeni.Kako?To smo već vidjeli.Dvostruki klik lijevom tipkom miša
na ma koji od njih i,nakon što smo odabrali Options,širinu koraka svesti na nulu.

116058,7 Prosjek negrupiranih


9 podataka
117361,1
1 Prosjek grupiranih podataka
140400 MOD
110640 MEDIJAN
73390 Q1
150055 Q3
140400 P70%
95272 P40%

64
130222 P60%

Razdioba frekvencija odobrenih stambenih kredita

14

12
Broj odobrenih kredita

10

0
40000 60000 80000 100000 120000 140000 160000 180000 200000 220000 240000 260000 More

Iznos kredita
( u eurima )

65
Zadaci za vježbu 2.

1. Na pitanje o tome koliko puta tjedno jedu ribu,92 ispitanika je dalo slijedeće odgovore:

Tablica 3.3
Redni Broj Redni Broj Redni Broj Redni Broj
broj obroka broj obroka broj obroka broj obroka
1 1 24 1 47 0 70 3
2 0 25 5 48 0 71 3
3 0 26 5 49 0 72 2
4 1 27 2 50 1 73 2
5 1 28 2 51 1 74 2
6 1 29 3 52 1 75 2
7 1 30 3 53 3 76 5
8 2 31 3 54 3 77 5
9 2 32 0 55 1 78 1
10 1 33 0 56 0 79 0
11 1 34 1 57 1 80 0
12 3 35 0 58 1 81 7
13 3 36 1 59 0 82 0
14 4 37 1 60 0 83 0
15 5 38 1 61 0 84 1
16 0 39 7 62 2 85 1
17 1 40 7 63 1 86 1
18 7 41 2 64 2 87 1
19 0 42 2 65 2 88 1
20 0 43 2 66 1 89 2
21 0 44 2 67 1 90 3
22 1 45 1 68 1 91 5
23 1 46 1 69 4 92 4

Izračunajte i objasnite slijedeće vrijednosti:


a) aritmetičku sredinu
b) mod
c) medijan
d) donji i gornji kvartil
e) sedamnaesti centil
f) šesti decil

2.Podatke iz prethodnog zadatka grupirajte u razrede širine 2,te izračunajte aritmetičku


sredinu tako grupiranih podataka.Objasnite nastalu razliku.

3.Podaci o težini djece upisane u prvi razred dani su slijedećom tablicom:


a) Odredite prosječnu težinu prvašića.
b) Kolika je najčešća težina djece upisane u prvi razred?
c) Kolika je maksimalna težina prvih 50% djece razvrstane po težini?
d) Odredite vrijednost koja zadani niz podataka dijeli u omjeru 1 : 3,te onu koja isti
niz dijeli u omjeru 3 : 1.
e) Odredite koja je najmanja težina koju ima 30% najteže djece.

66
f) Odredite najveću težinu koju ma prvih 55%,po težini razvrstane,djece.

Tablica 3.4

Redni Težina Redni Težina Redni Težina Redni Težina


broj ( u kg ) broj ( u kg ) broj ( u kg ) broj ( u kg )
1 18,20 17 24,80 33 24,00 49 18,80
2 20,21 18 24,00 34 23,80 50 18,90
3 19,14 19 19,90 35 24,30 51 20,30
4 21,20 20 25,00 36 24,00 52 20,40
5 22,30 21 18,80 37 20,00 53 22,75
6 24,80 22 18,90 38 22,80 54 22,70
7 24,00 23 20,30 39 22,00 55 19,14
8 20,90 24 20,40 40 24,10 56 21,20
9 19,80 25 22,75 41 18,80 57 18,20
10 22,40 26 22,70 42 18,90 58 20,21
11 24,30 27 22,70 43 20,30 59 19,14
12 24,00 28 22,00 44 20,40 60 21,20
13 20,00 29 24,10 45 22,75 61 22,30
14 22,80 30 24,30 46 22,70 62 24,80
15 22,00 31 24,00 47 19,14 63 24,00
16 24,10 32 23,80 48 21,20 64 20,90

Rješenja:
1.
Broj
Broj
ispitanik
obroka
a

0 20 1,79
1 33
2 16
3 10
4 3 2,25
5 6
6 0
7 4
More 0

2.
Broj Broj xi xi*fi
obroka ispitanika
0 20 0 0
2 49 1 49
4 13 3 39
6 6 5 30
8 4 7 28
More 0 146
92

67
Aritmetička sredina
1,59 grupiranih podataka
Aritmetička sredina
1,79 izvornih podataka

Nastala razlika je posljedica neotklonjive greške proizašle iz grupiranja vrijednosti u


razrede što rezultira približnim vrijednostima izvornih podataka.

3.
a) 21,76 Prosječna težina
b) 24 Najčešća težina
c) 22,00 MEDIJAN
d1) 20,16 Q1
d2) 24 Q3
e) 22,9 P70%
f) 22,365 P55%

4. Mjere disperzije

Slika statističkog skupa koju dobijemo posredovanjem srednjih vrijednosti može biti
veoma manjkava i neprecizna.Posebno će se to dogoditi u slučajevima kada podaci
nemaju osobine koje pogoduju zamjenskoj ulozi srednjih vrijednosti ( npr. upotreba
aritmetičke sredine kao zamjenske veličine podataka velikog varijabiliteta).Da bi tako
nastala slika što vjernije odražavala prirodu podataka,preporučljivo je usporedo sa
srednjim vrijednostima ispitati i raspršenost podataka oko izračunatih stožernih vrijednosti
koje često imaju osobine gomilišta statističkog skupa.
Raspršenost (disperzija) podataka se može mjeriti na različite načine.Niz parametara
utječe na odabir pokazatelja disperzije.Ako mjerom disperzije ocjenjujemo pouzdanost
izračunate srednje vrijednosti numeričkog niza,tada obično,odabiremo neku od apsolutnih
mjera disperzije kao što su raspon varijacije,interkvartil,varijanca i,iz nje
izvedena,standardna devijacija.Apsolutne mjere disperzije se iskazuju u jedinicama mjere
aktualne numeričke varijable.Zbog toga nisu prikladne mjere disperzije pri usporedbi
varijabiliteta dviju ili više distribucija različitih obilježja ili,pak,istih obilježja različitih
modaliteta.Tada,obavezno,koristimo relativne mjere disperzije koje su neimenovani
brojevi.Obično se iskazuju u postotku.To su koeficijent varijacije i koeficijent kvartilne
devijacije.Iznimno,ako uspoređujemo distribucije istih obilježja (sa sličnim vrijednostima)
možemo koristiti i apsolutne mjere disperzije.

4.1 Raspon varijacije

Raspon varijacije je najjednostavnija mjera disperzije.Računa se kao razlika najveće i


najmanje vrijednosti kvantitativnog obilježja
Rx = xmax - xmin

U slučaju podataka grupiranih u razrede računa se kao razlika gornje granice posljednjeg
razreda i donje granice prvog razreda.Najmanja moguća vrijednost je 0 (potpuno odsustvo

68
varijabilnosti) a najveća nije definirana.Zbog načina izračuna,za raspon varijacije se često
kaže da je mjera „totalne raspršenosti“ u skupu podataka.Jednostavnost izračuna i
interpretacije je najveća prednost ove mjere disperzije.S druge pak strane,najveći
nedostatak proizlazi iz činjenice da se računa pomoću samo dvije vrijednosti obilježja i
to,često nepouzdane,ekstremne.Naime,one su,obično,atipične ili je njihovo postojanje
problematično (u slučajevima distribucija s razredima,posebno ako je prvi,posljednji,ili
čak obadva,razreda otvorena) te se zbog raspon varijacije ne može smatrati pouzdanom
mjerom disperzije.
U programu MS Excel-u nemamo funkciju za direktan izračun raspona
varijacije.Međutim,jednostavnim „prijevodom“ formule lako se računa:
= MAX(raspon varijacije) – MIN(raspon varijacije)
Unatoč navedenim nedostacima,raspon varijacije je prikladan pokazatelj disperzije u
slučajevima kada je gruba procjena statističkog skupa zadovoljavajuća procjena.

4.2 Interkvartil i interpercentil

Interkvartil IQ se računa kao razlika gornjeg i donjeg kvartila


IQ = Q3 - Q1
Znači,riječ je o apsolutnoj mjeri disperzije koja daje raspon varijacije središnjih 50%
jedinica uređenog numeričkog niza.Za razliku od raspona varijacije,nije pod utjecajem
netipičnih,ekstremnih vrijednosti obilježja.Međutim,i interkvartil stvara sliku o
statističkom skupu na osnovu samo dvije vrijednosti zbog čega predstavlja nepotpunu
mjeru disperzije.U MS Excel-u ne postoji funkcija za njegov direktan izračun,ali se može
načiniti funkcionalni „prijevod“ kao i u prethodnom slučaju:
=QUARTILE(raspon podataka;3) - QUARTILE(raspon podataka;1)
Jedan od nedostataka interkvartila je „izbacivanje iz igre“ čak,50% statističkog niza (25%
ispred donjeg i 25% nakon gornjeg kvartila).Kako bi u procjeni disperzije uključili veći
broj statističkih jedinica,neki autori sugeriraju upotrebu interpercentila koji se definira kao
razlika vrijednosti 90 – tog i 10 – tog percentila.Dakle,interpercentil daje raspon varijacije
središnjih 80% članova numeričkog statističkog niza.

4.3 Varijanca i standardna devijacija

Bez obzira na postojeće razlike,sve,prethodno navedene apsolutne mjere disperzije imaju


jedno zajedničko svojstvo,a to je nepotpuni obuhvat jedinica statističkog skupa.Svaka od
njih se računa samo na osnovu dvije vrijednosti obilježja (minimalnog i maksimalnog) u
nekoj razdiobi ili dijelu razdiobe (središnjih 50% ili 80% jedinica).Želimo li pouzdaniji
pokazatelj varijabilnosti obilježja,morat ćemo uvesti mjere koje će voditi računa o tome
kako je raspoređena svaka vrijednost obilježja u odnosu na neku, istaknutu,stožernu,
vrijednost (najčešće je to aritmetička sredina).Kako je zbroj odstupanja pojedinih
vrijednosti numeričkog obilježja od aritmetičke sredine uvijek jednak nuli,to nam ta suma
ne može poslužiti kao mjera stupnja varijabilnosti obilježja.Tu ulogu će imati sredina
kvadrata tih odstupanja.I tako dolazimo do varijance (u oznaci s2 ili σ 2 ) kao prosječnog
kvadratnog odstupanja pojedinih vrijednosti numeričkog obilježja od njihove aritmetičke
sredine.
N
∑ ( x i − x̄ )2
σ 2= i =1
N
odnosno

69
N
∑ x 2i
σ 2= i =1 − x̄ 2
N .
Za grupirane podatke

k k
∑ f i ( x i− x̄ )2 ∑ f i x 2i
σ 2= i =1 k
i=1
k
− x̄ 2
∑ fi ∑ fi
i =1 = i=1 .

U MS Excel-u,za negrupirane podatke,računa se pomoću funkcije


=VARP (raspon podataka)
Zbog načina izračuna,interpretacija varijance nije baš jednostavna,pa ćemo je izostaviti.
Standardna devijacija ( s ili σ ) se definira kao prosječno odstupanje vrijednosti
numeričke varijable od njene aritmetičke sredine.Kako je

√ √
N N
∑ ( x i− x̄ )2 ∑ x 2i
i=1 i =1
σ= = − x̄ 2
N N
odnosno,za grupirane podatke,

√ √
k k
∑ f i ( x i − x̄ )2 ∑ f i x 2i
i=1 i=1
σ= k
= k
− x̄ 2
∑ fi ∑ fi
i =1 i=1
Ova definicija je matematički netočna,ali se ustalila u upotrebi.U programu MS Excel za
izračun standardne devijacije se koristi funkcija
=STDEVP(raspon podataka)
U praksi se standardna devijacija najčešće koristi kao potpuna apsolutna mjera
disperzije.Koliko će uspješno odgovoriti na očekivanja koja se pred nju postavljaju,ovisi o
reprezentativnosti aktualne aritmetičke sredine kao zamjenske veličine. Znači,eventualne,
teškoće „dijeli“ sa aritmetičkom sredinom,a one su,kao što znamo,vezane za nazočnost
atipičnih ekstremnih vrijednosti obilježja te,kod grupiranih podataka,nazočnost otvorenih
razreda ( s teško odredivim granicama).

4.4 Koeficijent kvartilne devijacije i koeficijent varijacije

Relativne mjere disperzije su prikladne za usporedbu stupnja disperzije raznorodnih


distribucija.U slučajevima kada se apsolutnu disperziju u pojedinim distribucijama mjeri
interkvartilom,za usporedbu disperzije raznorodnih distribucija je podesan koeficijent
kvartilne devijacije kojim ćemo mjeriti disperziju središnjih 50% elemenata uređenog
statističkog skupa.Označava se sa Vq i predstavlja omjer razlike i zbroja gornjeg i donjeg
kvartila.
Q3 −Q1
q=
V Q 3 +Q .

70
Može poprimiti vrijednosti iz segmenta [ 0,1 ] .Ako nema disperzije (odsustvo
varijabilnosti), jednak je 0.S porastom raspršenosti podataka njegova vrijednost raste
prema jedinici. U slučajevima kada ne premašuje vrijednost od 0,2 kažemo da središnjih
50% elemenata promatranog uređenog skupa iskazuje vrlo slab,ili relativno
slab,varijabilitet.O umjerenom varijabilitetu govorimo ako Vq poprima vrijednosti između
0,2 i 0,3.Ako,pak, se kreće između 0,3 i 0,5,govorimo o relativno jakom
varijabilitetu.Vrijednosti iznad 0,5 su znak vrlo jakog varijabiliteta ovog,izdvojenog,dijela
statističkog skupa (središnjih 50% elemenata).Ni
za ovu mjeru disperzije u MS Excel-u nema funkcije za izravan izračun te se snalazimo
korištenjem poznatih naredbi i definicione formule.Tako,za negrupirane podatke,će to biti
=(QUARTILE(raspon podataka;3) - QUARTILE(raspon podataka;1))/
(QUARTILE(raspon podataka;3) + QUARTILE(raspon podataka;1))
Kao i interkvartil,i koeficijent varijacije je relativna mjera disperzije te je ,zbog
toga,pogodan za usporedbu stupnja varijabilnosti podataka u raznorodnim statističkim
nizovima.Označavamo ga sa V,a računamo po formuli
σ
⋅100
V = x̄
te iskazuje u postocima.Ne može biti manji od nule (jednak je nuli za stacionarne
statističke nizove).Premda gornja granica nije određena,u praksi je obično 100%.Ako ima
vrijednost manju od 50%,pripadni skup se odlikuje slabim do umjerenim
varijabilitetom.Varijabilitet je relativno jak,odnosno vrlo jak ako vrijednost koeficijenta
varijacije premašuje 50%,odnosno 70%.Ni za ovu mjeru disperzije ne postoji u MS Excel-
u funkcija za direktan izračun.Postupamo na isti način kao i u prethodnom slučaju pa će
naredba za izračun koeficijenta varijacije biti
=STDEVP(raspon podataka)/AVERAGE(raspon podataka)*100
Primjer 4.1

Tablicom 3.2 zadani su podaci o odobrenim stambenim kreditima štedišama stambeno-


štedne zadruge Stanogradnja.Izračunajte i objasnite značenje dobivenih vrijednosti:
a) raspon varijacije
b) interkvartil
c) koeficijent kvartilne devijacije
d) standardnu devijaciju
e) koeficijent varijacije
Rješenje:
a) Podatke smo pohranili u blok ćelija B2:B73.Već smo računali ekstremne vrijednosti
odobrenih kredita i u C15 je pohranjen najmanji odobreni iznos,a u C16
najveći,Znači,traženi raspon varijacije ćemo dobiti upisom,u ćeliju D32:
= C16 - C15
Dobiveni broj je Rx=220160 što,doduše u gruboj procjeni,ukazuje na prilično veliku
disperziju odobrenih iznosa.
b) Već smo računali i kvartile i,u ćeliji D24,pohranili donji kvartil,a,u ćeliji
D25,pohranili gornji kvartil.Stoga,u ćeliji D29 je
= D25 – D24
Što daje IQ =76665 a to,u usporedbi sa rasponom varijacije svih odobrenih
kredite,predstavlja osjetno manju disperziju središnjih 50% odobrenih iznosa.
c) Imajući u vidu gornje podatke,u D30 pišemo
= D29/(C15 + C16)
i dobijemo Vq = 0,34 što znači relativno jak varijabilitet središnjih 50% odobrenih kredite.

71
d) U ćeliji D31 pišemo
=STDEVP(B2:B73)
i dobijemo σ = 52621,38 a znači prosječno odstupanje od prosječnog iznosa odobrenog
kredita.
e) Za koeficijent varijacije imamo sve potrebne podatke u D20 (aritmetička sredina) i u
D31 (standardna devijacija) pa ćemo,u ćeliju D33 upisati
=D31/D20
i dobiveni iznos,pomoću odgovarajuće ikonice,pretvoriti u postotke te dodati dvije
decimale.Tako dobiveni broj je 45,34% što znači prilično veliku disperziju odobrenih
kredita.

Primjer 4.2
Anketirano je 20 obitelji vezano za njihova mjesečna izdvajanja za kulturu i sport.
Dobiveni podaci su dani slijedećom tablicom:

Tablica 4.1
Mjesečna Mjesečna Mjesečna Mjesečna
Redni Redni
izdvajanja izdvajanja izdvajanja izdvajanja
broj broj
za kulturu za sport za kulturu za sport
1 500 600 11 300 600
2 300 200 12 280 300
3 100 250 13 380 350
4 150 150 14 200 290
5 280 180 15 450 300
6 500 210 16 200 400
7 200 200 17 180 300
8 300 300 18 350 400
9 600 400 19 400 250
10 450 500 20 500 300

Odredite i obrazložite razliku u obiteljskim izdvajanjima za kulturu i sport.

Rješenje:
Kako imamo dva različita skupa (doduše,istovrsna i to kontinuirana numerička
obilježja),za usporedbu varijabiliteta moramo koristiti neku od relativnih mjera
disperzije.Najpouzdaniji je koeficijent varijacije kao potpuna mjera relativne
disperzije.Reprezentativnost aritmetičke sredine kao srednje vrijednosti i standardne
devijacije kao apsolutne mjere disperzije,nisu upitne zbog odsustva faktora koji bi ih
mogli ugroziti (odsustvo ekstremnih vrijednosti;otvoreni razredi nisu ni mogući jer podaci
nisu grupirani u razrede)
Podatke unosimo na uobičajeni način u stupce B i C zadržavši zaglavne ćelije za
naslove.Dakle,u B1 pišemo ime jednog od obilježja Mjesečna izdvajanja za kulturu,a u
C1 Mjesečna izdvajanja za sport.U skladu s sadržajem zaglavnih ćelija,punimo ćelije
bloka B2:C21.Sada ćemo u dvije slobodne ćelije (a ima ih jako,jako puno) izračunati
tražene vrijednosti.Odaberimo B25 i C25.U B25 upisujemo:
=STDEVP(B2:B21)/AVERAGE(B2:B21).
Potvrda sa Enter i pretvorba dobivenog broja u postotak sa dva decimalna mjesta 40,67.
Posve analogno,u C25 upisujemo
=STDEVP(C2:C21)/AVERAGE(C2:C21).
i,analognim slijedom koraka,dobijemo 38,49%.

72
Dobivene vrijednosti koeficijenata varijacije ukazuju na znatnu disperziju obiteljskih
izdvajanja kako za kulturu tako i za sport.Pri tome,disperzija je izrazitija kada su u pitanju
obiteljska izdvajanja za kulturu što znači da se promatrane obitelji više međusobno
razlikuju u izdvajanjima za kulturu nego u onima za sport.
Primjer 4.3
Podaci o mjesečnoj (veljača 2006.g.) prodaji goriva na benzinskoj crpki Smokovik u
Splitu,dani su narednom tablicom.

Tablica 4.2
Iznos računa Broj
( u kunama ) kupaca
50 - 100 230
100 - 150 510
150 - 200 800
200 - 250 860
250 - 300 750
300 - 400 450
400 - 500 380
500 - 600 250

Izračunajte:
a) aritmetičku sredinu
b) standardnu devijaciju
c) koeficijent varijacije

Rješenje:
a) Unošenjem podataka smo davno ovladali pa ćemo i ovdje ponoviti uobičajeni
postupak.Iznos računa ćemo upisati u A1,a u B1Broj kupaca.Sukladno tome i podatke
smještamo u blok ćelija A2:B8.U C1 ćemo upisati xi a u C2 izračunati sredinu prvog
razreda =(50 + 100)/2.Enter.I tako,redom,računamo sredine ostalih razreda kao
aritmetičku sredinu njihovih granica.Trebat ćemo i opseg skupa,te stoga zbrojimo
apsolutne frekvencije u stupcu B.U B10 ćemo imati potrebni opseg 4230.U D1
upisujemo fi*xi ,u E1 (xi - xpro)2 te,u F1 fi *(xi - xpro)2 .Za izračun aritmetičke sredine
moramo popuniti odgovarajuće ćelije stupca D i to počevši sa D2 gdje pišemo
=B2*C2,a,nakon Enter,kopiramo njen sadržaj u blok ćelija D3:D9 te zbrojimo upravo
izračunate podatke u stupcu D.Sada ćemo u A12 unijeti =D10/B10 i dobili smo da je
prosječni račun na benzinskoj crpki Smokovik,tijekom veljače 2006.godine,iznosio
256,91 kunu.
b) Već smo „rezervirali“ mjesta na radnom listu za izračun podataka nužnih za dobivanje
standardne devijacije naših podataka grupiranih u razrede.I krenimo sa punjenjem
ćelija u stupcu E počevši sa E2 Gdje unosimo =(C2-$A$12)^2.Enter.I kopiranje
upravo unesenog sadržaja u blok E3:E9.Nakon toga se „prebacujemo“ na susjedni
stupac F i u F1 unosimo =B2*E2.Kopiranje tog sadržaja u blok F3:F9 i zbrajanje
izračunatih vrijednosti iz stupca F.Sada u A13 unosimo =SQRT(F10/B10).
Enter,i,nakon zaokruživanja na dvije decimale dobijemo da je prosječno odstupanje od
prosječnog iznosa računa za uliveno gorivo, na benzinskoj crpki Smokovik,tijekom
veljače 2006.godine,iznosi 121,57 kuna.
c) Izračun koeficijenata varijacije je sada šala mala.Naime,sve potrebite podatke već smo
priredili i zato,u A14 samo unesemo =A13/A12.Enter,i pretvaranje u postotak sa dvije
decimale.Dobivenih 47,32% upozorava na prilično veliku disperziju iznosa računa za
uliveno gorivo na promatranoj crpki.

73
Tablica 4.3

Iznos računa Broj kupaca xi fi*xi (xi-xpr)^2 fi*(xi-xpr)^2


( u kunama )
33093,028
50 - 100 230 75 17250 5 7611396,56
17401,539
100 - 150 510 125 63750 2 8874784,97
150 - 200 800 175 140000 6710,0498 5368039,84
1018,5604
200 - 250 860 225 193500 3 875961,97
327,07107
250 - 300 750 275 206250 3 245303,30
8664,8370
300 - 400 450 350 157500 3 3899176,66
37281,858 14167106,1
400 - 500 380 450 171000 3 6
85898,879 21474719,9
500 - 600 250 550 137500 6 0
108675 62516489,3
4230 0 6

256,91 xpr
121,57 St.dev.
koef.varijacij
47,32% e

Napomena:Potenciranje u MS Excel-u se obavlja pomoću znaka ^ kojeg pokrećemo


pritiskom na Alt Gr te,ne puštajući tipku,istovremeno udarimo na tipku sa brojem 3.
Traženi znak ^ će se pojaviti nakon pritiska tipke space.

Zadaci za vježbu 3.

1.Za 84 učesnika automobilske utrke podaci o maksimalnoj brzini dostignutoj tijekom


utrke,dani su tablicom. Izračunajte i objasnite značenje dobivenih vrijednosti:

a) raspon varijacije
b) interkvartil
c) koeficijent kvartilne devijacije
d) standardnu devijaciju
e) koeficijent varijacije

74
Tablica 4.4

Redni Maksimalna Redni Maksimalna Redni Maksimalna Redni Maksimalna


broj brzina broj brzina broj brzina broj brzina
( u km ) ( u km ) ( u km ) ( u km )
1 179,43 22 260,70 43 260,00 64 280,60
2 201,56 23 300,00 44 198,00 65 230,70
3 240,50 24 280,60 45 220,58 66 287,00
4 199,80 25 230,70 46 188,50 67 250,00
5 200,70 26 287,00 47 198,50 68 240,37
6 250,38 27 250,00 48 199,00 69 239,50
7 250,00 28 240,37 49 200,30 70 244,30
8 260,00 29 239,50 50 290,00 71 199,90
9 198,00 30 244,30 51 287,00 72 245,80
10 220,58 31 199,90 52 280,60 73 310,00
11 188,50 32 245,80 53 230,70 74 223,70
12 198,50 33 310,00 54 287,00 75 220,58
13 199,00 34 223,70 55 250,00 76 188,50
14 200,30 35 201,56 56 240,37 77 198,50
15 290,00 36 240,50 57 239,50 78 199,00
16 287,00 37 199,80 58 244,30 79 200,30
17 250,00 38 200,70 59 199,90 80 290,00
18 240,37 39 250,38 60 245,80 81 287,00
19 239,50 40 250,00 61 310,00 82 280,80
20 244,30 41 260,00 62 223,70 83 276,98
21 260,00 42 270,70 63 265,90 84 256,78

2.Dani su podaci o postignutoj prosječnoj ocjeni i mjesečnom iznosu stipendije za 56


studenata dani su slijedećom tablicom.
a) Izračunajte prosječan iznos stipendije.Standardnom devijacijom i koeficijentom
varijacije procijenite reprezentativnost izračunatog prosjeka.
b) Izračunajte relativnu mjeru disperzije središnjih 50% mjesečnih stipendija (razvrstanih
po veličini).Objasnite značenje dobivenih vrijednosti.
c) Ispitajte da li se promatrani studenti razlikuju više po postignutim prosječnim
ocjenama ili ostvarenim stipendijama.

75
Tablica 4.5

Prosječna Prosječna Prosječna Prosječna


ocjena Iznos ocjena Iznos ocjena Iznos ocjena Iznos
stipendije stipendije stipendije stipendije
(u kn) (u kn) (u kn) (u kn)
4,8 2000 4,0 1900 4,3 2500 5,0 1500
3,9 1300 4,1 1500 4,5 1850 4,2 2200
5,0 2500 4,3 1500 4,4 1900 4,5 2000
4,2 3000 5,0 2200 3,9 2200 4,6 1800
4,5 2500 4,7 2000 4,2 2500 4,5 1500
4,6 2800 4,7 1800 5,0 1500 4,8 1300
4,5 1800 3,5 1500 4,2 2200 5,0 2300
4,8 1500 3,7 1300 4,5 2000 4,7 2800
5,0 2300 3,6 1300 4,6 1800 4,7 1200
5,0 2800 4,4 2100 4,5 1500 3,5 1200
3,9 1200 4,7 2100 4,8 1300 3,7 1600
3,5 1200 4,8 2200 5,0 3100 3,6 1700
3,7 1600 3,7 1900 5,0 3000 4,4 2500
3,7 1700 4,2 1600 4,8 2700 4,7 1850

3.Podaci o starosti automobila 3000 anketiranih stanovnika grada X dani su narednom


tablicom.

Tablica 4.6
Starost automobila Broj vlasnika
0 - 4 530
4 - 8 670
8 - 12 750
12 - 16 420
16 - 20 330
20 - 30 300

Izračunajte koliko,prosječno star,automobil voze anketirani stanovnici grada


X.Odgovarajućim apsolutnim i relativnim mjerama disperzije procijenite
reprezentativnost dobivenog rezultata.

Rješenja:
1.

Rx 130,00 Raspon varijacije


IQ 59,475 Interkvartil
VQ 0,129 Koef.kvart.devijacije
Standardna
σ 34,211 devijacija
V 14,23% Koeficijent varijacije

a) Maksimalne brzine su se kretale u rasponu od 130,57 km tj. od minimalne 179,43 do


maksimalne 310,00 km.
b) Raspon varijacije središnjih 50%,po veličini raspoređenih,brzina iznosi 59,475 km.
c) Postignute maksimalne brzine,tijekom utrke,iskazuju relativno slab varijabilitet.
d) Prosječno kvadratno odstupanje maksimalnih brzina učesnika utrka od prosjeka
postignutih maksimalnih brzina iznosi 34,211.

76
e) Vrijednost koeficijenta varijacije u iznosu od 14,23% ukazuje na relativno slab
varijabilitet maksimalnih postignutih brzina učesnika.
2.a)
1939,29 Prosječna stipendija
517,01 Standardna devijacija
26,66% Koeficijent varijacije

Koeficijent varijacije ukazuje na relativno slab varijabilitet ostvarenih stipendija što znači
da se prosječna stipendija može prihvatiti kao prikladna zamjenska vrijednost.
b)
725 Interkvartil

Raspon varijacije središnjih 50% ,po veličini svrstanih,stipendija iznosi 725 kuna.
c)
10,66 Koef.var. za prosječne
% ocjene

Osjetno zaostajanje koeficijenta varijacije prosječnih ocjena za koeficijentom varijacije


ostvarenih stipendija ukazuje na činjenicu da ispitanici znatno više razlikuju po iznosu
ostvarene stipendije nego po postignutoj prosječnoj ocjeni.

3.
Starost Broj
automobila vlasnika xi xi*fi fi*(xi-xpro)^2
0 - 4 530 2 1060 39472,757
4 - 8 670 6 4020 14362,723
8 - 12 750 10 7500 297,675
12 - 16 420 14 5880 4769,898
16 - 20 330 18 5940 17924,577
20 - 30 300 25 7500 61949,07
3000 31900 138776,7

Prosječna 10,63
starost
Varijanca 46,2589
Standardna 6,801389564
devijacija
Koeficijent 63,96%
varijacije

Dobivena vrijednost koeficijenta varijacije ukazuje na relativno jak varijabilitet starosti


automobila što je znak slabe reprezentativnosti izračunatog prosjeka.

5. Mjere asimetrije i zaobljenosti

77
Numerički podaci pokazuju sklonost gomilanja oko istaknute, „centralne“,točke.Zbog
toga,srednje vrijednosti i raspršenost numeričkih statističkih jedinica oko njih,imaju
značajnu ulogu u opisu statističkog skupa.Taj opis se može upotpuniti mjerenjem načina i
oblika raspoređivanja podataka u numeričkim statističkim nizovima.

5.1 Mjere asimetrije

Mjerama asimetrije je moguće utvrditi na koji način su članovi numeričkog niza


raspoređeni oko neke dominantne vrijednosti.Ta istaknuta vrijednost je najčešće neka od
srednjih vrijednosti.Prema obuhvatu statističkog skupa mogu biti potpune i
nepotpune.Raspoređivanje pojedinih statističkih jedinica u odnosu na neku od srednjih
vrijednosti može biti simetrično i asimetrično.Simetričan raspored karakterizira činjenica
da je aritmetička sredina numeričkog obilježja ujedno i najčešće zastupljena vrijednost
koja,k tome,uređeni numerički niz dijeli na dva jednaka dijela (tj. x̄ = Mo = Me ).Ova
„harmonija“ mjera centralne tendencije je narušena kod asimetričnih distribucija.Ako
podaci sadrže jedan ili više ekstremnih vrijednosti (bilo ekstremno velikih ili ekstremno
malih) distribucija je asimetrična.Nazočnost ekstremno velikih podataka dovodi do
pozitivne asimetrije ( aritmetička sredina je veća od medijana,a medijan premašuje
modalnu vrijednost).Nekoliko ekstremno malih podataka uzrokuje negativnu asimetriju
( mod je sada veći od medijana koji premašuje aritmetičku sredinu).Pearsonova i
Bowleyeva mjera asimetrije su nepotpune standardizirane mjere koje se temelje na odnosu
srednjih ili srednjih i položajnih vrijednosti.Na njihovu vrijednost nema utjecaja velik dio
populacije što im uvelike ugrožava vjerodostojnost.Takove nedostatke se može ukloniti
sveobuhvatom statističkog skupa što je odlika potpunih mjera asimetrije.One
omogućavaju uvid u način raspoređivanja svake od statističkih jedinica u odnosu na neku
od srednjih vrijednosti.Najčešće je to aritmetička sredina.U MS Excel-u postoji gotova
funkcija za Pearsonov koeficijent asimetrije.Riječ je o potpunoj,standardiziranoj
mjeri.Označava se sa α ili α 3 ,a računa po formuli
n
n x i − x̄ 3
∑ ( )
α 3 = ( n−1)(n−2) i=1 σ .

Poprima vrijednosti iz segmenta [ −2 ,2 ] .U slučajevima izrazito asimetričnih distribucija


može „probiti“ granice intervala.Za simetričnu razdiobu je jednak nuli.U MS Excel-u se
računa pomoću funkcije
=SKEW(raspon podataka)

5.2 Mjere zaobljenosti

Brojčani iskaz zaobljenosti okoline modalnog vrha krivulje distribucije frekvencija je


mjera zaobljenosti.Rijetko se koristi.Obično se označava sa α 4 .Uspoređuje se i mjeri
prema zaobljenosti vrha normalne distribucije,jedne od najvažnijih teorijskih razdioba
kontinuirane slučajne varijable.Za tu razdiobu ima vrijednost 3.Ako je koeficijent
zaobljenosti veći od 3,tada pripadna distribucija ima „šiljast“ vrh.U protivnom,ako je
manji od 3 krivulja promatrane distribucije je „plosnatija“.U MS Excel-u se koristi gotova
funkcija za njegov izračun
=KURT(raspon podataka)
Primjer 5.1

78
Za podatke iz primjera 4.2 izračunajte mjere zaobljenosti i asimetrije i obrazložite
dobivene vrijednosti.
Mjesečna izdvajanja za Mjesečna izdvajanja za
kulturu sport
Asimetrija 0,20 0,96
Zaobljenos
t -0,87 0,43

6. Korelacijska i regresijska analiza


Do sada smo se bavili statističkom obradom jedne pojave predočene jednim statističkim
nizom ne vodeći pri tome računa o,eventualnoj,povezanosti te pojave s zbivanjima oko
nje.Međutim,događanja u prirodi i društvu se isprepliću.Promjena jedne od njih uzrokuje
promjenu druge,odnosno drugih,s njom povezanih,pojava.Za vezu dviju pojava kažemo da
je funkcionalna (ili deterministička) ako se da izraziti odnosom „uzrok-
posljedica“.Pravilnost, zakonitost uzajamnih promjena,se veoma često može analitički
iskazati formulom koja omogućava izračun jedne od kvantitativnih varijabli (funkcije ili
„posljedice“) za danu vrijednost druge (nezavisne varijable ili „uzroka“).Primjer takovih
veza možemo naći među formulama za izračun površina pravilnih geometrijskih
likova.Većini pojava kojima se bavi statistika,nije svojstvena takova veza.Te,od
funkcionalnih znatno slabije veze,zovu se
statističke ili stohastičke veze.Korelacijska analiza je dio statistike koji ima za cilj istražiti
moguću vezu i utvrditi stupanj povezanosti dviju ili više varijabli.Ako je postojeća veza
dovoljno jaka,tada se statistička obrada nastavlja iznalaženjem analitičkog zapisa ili
algebarskog modela koji će vezu opisati na najbolji mogući način.A upravo to je osnovni
zadatak regresijske analize.Opći oblik regresijskog modela je

Y = f ( x1,x2,…..,xk ) + u

Pri čemu je Y zavisna varijabla (regresand) koja se mijenja u ovisnosti o nezavisnim


varijablama x1,x2,….,xk (regresorske varijable).Kako veza između regresorskih varijabli i
regresanda nije deterministička,model sadrži i varijablu u koja predstavlja nepoznato
odstupanje od funkcionalnog odnosa.
Izbor varijabli u modelu,određivanje njihovog statusa i oblika funkcionalnog dijela
modela f (x1,x2,..,xk) proizlazi iz kvalitativne analize .Model koji sadrži zavisnu i jednu
nezavisnu varijablu,naziva se model jednostavne regresije.Model sa zavisnom i dvije ili
više nezavisnih varijabli je model višestruke regresije.
Korelacijska i regresijska analiza su čvrsto vezane.Uobičajeno je početi sa izračunom
koeficijenta korelacije,a zatim nastaviti sa analizom regresijskog
modela.Međutim,ponekad se najprije odabere regresijski model,a zatim nastavi s
korelacijskom analizom.

6.1 Korelacijska analiza

Veze svojstvene masovnim pojavama,istraživanjem kojih se bavi statistika,su znatno


slabije od funkcionalnih kojima je svojstven strogi determinizam.Stoga je nužno izmjeriti
stupanj povezanosti (korelaciju) između njih.Mjerenje stupnja jakosti statističkih veza se
provodi metodama korelacijske analize kao što su grafički prikaz kovarijance varijabli
(dijagram rasipanja) i izračunom odgovarajućeg brojčanog pokazatelja jakosti i smjera
veze (koeficijent korelacije).U slučaju kada istražujemo vezu između dvije veličine Xi Y

79
(nezavisne i zavisne),dijagram rasipanja je ravninski grafički prikaz danih
podataka.Točnije,dijagram rasipanja je skup od N točaka (xi,yi) ( tj N uređenih parova
(xi,yi),i = 1,2,..,N).Način na koji su te točke raspoređene sugerira tip moguće veze između
promatranih veličina.Slutnje koje se tako rode,mogu se potvrditi ili odbaciti u ovisnosti o
vrijednosti koeficijenta korelacije.Ako raspored točaka nalikuje na zamišljeni
pravac,očekivana veza između varijabli je linearna.Pretpostavka se provjerava pomoću
koeficijenta jednostavne linearne korelacije.Njegova svojstva su,uglavnom,očuvana i u
slučajevima drugih oblika korelacije.Može poprimiti vrijednosti iz segmenta [ −1,1 ]
.Pozitivne vrijednosti koeficijenta korelacije su znak upravo proporcionalnog odnosa
između varijabli ( tj.porast jedne je praćen porastom druge,odnosno ako X pada,tada
pada i Y),dok negativne vrijednosti prati obrnuto proporcionalni odnos (rast jedne prati
smanjenje druge,i obratno).Jačina veze je upravo proporcionalna apsolutnoj vrijednosti
koeficijenta korelacije.Ako je |r| blizu nuli,veza je slaba ili je uopće nema (r = 0).Ako je |r|
= 1 veza je uzročno-posljedična (funkcionalna).

Apsolutna vrijednost Tumačenje


koeficijenta korelacije
|r|
0 odsutnost korelacije
0,00 - 0,50 slaba korelacija
0,50 - 0,80 srednje jaka korelacija
0,80 - 1 čvrsta korelacija
1 potpuna korelacija

Tumačenje dobivenih vrijednosti koeficijenta korelacije treba obavljati s dozom opreza.To


se posebno odnosi na ekstremne vrijednosti koeficijenta korelacije.Naime,veoma mala
vrijednost koeficijenta ne mora nužno značiti slabu korelaciju.To se može zbiti i u
slučajevima kada se koeficijentom linearne korelacije mjeri jakost nelinearnih
veza.Analogno,velike vrijednosti koeficijenta korelacije ne moraju,nužno,biti znak
funkcionalnih veza.Mogu značiti lažnu korelaciju.Da bi se izbjegle ove situacije
preporuča se tumačenje koeficijenta korelacije usporedno s koeficijentom determinacije.O
tome će biti riječ poslije.

6.1.1 Pearsonov koeficijent linearne korelacije

Među brojčanim pokazateljima stupnja povezanosti varijabli koje su u linearnom


odnosu,najčešće se koristi Pearsonov koeficijent linearne korelacije.
N
∑ x i y i−N⋅x̄⋅ȳ
i=1
N N
( ∑ x 2i −N⋅x̄ 2 )( ∑ y 2i −N⋅ȳ 2 )
r = i =1 i=1

U MS Excel-u ga možemo računati na više načina,Neke od njih ćemo pokazati na


slijedećem primjeru.
Primjer 6.1
Treba ispitati stupanj korelacije između visine i troškova prijevoza studenata Splitskog
sveučilišta sa stalnim boravkom izvan Splita.Podaci su dani slijedećom tablicom:

Tablica 6.1

80
Redni Visina Troškovi prijevoza Redni Visina Troškovi prijevoza
broj ( u cm ) ( u kn ) broj ( u cm ) ( u kn )
1 184 1200 11 173 900
2 192 260 12 178 350
3 178 580 13 188 420
4 185 830 14 182 860
5 180 280 15 178 900
6 170 360 16 185 280
7 190 900 17 180 400
8 195 290 18 183 320
9 177 1200 19 176 280
10 188 1200 20 193 1500

Rješenje:
Podatke ćemo unijeti na uobičajeni način u prva tri stupca novog radnog lista.Prve ćelije
svakog od njih ćemo zadržati za odgovarajuće naslove.Znači,u stupcu A ćemo smjestiti
redne brojeve,u stupcu B podatke o visini ispitanika,a u stupcu C podatke vezane za
troškove prijevoza.

a) Jedan od načina za izračun traženog koeficijenta je slijedeći:


U neku praznu ćeliju ( neka to bude A25 ) upišemo
=CORREL(B2:B21;C2:C21)
Enter.Umjesto,ove naredbe smo mogli upotrijebiti i ovu
=PEARSON(B2:B21;C2:C21)
Dobili smo broj r = 0,13811.Dakle,koeficijent korelacije je u očekivanim granicama
jer ne bi bilo baš realno očekivati neku respektabilnu vezu između visine ispitanika i
njihovih izdvajanja za prijevoz.
b) Na padajućem izborniku Tools,u okviru Data Analysis,biramo Correlation.Otvorit će
se novi dijaloški okvir u kojem interveniramo na sličan način kao kod Histograma.Što
znači da i ovde imamo Input Range u čiji otvor ćemo unijeti raspon naših podataka
B1:C21.Posve analogno možemo,ako to želimo,obuhvatiti i ćelije sa naslovima uz
odgovarajuće „upzorenje“ (kvačica u otvor uz Labels in first row) Kako su naši podaci
smješteni u stupcima,to ćemo i naznačiti u izborniku Grouped By.Mjesto na kojem želimo
izlaznu tablicu,odabrat ćemo u donjem dijelu dijaloškog okvira.Mjesta ima dovoljno na
postojećem radnom listu i neka izlazna tablica počinje u ćeliji E5.OK.

Tablica 6.2
Troškovi
Visina prijevoz
( u cm ) a
( u kn )
Visina
( u cm ) 1
Troškovi
prijevoza 0,13811336
( u kn ) 6 1

Dobivena korelacijska tablica će uvijek imati jedinice na glavnoj dijagonali.Naime,na tim


mjestima su brojčani pokazatelji „autokorelacije“.A,van svake sumnje,varijable su u
„idiličnim“ odnosima sa samim sobom.Prednost ovog načina računanja koeficijenta

81
korelacije je u tome što je moguće istovremeno procijeniti jačinu veze između većeg broja
varijabli za razliku od prethodnog koji se odnosio isključivo na dvije varijable.
c) Zajednička osobina,preciznije zajednički nedostatak,već navedenih načina određivanja
koeficijenta korelacije jest potpuno ignoriranje veličine uzorka za koji se
računa.Posljedica toga je činjenica da,za tako određen koeficijent korelacije,nismo u
stanju procijeniti koliko je on statistički značajan.Naime,ta činjenica bitno ovisi i o
veličini uzorka što je vidljivo iz formule koja tome služi

t = √ N −2
1−r 2
N je broj parova varijabli X i Y.U praksi se značajnost koeficijenta korelacije procjenjuje
na razini značajnosti od 1% i (ili) 5% .U MS Excel-u se ta procjena provodi proširenjem
već poznatog slijeda koraka Tools/Data Analysis i onda Regression.OK.U gornjem dijelu
dobivenog prozora,u okvir Input Y Range unosimo raspon podataka zavisne varijable
(C1:C21),a u Input X Range,analogno,adrese bloka sa podacima nezavisne varijable
(B1:B21).Zbog obuhvata zaglavnih ćelija,klik na prozorčić uz Labels.Kao i u prethodnom
slučaju,u donjem dijelu otvorenog prozora,u Output options navedemo odluku o mjestu na
kojem želimo izlaznu tablicu (E15).OK.

Tablica 6.3

SUMMARY OUTPUT

Regression Statistics
0,1381133
Multiple R 7
R Square 0,0190753
-
Adjusted R 0,0354205
Square 1
403,31661
Standard Error 3
Observations 20

ANOVA
Significance
df SS MS F F
56937,7735 56937, 0,3500 0,56145255
Regression 1 2 8 3 3
2927957,22
Residual 18 6 162664
Total 19 2984895

Coefficient Standard Upper Lower


s Error t Stat P-value Lower 95% 95% 95,0% Upper 95,0%
- -
804,70531 2486,62143 0,3236 0,7499 4419,49 -
Intercept 4 5 1 6 -6028,90308 2 6028,9031 4419,492456

Visina 8,0448991 13,5977318 0,5916 0,5614 36,6126 -


( u cm ) 2 9 4 5 -20,5228755 7 20,522875 36,61267369

Pearsonov koeficijent korelacije očitat ćemo iz dijela tablice nazvanog Multiple


R.Međutim,vrijednosti iz te „rubrike“ su uvijek pozitivne pa ćemo predznak koeficijenta
(koji,kao što smo vidjeli,ne mora biti pozitivan) odrediti pomoću predznaka koeficijenta

82
smjera regresijskog pravca.Značajnost koeficijenta korelacije možemo očitati na dva
mjesta u ovoj tablici:Significante F i P-value za X varijablu.U oba slučaja iznosi 0,561453
što daleko premašuje 0,05 (5%) te zaključujemo da između naših varijabli ne postoji
statistički značajna veza .Provjera značajnosti koeficijenta korelacije je neizostavan dio
ozbiljne korelacijske analize.Veći uzorak uz manju vrijednost koeficijenta korelacije može
rezultirati jednakom značajnošću kao i osjetno veće vrijednosti koeficijenta korelacije
izračunatog na znatno manjem uzorku.Zbog toga,rezultati analize provedene na osnovu
vrijednosti koeficijenta korelacije izračunatog na malom uzorku,su,blago rečeno,upitni.

6.1.2 Spearmanov koeficijent korelacije ranga

Koristi se za određivanje jakosti veze između dvije varijable od kojih je,barem


jedna,redoslijedna.Označava se sa rs i računa pomoću relacije
N
6⋅∑ d 2i
i =1
3
rs = 1 - N −N

gdje je di = R(Xi) – R(Yi),i = 1,2,¿⋅¿ , N razlika rangova odgovarajućeg para vrijednosti


varijabli X i Y;N je broj tih parova.U MS Excel-u ne postoji funkcija za direktan izračun
Spearmanovog koeficijenta korelacije ranga te se snalazimo,kao i do sada u sličnim
situacijama,“prijevodom“ gornje relacije u odgovarajuće naredbe iz „riznice“ ovog
programskog paketa.
Primjer 6.2
Na natjecanju proizvođača maslinova ulja podaci o osvojenom mjestu i količini
proizvedenog ulja za 30 učesnika,dani su slijedećom tablicom:
Tablica 6.4

Količina Količina
Redni broj Osvojeno Redni broj Osvojeno
proizvedenog ulja proizvedenog ulja
natjecatelja mjesto natjecatelja mjesto
( u litrama ) ( u litrama )
1 5 560 16 33 250
2 7 320 17 39 490
3 1 150 18 45 565
4 13 980 19 6 790
5 2 410 20 11 940
6 19 380 21 22 610
7 20 180 22 35 840
8 31 715 23 40 410
9 48 890 24 41 375
10 21 400 25 9 245
11 17 317 26 10 168
12 8 290 27 18 173
13 53 800 28 11 575
14 14 750 29 24 770
15 27 330 30 37 425

Izračunajte Spearmanov koeficijent korelacije ranga i objasnite njegovo značenje.


Rješenje:
Podatke ćemo unijeti na uobičajeni način na novi radni list.Prve ćelije u svakom od
stupaca ćemo zadržati za naslove.Osvojeno mjesto će nam bit X varijabla čije podatke
smještamo u stupac B.U Stupac C ćemo smjestiti podatke za Y varijablu (Količina

83
proizvedenog ulja).Počinjemo sa izračunom ranga svake od varijabli.,točnije,u stupcu D
ćemo to napraviti za X varijablu,a u stupcu E za Y varijablu.Pripadne naslove Rang X i
Rang Y ćemo upisati u ćelije D1 i E1.Rangove određujemo pomoću funkcije
=RANG(traženi broj;raspon podataka;način rangiranja)
Što se tiče zadnje „stavke“ u ovoj funkciji (način rangiranja),možemo birati rangiranje u
padajućem ili rastućem nizu.Ako se odlučimo za padajući niz,tada ćemo za mačin
rangiranja pisati 0 ili ćemo ostaviti prazno.U protivnom,želimo li rangirati podatke u
rastućem nizu,tada ćemo na mjesto načina rangiranja upisati ma koji prirodni broj (1,2,3,
….)Izbor je naš.Jedino moramo voditi računa o tome da kada smo odabrali način
rangiranja za jednu od varijabli,tada i drugu moramo rangirati na isti način.Stoga,u ćeliju
D2 upisujemo =RANK(B2;$B$2:$B$31;1).Raspon podataka mora biti naveden
apsolutnim adresama zato
jer mjesto na rangiranoj skali proizlazi iz neprestanog uspoređivanja sa svim,uvijek istim,
vrijednostima promatrane varijable. Odabrali smo razvrstavanje u rastući niz jer je logično
najbolje plasiranom natjecatelju pridijeliti prvo mjesto ( rang 1).Nakon toga,vrijednosti
ranga za preostale vrijednosti varijable X dobijemo kopiranjem sadržaja ćelije D2 u blok
ćelija D3:D31.Analogno ćemo postupiti i sa varijablom Y.U E2 upišemo
=RANK(C2;$C$2:$C$31;1) i kopiranje ovog sadržaja u blok E3:E31.Sada možemo
izračunati razlike rangova naših varijabli u stupcu F.U F1 naslov di ,a u F2 upisujemo
recept za rutinu =D2 – E2.Enter i kopiranje sadržaja ćelije F2 u naredne ćelije stupca F
do,zaključno F31.Ustvari,mi trebamo sumu kvadrata upravo izračunatih razlika,te u G1
2
smještamo naslov di ,a u G2 upisujemo =F2^2 te kopiramo taj sadržaj u preostale ćelije
istog stupca do,zaključno,F31.I,konačno,zbroj upravo dobivenih vrijednosti u G32,a u
G35 traženi Spearmanov koeficijent korelacije ranga dobijemo pomoću =1-
6*G32/(30^2-30) .
Iznosi 0,284093 što znači da između osvojenog mjesta i količine proizvedenog ulja postoji
veoma slaba pozitivna (proporcionalna) veza.

84
Tablica 6.5
Količina
Redni broj Osvojeno proizvedenog
Rang X Rang Y di di^2
natjecatelja mjesto ulja
( u litrama )
1 5 560 3 18 -15 225
2 7 320 5 9 -4 16
3 1 150 1 1 0 0
4 13 980 11 30 -19 361
5 2 410 2 14 -12 144
6 19 380 15 12 3 9
7 20 180 16 4 12 144
8 31 715 21 22 -1 1
9 48 890 29 28 1 1
10 21 400 17 13 4 16
11 17 317 13 8 5 25
12 8 290 6 7 -1 1
13 53 800 30 26 4 16
14 14 750 12 23 -11 121
15 27 330 20 10 10 100
16 33 250 22 6 16 256
17 39 490 25 17 8 64
18 45 565 28 19 9 81
19 6 790 4 25 -21 441
20 11 940 9 29 -20 400
21 22 610 18 21 -3 9
22 35 840 23 27 -4 16
23 40 410 26 14 12 144
24 41 375 27 11 16 256
25 9 245 7 5 2 4
26 10 168 8 2 6 36
27 18 173 14 3 11 121
28 11 575 9 20 -11 121
29 24 770 19 24 -5 25
30 37 425 24 16 8 64
0 3218

Zbroj razlika rangova mora biti jednak nuli.Pomoću tog podatka možemo provjeriti da li
smo dobro odredili rangove.Ponekad se dogodi odstupanje od očekivane vrijednosti zbroja
rangova.To može biti posljedica poteškoća koje MS Excel ima sa tzv.vezanim rangovima
koji se javljaju u slučaju kada nekoliko članova niza imaju istu vrijednost.Znači,morali bi
„dijeliti isto mjesto“.Ako je to,na primjer,drugo,treće i četvrto mjesto,MS Excel će svima
dati vrijednost ranga 2 što ne odgovara pravoj vrijednosti ovih vezanih
rangova.Naime,ona je ustvari njihova aritmetička sredina (2 + 3 + 4)/3 = 3.Vrijednost
Spearmanovog koeficijenta korelacije ranga ne smije ovisiti o načinu rangiranja
varijabli,a,upravo se to zbude,kod rješavanju problema vezanih rangova na način kako to
radi MS Excel.

6.2 Regresijska analiza

85
Osnovni zadatak regresijske analize jest izgradnja statističkog modela koji će opisati vezu
između regresorskih i regresand varijabli,a,k tomu,će moći poslužiti u svrhu
predviđanja,odnosno prognoziranja.Promatrat ćemo samo neke tipove jednostavnih
regresijskih modela.Opći oblik takovog modela je
Y = f(x) + u
odnosno Y = Y^ + u
Odabir tipa regresijskog modela znači izbor vrste funkcije f ( X ) koja predočuje vezu
između parova vrijednosti varijabli X i Y uz minimalna odstupanja od funkcionalnog
odnosa.

6.2.1 Model jednostavne linearne regresije

Oblik dijagrama rasipanja sigurno utječe na odabir regresijskog modela.Zapravo,inicijalne


odluke se i donose upravo na osnovu tog grafičkog prikaza zadanih uređenih parova
vrijednosti promatranih varijabli.Ako distribucija tih točaka podsjeća na pravac,opravdano
je vezu između promatranih varijabli opisati,optimalno odabranim,pravcem.Odlučimo li
se na eksplicitni oblik jednadžbe pravca,dobit ćemo model jednostavne linearne regresije
yi = a + b xi + ui i = 1,2,…….N
Vrijednosti parametara a i b ćemo odrediti iz uvjeta da optimalni pravac mora biti najviše
moguće bliz svakoj od točaka dijagrama rasipanja.Bit će to onaj pravac za kojeg su
odstupanja pravih vrijednosti yi od pripadnih,pravcem ocijenjenih vrijednosti ^y i,
minimalna.
Međutim,odstupanja mogu biti pozitivna ili negativna,ovisno o tome da li su točke
dijagrama rasipanja iznad ili ispod regresijskog pravca,Zapravo,njihova suma je nula te ne
može
poslužiti za formiranje odredbenog sustava jednadžbi potrebnog za izračun traženih
parametara a i b.Problem ćemo riješiti tako da umjesto njih promatramo kvadrate tih
rezidualnih odstupanja.
N N N
∑ u 2i = ∑ ( y i− ^yi )
2
∑ [ y i−(a+bx i) ]2
i=1 i=1 = i=1 = f(a,b)
Vrijednosti parametara a i b tj. one za koje funkcija f(a,b) postiže minimum,su parametri
optimalnog pravca.“Potraga“ za tim ekstremom nas dovodi do sustava od dvije jednadžbe
sa dvije nepoznanice.Rješenje sustava je traženi par parametara
n
∑ x i y i −N x̄ ȳ
i=1
N
∑ x 2i −N x̄ 2
b = i=1
a = Ȳ - b X̄
N N
∑ xi ∑ yi
X̄ = i=1 = i =1
gdje je N a Ȳ N .
a - ordinata točke u kojoj pravac siječe os ordinata je očekivana vrijednost zavisne
varijable (Y) kada je vrijednost nezavisne varijable (X) jednaka nuli (u nekim slučajevima
ova
interpretacija je neprimjerena prirodi varijabli).
b - koeficijent smjera pravca (računa se iz priklonog kuta pravca sa osi apscisa)

86
Pozitivna vrijednost koeficijenta je svojstvena upravo proporcionalnom odnosu varijabli X
i Y,a negativni predznak koeficijenta smjera znači da su varijable X i Y u obrnuto
proporcionalnom odnosu.Za regresijski pravac b znači očekivanu prosječnu promjenu
zavisne varijable (Y) kada se nezavisna varijabla (X) poveća za jedinicu (mjerenja).
Parametre regresijskog pravca možemo odrediti na nekoliko načina u MS Excel-u.
Primjer 6.3
Dani su podaci o broju stanovnika i broju ugostiteljskih objekata za 20 gradova.Nađite
jednadžbu modela linearne regresije za dane podatke.Objasnite značenje dobivenih
parametara.Podatke prikažite dijagramom rasipanja.
Tablica 6.6

Redni Broj stanovnika Broj ugostiteljskih Redni Broj stanovnika Broj ugostiteljskih
broj ( 000 ) objekata broj ( 000 ) objekata
1 50,48 60 11 440,12 500
2 37,22 41 12 370,45 400
3 100,13 105 13 520,75 600
4 220,48 240 14 630,42 700
5 500,6 590 15 270,45 300
6 310,44 320 16 814,67 900
7 290,48 300 17 730,28 750
8 180,85 200 18 700,48 700
9 65,44 70 19 73,49 68
10 95,88 100 20 44,82 52

Prije no što unesemo podatke na način kako to inače radimo,moramo utvrditi koja je od
danih varijabli nezavisna (X),a koja je zavisna (Y).Kako je prirodna pretpostavka da broj
otvorenih ugostiteljskih objekata ovisi o broju stanovnika,to ćemo broj stanovnika
proglasiti nezavisnom varijablom X,a broj ugostiteljskih objekata će nam biti zavisna
varijabla
Y.U ovom slučaju nemamo dilema oko odabira tipa regresijskog modela (traži se
linearni).Isto tako,moramo podatke i grafički predočiti dijagramom rasipanja,pa ćemo
početi od njega,jer on i inače igra ključnu ulogu u inicijalnim odlukama o jačini i tipu veze
između promatranih varijabli.Počinjemo kao i kod svakog drugog grafičkog prikaza
označavanjem podataka koje moramo predočiti grafikonom (B2:C21) i
pokretanjem„crtača“Chard Wizard.Od,nama znane ponude,sada ćemo se odlučiti za XY
(Scatter) ,njegov prvi podtip.Nastavak se ni u čemu ne razlikuje od ma kojeg grafikona :
naslov (Dijagram rasipanja),sadržaji osi (X-Broj stanovnika;Y-Broj ugostiteljskih
objekata).

87
Dijagram rasipanja

1000
Broj ugostiteljskih 900
800
700
objekata
600
500
400
300
200
100
0
0 200 400 600 800 1000

Broj stanovnika (000)

Veza između naših varijabli nije funkcionalna,ali nešto manje deterministička,veza


postoji.Za dijagram rasipanja se ne može kazati da je grafikon linearne funkcije,ali isto
tako je očito da je moguće provući pravac u bliskom susjedstvu naših točaka.Veza koju
naslućujemo je prilično jaka i proporcionalna.Riječ je,naravno,o okvirnoj
procjeni.Jednadžbu samog modela možemo odrediti na više načina.Jedan od njih je
pomoću odgovarajućih funkcija za izračun parametar traženog modela.To su:
za koeficijent smjera b
=SLOPE(raspon varijable Y;raspon varijable X)
za određivanje a (odrezak na osi Y)
=INTERCEPT(raspon varijable Y;raspon varijable X)
U našem slučaju će biti:
=SLOPE(C2:C21;B2:B21)
odnosno =INTERCEPT(C2:C21;B2:B21)
Jednadžba modela linearne regresije glasi
Y^ =1,0752 X + 1,8847
Želimo li i dodatne informacije o traženom regresijskom modelu,njegovu jednadžbu ćemo
potražiti pomoću procedure Regression koju ćemo naći na padajućem izborniku Data
Analysis .U gornjem dijelu dobivenog dijaloškog okvira upisujemo,u odgovarajući
prozorčić,raspon zavisne varijable Y (C1:C21) i raspon nezavisne varijable X
(B1:B21).Zbog obuhvata ćelija sa naslovima,kliknut ćemo na otvor uz Labels.U donjem
dijelu dijaloškog okvira odabrat ćemo mjesto na kojem želimo izlaznu tablicu (B30).OK.

88
Tablica 6.6

SUMMARY OUTPUT

Regression Statistics
0,99632633
Multiple R 1
0,99266615
R Square 8
Adjusted R 0,99225872
Square 3
24,2382959
Standard Error 3
Observations 20

ANOVA
Significance
df SS MS F F
2436,37531 1,14208E-
Regression 1 1431358,29 1431358,29 5 20
587,494989
Residual 18 10574,90981 6
Total 19 1441933,2

Standard Upper Lower Upper


Coefficients Error t Stat P-value Lower 95% 95% 95,0% 95,0%
- -
1,88467837 0,21196617 0,83451507 16,7954829 20,5648 16,79548 20,5648
Intercept 4 8,89141101 4 5 6 4 3 4
SUMMARY OUTPUT

Prepoznajemo tražene koeficijente u dijelu tablice Coefficients .Tablica sadrži puno više
podataka od onih koje ,za sada,trebamo.Izdvojit ćemo podatak o značajnosti (Significace
F i /ili P-value) statističke veze između naših varijabli.Broj koji smo dobili (1,14 E-20) je
puno,puno manji od 0,05 što znači da među našim varijablama postoji statistički značajna
veza.
Najjednostavniji način iznalaženja jednadžbe regresijskog modela je neposredno iz
dijagrama rasipanja.Graf označimo klikom na njegovu pozadinu.Na vrpci izbornika se
dogodi preobrazba Data u Chart.Klikom na njega,dobivamo padajući izbornik u kojem
biramo Add Trendline.

Tako dobivamo dijaloški okvir sa ponudom regresijskih modela.Trebamo linearni.

89
Međutim,ponuda ovog dijaloškog okvira je nešto bogatija.Ona nudi i neke druge
mogućnosti na svojoj drugoj kartici Options.Okoristiti ćemo se njome kako bi dobili
jednadžbu modela na grafikonu (Display equation on chart) i brojčani pokazatelj njegove
uspješnosti R2 (Display R-squared).

90
Lakoća kojom se dobije traženi regresijski model na ovaj način je razlog što se on i
najčešće koristi.I na kraju ,ostaje nam obrazložiti značenje dobivenih parametara.
Parametar a =1,88 47 znači očekivani broj ugostiteljskih objekata u „mrtvom“gradu tj.u
gradu sa X = 0 stanovnika se mogu očekivati približno dva ugostiteljska objekta (to je
jedna od onih ne baš smislenih situacija o kojima smo govorili).
Parametar b = 1,0752 znači očekivanu promjenu (ovdje je to povećanje) broja
ugostiteljskih objekata u slučaju jedinične promjene nezavisne varijable tj,na svakih novih
1000 (jer je jedinica mjere 1000) stanovnika može se očekivati približno jedan novi
ugostiteljski objekt.
Osnovni zadatak regresijske analize je prognoza.Model je i izgrađen upravo zato da bi što
bolje opisao vezu između promatranih veličina te,što je moguće uspješnije,predvidio kako
će ta veza funkcionirati za neku vrijednost (jedne od varijabli) koja nije među
navedenima.

Primjer 6.3.1
Uz podatke iz prethodnog primjera,treba prognozirati,pomoću linearnog regresijskog
modela,broj ugostiteljskih objekata u gradu sa 80000 stanovnika.
X = 80 (000)
Y = 1.0792 * 80 + 1,8847
U gradu sa 80000 stanovnika očekuje se 88 ( preciznije 88,2207) ugostiteljskih objekata.

Odstupanje zadanih vrijednosti od procijenjenih modelom,se mjeri na isti način kao i kod
disperzije statističkih jedinica oko aritmetičke sredine.Te mjere su ujedno i pokazatelji
uspješnosti modela.Mogu biti apsolutne (varijanca,standardna devijacija) ili relativne
(koeficijent varijacije i koeficijent determinacije) mjere disperzije.
Varijanca

91
N
∑ ( y i− ^yi )2
σ^ 2^y = i=1
N −2
Je prosječno kvadratno odstupanje empirijskih vrijednosti od pripadnih
regresijskih.Standardna devijacija
σ^ y (ili standardna greška ocjene) je drugi korijen iz
varijance


N
∑ ( y i− ^y i )2
i=1
σ^ y = N−2

Matematički neispravno,za standardnu grešku se kaže da predstavlja prosječno odstupanje


empirijskih od regresijskih vrijednosti.
Koeficijent varijacije
σ^
V^ ^y= ^y⋅100

Predstavlja,u postocima iskazan,udio standardne devijacije,(pogreške) u odnosu na
aritmetičku sredinu regresanda.
Koeficijent determinacije
N
∑ ( ^y i−Ȳ )2
2
= i=1
N
∑ ( yi − ȳ )2
R i =1
je omjer sume kvadrata odstupanja protumačenih regresijom i sume kvadrata ukupnih
odstupanja.Spomenute veličine su vezane za raščlambu odstupanja zavisne varijable od
njene aritmetičke sredine na odstupanja protumačiva modelom i neprotumačiva
odstupanja.
^y
yi - Ȳ = ( i - Ȳ ) + (yi - i )
^y
Zbroj,ovako računatih,odstupanja za sve raspoložive parove (xi,yi) i = 1,2,….,N će biti
jednak nuli,pa zato ne može poslužiti kao osnova nekih novih obavijesti vezanih uz
uspješnost modela.Zbog toga,umjesto ove jednadžbe,kao ishodišnu relaciju za analizu
varijance,
koristimo
N N N
∑ ∑ ^y 2 ∑ ^y
(yi - Ȳ ) = i=1 ( i - Ȳ ) + i=1 (yi - i )
2 2
i=1
Podijelimo li ovu jednadžbu sa sumom na lijevoj strani,dobit ćemo
N N
∑ ( ^y i −Ȳ )2 ∑ ( y i − ^y i )2
i=1
N
+ i=1
N
∑ ( y i −Ȳ )2 ∑ ( y i −Ȳ )2
i=1 =1
i =1

Prvi pribrojnik na lijevoj strani je koeficijent determinacije,a drugi pribrojnik je kvadrat


koeficijenta alijenacije.Koeficijent determinacije možemo izračunati na nekoliko
načina.Ako parametre linearnog modela jednostavne regresije računamo pomoću

92
odgovarajućih funkcija,tada ćemo i koeficijent determinacije odrediti pomoću njemu
namijenjene funkcije
=RSQ(raspon varijable Y; raspon varijable X)
2
Ako pak parametre linearnog modela tražimo uz pomoć rutine Regression,tada ćemo R
dobiti u izlaznoj tablici.Treći način nam omogućava izračun, i prikaz na
2
grafu,koeficijenta determinacije (Display R-squared value on chart).Sama oznaka R
sugerira nenegativnost koeficijenta determinacije,dok sastav razlomka koji ga
definira,ukazuje na njegove ekstremne vrijednosti (0 i 1).Model je to reprezentativniji što
mu je vrijednost koeficijenta determinacije bliža jedinici (to znači da protumačena
odstupanja iz brojnika neznatno zaostaju za ukupnim odstupanjima iz nazivnika).
Ponekad regresijska analiza prethodi korelacijskoj.Tada se koeficijent korelacije računa iz
relacije
r 2 = R2
odnosno r =± R √ 2

Predznak se odredi u suglasju sa koeficijentom smjera regresijskog pravca.Preciznije,on je


predznaku koeficijenta smjera.Ova dilema oko odabira predznaka svojstvena je isključivo
linearnom regresijskom modelu.Kako veličina uzorka značajno utječe na reprezentativnost
modela,prirodno je da ta činjenica ima udjela u „poboljšanoj“ varijanti koeficijenta
determinacije
N−1
R̄2 =1− (1−R 2 )
N−2
Vrijednost ovog korigiranog koeficijenta determinacije nikad ne premašuje „stari“
koeficijent determinacije.U slučaju izuzetno slabih veza može probiti donju granicu i
poprimiti negativne vrijednosti.

6.2.2 Nelinearni regresijski modeli

Većina pojava se ne mogu opisati linearnim regresijskim modelom.Takove pojave ćemo


predočiti nelinearnim regresijskim modelima.Jedan od problema na koje nailazimo je
interpretacija parametara,a ona u mnogome ovisi o tome da li je upotrijebljeni model pravi
nelinearni model ili nepravi nelinearni.Mi ćemo koristiti neprave linearne
modele.Dopustivom transformacijom svaki takav model se može linearizirati te,nakon
toga,podvrći rutini svojstvenoj linearnom modelu.Prave nelinearne modele nije moguće
linearizirati.

6.2.2.1 Model jednostavne eksponencijalne regresije

Definira se na slijedeći način


Y = a bxu a,b > 0
Linearizaciju provodimo logaritmiranjem
log Y = log a + X log b + log u
U dobivenom linearnom modelu zavisna varijabla je nazočna u obliku logaritma.Ocjena
parametara se provodi na uobičajeni način.Značenje je slijedeće:
a - očekivana vrijednost zavisne varijable kada je nezavisna varijabla jednaka nuli
b - očekivana prosječna relativna promjena zavisne varijable pri jediničnoj promjeni
nezavisne varijable

93
Promjena zavisne varijable uzrokovana povećanjem nezavisne varijable za jedinicu
(mjere) može značiti povećanje ili smanjenje u ovisnosti da li je b>1 ili b<1 (to je
x
posljedica utjecaja baze eksponencijalne funkcije b na tip monotonosti te funkcije).Zbog
toga,prikladnija je interpretacija parametra b pomoću prosječne stope promjena iskazane u
postocima.
S = (b – 1)¿ 100
Pozitivna stopa će značiti očekivano,u postocima iskazano, povećanje,a negativna stopa
smanjenje vrijednosti zavisne varijable pri jediničnom porastu nezavisne varijable.
Primjer 6.4
Zadani su podaci o broju ovisnika i broju oboljelih od Aids-a među njim,u 14 hrvatskih
gradova.Nađite jednadžbu eksponencijalnog modela regresije.Objasnite značenje
dobivenih parametara.Na temelju dobivene jednadžbe procijenite koliko se oboljelih od
Aids-a može očekivati u gradu s 10000 ovisnika.
Tablica 6.8

Redni Broj ovisnika Broj Redni Broj ovisnika Broj


broj (000) oboljelih od Aids-a broj (000) oboljelih od Aids-a
1 0,32 2 8 3,52 26
2 0,93 4 9 4,2 35
3 1,21 6 10 4,82 48
4 1,61 9 11 5,13 57
5 2,01 13 12 5,36 69
6 2,85 16 13 5,88 95
7 3,13 20 14 6,32 131

Rješenje:
Podatke ćemo unijeti u prva tri stupca novog radnog lista na način kako smo i do sada to
činili.Naslovi u zaglavnim ćelijama tih stupaca će biti (kao i inače) tumači sadržaja ćelija.
Označimo blok ćelija sa podacima B2:C15 i pokrenemo poznatu rutinu za kreiranje
dijagrama rasipanja :Chart Wizard/XY Scater-prvi podtip.Nastavak je uobičajen i
uključuje „tekstualno“ opremanje grafa,uklanjanje nepotrebne legende.

94
Jednadžbu traženog eksponencijalnog modela ćemo dobiti na najjednostavniji
način.Znači,označit ćemo dijagram rasipanja i,nakon što Chart smijeni Data na vrpci
izbornika,kliknutu na Add Trendline te odabrati eksponencijalni model,

a na kartici Option aktivirati Display equation on chart i Display R-squared value on


chart.

95
U narednom koraku ćemo dobiti

Dobili smo jednadžbu Y = 2,5925 e0,6229x .Usporedimo li je sa polaznom


jednadžbom,očigledno parametar b moramo naknadno izračunati
b = EXP (0,6229)
pa,konačno imamo jednadžbu eksponencijalnog modela
x
Y = 2,5925 ¿1,8643
a = 2,5925 i znači da se ,u gradu u kojem nema ovisnika (X=0),može očekivati 2,5925 ¿
3 oboljela od Aids-a

96
b = 1,8643 S = ( 1,8643 – 1)*100 =86,43% što znači da,ako se broj ovisnika poveća za
1(000),može se očekivati povećanje broja oboljelih od Aids-a od 86,43%
Koeficijent determinacije R2 = 0,9761 ukazuje na izrazitu reprezentativnost ovog modela.
Očekivani broj oboljelih od Aids-a,za grad sa 10(000) ovisnika) iznosi
Y = 2,5925*1,8642^10 = 1315,04 ¿ 1315

6.2.2.2 Dvostruko logaritamski model

I ovo je jedan od nepravih,linearizaciji podložnih,regresijskih modela.Opći oblik modela


je
Y^ = a xb
a - očekivana vrijednost nezavisne varijable kada je zavisna varijabla jednaka jedinici
(mjere)
b – očekivana,u postocima iskazana,promjena zavisne varijable pri 1% povećanju
nezavisne varijable
Primjer 6.5
Za podatke iz prethodnog primjera odredite jednadžbu dvostruko logaritamskog
modela.Objasnite značenje dobivenih parametar,procijenite reprezentativnost modela te
prognozirajte broj oboljelih od Aids-a za grad s 10000 ovisnika.

Rješenje:
Koristit ćemo postojeći dijagram rasipanja te,gotovo u cijelosti ,ponoviti slijed koraka iz
prethodnog slučaja s jedinom razlikom u odabiru tipa regresijskog modela.U našem
slučaju,trebamo u dijaloškom okviru Add Trendline birati Power.

Rezultat poznatog slijeda koraka je

97
a = 5,4985 ¿ 6 i znači da se u gradu sa 1(000) ovisnika može očekivati oko 6 oboljelih
od Aids-a
b = 1,3984 znači očekivano,u postocima iskazano,povećanja broja oboljelih od Aids-a u
slučaju da broj ovisnika poraste za 1%.
Koeficijent determinacije R2 = 0,9345 zaostaje za vrijednošću istog kod eksponencijalnog
modela što ima za posljedicu nešto slabiju reprezentativnost ovog regresijskog
modela.Očekivani broj oboljelih,za istu vrijednost nezavisne varijable X = 10(000),
Y = 5,5592*10^1,3341 = 137,61 ¿ 138
znatno odstupa od prognostičke vrijednosti 1315 dobivene eksponencijalnim modelom za
istu vrijednost X.

Zadaci za vježbu 4.
1. Dani su podaci o broju vozača mlađih od 25 godina i broju prometnih nesreća sa
smrtnim ishodom na području županije X tijekom razdoblja od 1994. do 2007. godine

Tablica 6.9

98
Broj vozača Broj prometnih
mlađih od 25 godina nesreća sa
Godina (000) smrtnim ishodom
1994 20,10 12
1995 21,50 13
1996 25,00 13
1997 28,00 15
1998 30,00 17
1999 30,10 19
2000 32,80 21
2001 35,60 24
2002 37,30 27
2003 39,20 30
2004 40,32 33
2005 44,72 36
2006 51,12 40
2007 55,25 45

Izračunajte Pearsonov koeficijent linearne korelacije i objasnite njegovo značenje.Da li je


on statistički značajan?
2. Na natjecanju mladih violinista zabilježeni su podaci o osvojenom mjestu i prosječnom
dnevnom prosječnom vježbanju

Tablica 6.10

Redni Prosječno Prosječno


Osvojen Redni Osvojen
broj vrijeme vrijeme
o broj o
natjecatelj vježbanja vježbanja
mjesto natjecatelja mjesto
a (u satima) (u satima)
1 11 1,0 7 6 3,0
2 8 2,0 8 3 3,5
3 1 3,8 9 6 2,5
4 9 1,5 10 6 2,8
5 1 4,0 11 12 1,0
6 10 1,2 12 4 3,6

Izračunajte Spearmnov koeficijent korelacije ranga i objasnite njegovo značenje.


3. U želji da povećaju nakladu,deset dnevnih novina provodi nagradne igre.Podaci o
nakladi i fondu novčanih nagrada dani su narednom tablicom

Tablica 6.11

Broj Broj
Fond novčanih Fond novčanih
Redni prodanih novina Redni prodanih novina
nagrada nagrada
broj (000) broj (000)
(000 kn) (000 kn)

1 200 150 6 80 60
2 300 260 7 350 319
3 460 300 8 510 380
4 220 160 9 290 250
5 150 100 10 780 400

a) Dane podatke predočite dijagramom rasipanja uz navođenje svih potrebitih oznaka.

99
b) Izračunajte Pearsonov koeficijent linearne korelacije i koeficijent determinacije za
zadane varijable.Obrazložite dobivene vrijednosti.
c) Odredite jednadžbu linearnog regresijskog modela za zadane vrijednosti.
d) Objasnite značenje dobivenih parametara.
e) Pomoću dobivenog modela procijenite koliko se može očekivati prodanih novina u
slučaju da fond novčanih nagrada bude 600(000) kuna.
4.Podaci o broju cijepljenih i broju oboljelih od gripe u gradu X tijekom proteklih deset
godina,dani su slijedećom tablicom:

Tablica 6.12

Broj cijepljenih Broj oboljelih Broj cijepljenih Broj oboljelih


Godina Godina
(000) (000) (000) (000)
1998 3,51 9,43 2003 6,38 6,56
1999 4,83 9,01 2004 7,15 6,00
2000 5,24 8,30 2005 9,20 5,60
2001 5,63 8,01 2006 11,32 4,72
2002 6,01 7,11 2007 16,18 3,91

a) Podatke iz tablice predočite dijagramom rasipanja te navedite sve potrebne oznake.


b) Izračunajte Pearsonov koeficijent linearne korelacije za zadane varijable te
interpretirajte dobivenu vrijednost.
c) Nađite jednadžbu linearnog regresijskog modela za zadane vrijednosti te obrazložite
značenje dobivenih parametara.
d) Odredite jednadžbu eksponencijalnog regresijskog modela i interpretirajte dobivene
vrijednosti parametara.
e) Procijenite koji od ova dva modela bolje opisuje vezu između zadanih varijabli.

6. Podaci o učestalosti oboljenja dišnih putova u tvornici azbesta Udarnik dani su


tablicom:

Tablica 6.13

Navršene godine Navršene godine


Broj oboljelih Broj oboljelih
radnog staža radnog staža

6 2 22 10
11 4 28 10
12 5 31 15
13 5 35 18
15 7 37 20
18 7 40 22

a) Podatke iz tablice predočite dijagramom rasipanja te navedite sve potrebne oznake.

100
b) Izračunajte Pearsonov koeficijent linearne korelacije za zadane varijable te
interpretirajte dobivenu vrijednost.
c) Nađite jednadžbu linearnog regresijskog modela za zadane vrijednosti te obrazložite
značenje dobivenih parametara.
d) Odredite jednadžbu eksponencijalnog regresijskog modela i interpretirajte dobivene
vrijednosti parametara.
e) Odredite jednadžbu dvostruko logaritamskog regresijskog modela i interpretirajte
dobivene vrijednosti parametara.
f) Procijenite koji od ova tri modela najbolje opisuje vezu između zadanih varijabli.

6.Auto kuća Limuzina pokušava povećati prodaju pomoću reklamiranja na


televiziji.Rezultati jednogodišnjih napora predočeni su tablicom:

Reklamno vrijene Broj prodanih Reklamno vrijene Broj prodanih


Mjesec Mjesec
(u minutama) automobila (u minutama) automobila

siječanj 30 3 srpanj 70 17
veljača 30 5 kolovoz 85 20
ožujak 38 5 rujan 90 25
travanj 45 7 listopad 105 30
svibanj 50 10 studeni 120 40
lipanj 60 14 prosinac 150 60

a) Podatke iz tablice predočite dijagramom rasipanja te navedite sve potrebne oznake.


b) Izračunajte Pearsonov koeficijent linearne korelacije za zadane varijable te
interpretirajte dobivenu vrijednost.
c) Nađite jednadžbu linearnog regresijskog modela za zadane vrijednosti te obrazložite
značenje dobivenih parametara.
d) Odredite jednadžbu eksponencijalnog regresijskog modela i interpretirajte dobivene
vrijednosti parametara.
e) Odredite jednadžbu dvostruko logaritamskog regresijskog modela i interpretirajte
dobivene vrijednosti parametara.
f) Procijenite koji od ova tri modela najbolje opisuje vezu između zadanih varijabli.

Rješenja:
1.
SUMMAR
Y
OUTPUT

Regressio
n Statistics
koeficijent
Multiple R 0,985737 korelacije
0,971677
R Square 5
Adjusted R 0,969317
Square 2
Standard 1,888593
Error 7
Observatio 14

101
ns

ANOVA
Significan
df SS MS F ce F
Regressio 1468,4128 1468, 411,6907 1,17881E-
n 1 51 41 41 10
42,801434 3,566
Residual 12 29 79
1511,2142
Total 13 86

Coefficie Standard Lower Upper Upper


nts Error t Stat P-value 95% 95% Lower 95,0% 95,0%
- - - - -
10,98421 1,8269870 6,012 6,1015E- 14,964879 7,0035 7,0035535
Intercept 6 6 2 05 22 5 -14,9648792 3
Broj
vozača
mlađih od
25 godina 1,015822 0,0500647 20,29 1,1788E- 0,9067407 1,1249 1,1249043
(000) 5 78 02 10 66 04 0,906740766 29

Vrijednost koeficijenta korelacije od 0,985737 ukazuje na jaku vezu između navedenih


veličina.Kako je vidljivo iz gornje tablice, dobivena vrijednost je statistički značajna
( 1,1788E-10 je osjetno manja od 0,001.odnosno 0,005).

2.
Redni Prosječno Rang
broj Osvojeno vrijeme vježbanja Rang X di di^2
Y
natjecatelja mjesto (u satima)
1 11 1,0 11 1 10 100
2 8 2,0 8 5 3 9
3 1 3,8 1 11 -10 100
4 9 1,5 9 4 5 25
5 1 4,0 1 12 -11 121
6 10 1,2 10 3 7 49
7 6 3,0 5 8 -3 9
8 3 3,5 3 9 -6 36
9 6 2,5 5 6 -1 1
10 6 2,8 5 7 -2 4
11 12 1,0 12 1 11 121
12 4 3,6 4 10 -6 36
611
-1,136364 rS

Veza je izrazito jaka i negativna ( tj.više sati vježbanja prati manja (čitaj:bolji plasman)
vrijednost ranga osvojenog mjesta ).Ovdje nam se javlja i problem s vezanim rangovima
što se odrazilo i na „probijanje“ donje granice -1.
3. a)

102
Dijagram rasipanja

450

Broj prodanih novina (000)


400
350
300
250
200
150
100
50
0
0 100 200 300 400 500 600 700 800 900

Fond novčanih nagrada (000)

b)
0,913880 r
0,835176 R2

Koeficijent korelacije ukazuje na jaku pozitivnu vezu između navedenih veličina.


Međutim,vrijednost koeficijenta determinacije upozorava na to da lineaarni mode neće biti
odveć reprezentativan.Uostalom,to se može uočiti i na dijagramu rasipanja.

c)

Dijagram rasipanja y = 0,5189x + 64,595


R2 = 0,8352
500
Broj prodanih novina (000)

450
400
350
300
250
200
150
100
50
0
0 100 200 300 400 500 600 700 800 900

Fond novčanih nagrada (000)

Y = 0,5189 X + 64,595
d)
a = 0,51 89 i znači da pri povećanju fonda novčanih nagrada za jedinicu (a ovdje je to
1000),može se očekivati povećanje broja prodanih novina u iznosu od 518,9 tj.519
primjeraka
b = 64,595 što znači da u slučaju praznog fonda novčanih nagrada ( X = 0 ) može se
očekivati prodaja 64595 primjeraka.
e)

103
600 X
375,93
Y 5
U slučaju fonda nagradnih igara u iznosu od 600(000) kuna može se očekivati prodaja
375935 primjeraka.
4. a)

Dijagram rasipanja

12,00
Broj oboljelih ( 000 )

10,00
8,00
6,00
4,00
2,00
0,00
0,00 5,00 10,00 15,00 20,00
Broj cijepljenih ( 000 )

b)
r -0,894682

Između promatranih varijabli postoji jaka negativna veza.


c)

Dijagram rasipanja

12,00
y = -0,4771x + 10,565
10,00 R2 = 0,8005
Broj oboljelih (000)

8,00

6,00

4,00

2,00 y = 11,868e-0,0759x
R2 = 0,8968
0,00
0,00 5,00 10,00 15,00 20,00

Broj cijepljenih (000)

Y = -0,4771 X + 10,565
a = -0,4771 znači da se može očekivati da će se smanjiti broj oboljelih od gripe u slučaju
da se broj cijepljenih poveća za jedinicu ( 1000 )
b = 10,565 U slučaju da se ne provodi cijepljenje protiv gripe ( X = 0 ),može se očekivati
10565 oboljelih
d) a = 11,868

104
U slučaju neprovođenja cijepljenja protiv gripe ( X = 0 ) može se očekivati 11868
oboljelih
b = EXP(-0,0759) = 0,9269 S = (0,9269 – 1 ) * 100 = - 7,31%
U slučaju povećanja broja cijepljenih za jedinicu (1000),može se očekivati smanjenje
broja oboljelih od gripe za 7,31%.
x
Y = 11,868 ¿0,9269
e) Usporedbom koeficijenata determinacije vidljiva je osjetno veća reprezentativnost
eksponencijalnog regresijskog modela.
5. a)

Dijagram rasipanja

25

20
Broj oboljelih

15

10

0
0 5 10 15 20 25 30 35 40 45

Navršene godine radnog staža

b)
r 0,97986

Koeficijent korelacije ukazuje na jaku pozitivnu vezu između navedenih veličina.

c)

105
Veza između navršenih godina radnog staža i
y = 2,1188e0,0615x broja oboljelih y = 0,5735x - 2,3905
R2 = 0,9369 R2 = 0,9601
30

25
Broj oboljelih

20

15

10

0
0 5 10 15 20 25 30 35 40 45
y = 0,2208x 1,2267
Navršene godine radnog staža
R2 = 0,979

Y = 0,5735 X – 2,3905
a = 0,5735
U slučaju produljena radnog staža za jednu godinu u isto tvornici,može se očekivati
0,5735 ( ¿ 1) novooboljeli
b= -2,3905
Među populacijom koja nije provela ni jednu godinu u navedenoj tvornici (X = 0) može se
očekivati -2,395 oboljelih ( to je jedna od onih besmislenih situacija o kojima smo
govorili)
d)
a = 2,1188 znači očekivani broj oboljelih među onima koji nisu radili u navedenoj tvornici
(X = 0)
b = EXP(0,0615) = 1,0634
S = (1,0634 – 1)*100 = 6,34%
Dobivena stopa znači da se može očekivati povećanje broja oboljelih od 6,34% među
zaposlenicima koji imaju jednogodišnje povećanje radnog staža u istoj tvornici.
x
Y = 2,1188 * 1,0634
e) a = 0,2208
Među zaposlenicima sa jednogodišnjim stažem u navedenoj tvornici,može se očekivati
0,2208 ¿ 0 oboljelih
b = 1,2267
Sa produljenjem navršenih godina radnog staža,u problematičnoj tvornici,za 1%,može se
očekivati jedan novi oboljeli ( preciznije 1,2267 novooboljelih).
f) Najveća vrijednost koeficijenta determinacije od 0,979 čini dvostruko logaritamski
model najreprezentativnijim.

5.

106
a)

Dijagram rasipanja

Broj prodanih automobila 70


60
50
40
30
20
10
0
20 40 60 80 100 120 140 160

Reklamno vrijeme (u minutama)

b)
r 0,982454

Prema dobivenoj vrijednosti koeficijenta korelacije,postoji jaka pozitivna veza među


navedenim veličinama.
c)

Veza između reklamnog vremena i broja prodanih


y = 2,5212e0,0233x automobila
R2 = 0,926 y = 0,4376x - 12,172
90 R2 = 0,9652
80
70
Broj prodanih
automobila

60
50
40
30
20
10
0
20 40 60 80 100 120 140 160
y = 0,0117x 1,6996
Reklamno vrijeme (u minutama)
R2 = 0,9788

Y =0,4376 X – 12,172
a = 0,4376
U slučaju jednominutnog povećanja reklamnog vremena,može se očekivati povećanje
broja prodanih automobila za 0,4376
b = -12,172
U slučaju odsustva ma koje reklame,očekivani broj prodanih automobila će biti -12,172
d)
a = 0,2208
Očekivani broj prodanih automobila će biti 0,2208 u slučaju odsustva ma koje reklame

( X = 0)

107
B = EXP(0,0223) = 1,0226
S = (1,0226 – 1)*100 = 2,26%
U slučaju povećanja reklamnog vremena za jednu minutu,može se očekivati povećanje
broja prodanih automobila za 2,26%.
x
Y = 0,2208 ¿1,0226
e)
a = 0,0117
U slučajevima jednominutne reklame,može se očekivati 0,0117 ( ¿ 0 ) prodanih
automobila.
b = 1,6996
Uz povećanje reklamnog vremena od 1%,može se očekivati 1,6996% povećanje broja
prodanih automobila.
g) Uz vodeću vrijednost koeficijenta determinacije od 0,9788,dvostruko logaritamski
model je najreprezentativniji.

7. Osnovni pojmovi statističke analize vremenskih nizova

Ako se statističke jedinice grupiraju prema kronološki uređenoj skali modaliteta,govorimo


o vremenskom nizu.Tvore ga kvantitativni podaci prikupljeni u pravilnim vremenskim
intervalima,odnosno ekvidistantnim mjernim“punktovima“.Te podatke zovemo
frekvencijama
{ y t } , t =1,2,…,N
Opseg N ovdje zovemo duljinom niza.Obzirom na genezu frekvencija,govorimo o dvije
vrste vremenskih nizova:intervalni i trenutačni.Intervalnom nizu su svojstvene frekvencije
nastale zbrajanjem vrijednosti pojave po odabranim vremenskim intervalima (npr.prodaja
bezalkoholnih pića u gradu X po mjesecima tijekom 2008.godine).Frekvencije
trenutačnog vremenskog niza predstavljaju stanja pojave u odabranim vremenskim
točkama (npr.broj učesnika godišnjeg natjecanja mladih glazbenika Prva violina u
razdoblju od 1990. do 2005. godine).Statistička analiza pojave u vremenu se gradi na
konzistentnosti vremenskog niza tj.usporedivosti vrijednosti koje ga čine.Frekvencije će
biti usporedive ako se pojava opisana vremenskim nizom,zbiva pod utjecajem istih
čimbenika koji će na nju utjecati i u budućnosti.K tome,u slučaju intervalnog
niza,pretpostavljaju se jednaki intervali promatranja,a u slučaju trenutačnog niza
ekvidistantne mjerne točke.Prije početka statističke analize nužno je provjeriti
konzistentnost niza te ukloniti eventualne nedostatke nekonzistentnog vremenskog niza.
Vremenski niz je specifičan statistički niz nastao grupiranjem podataka prema
vremenskom obilježju.Izbor statističke metode za analizu niza ovisi o prirodi istog te o
cilju same analize.Postupak počinje raščlambom niza na sastavne komponente koje su
posljedica djelovanja različitih faktora.To su trend,ciklička,sezonska i slučajna
komponenta.

Trend komponenta predstavlja osnovnu dugoročnu tendenciju njezina razvoj u


vremenu.Može se uočiti samo kod dovoljno dugačkih nizova (najmanje deset godišnjih
frekvencija).Iskazuje se funkcijama vremena čiji oblik ovisi o samom nizu.

Ciklička komponenta je prisutna u nizu vrijednosti periodičnog karaktera sa ciklusom od


najmanje dvije godine.Zbog kratkoće većine nizova teško ju je uočiti,pogotovo ako je u
pitanju veliki period ciklusa.Ciklička kretanja su svojstvena mnogim područjima ljudskih
djelatnosti (graditeljstvo,poljoprivreda..).

108
Vremenski niz očituje sezonsku komponentu ako se pojava opisana nizom obnavlja u
periodu od jedne godine.Elementi niza će biti rezultati mjesečnih ili kvartalnih mjerenja
pojave.Za mnoge sezonske pojave (broj noćenja u
turizmu,potrošnja,proizvodnja…)postoji dovoljno podataka zbog čega je ovu komponentu
lako prepoznati.Sve navedene komponente su determinističke prirode i daju se iskazati
funkcijama vremena.Ako pojava opisana vremenskim nizom uključuje i neku
neočekivanu vrijednost (nepravilnost), to je signal nazočnosti
nesistematske,nedeterminističke slučajne komponente.
U pravilu,vremenski niz ne sadrži sve navedene komponente.Zapravo,moglo bi se reći da
je jedino nazočnost slučajne komponente sigurna jer se razvoj pojave u vremenu ne da
objasniti isključivo funkcijama vremena.
Jedan od mogućih načina analize vremenskih nizova je izgradnja modela koji će biti
statistički zapis te pojave u vremenu.Njegova uloga je potpuno analogna onoj koju je imao
regresijski model tj.opis pojave i predviđanje razvoja iste.Drugi mogući pristup analizi
vremenskih nizova naglašava dinamičku strukturu pojave.
Vremenski nizovi se grafički najčešće prikazuju linijskim grafikonima.Koriste se i
površinski grafikoni te neki specijalni grafikoni (polarni,polulogaritamski).Grafički prikaz
je veoma korisno pomagalo za uočavanje osobina vremenskih nizova te,na taj
način,olakšava odabir prikladnog modela.

7.1 Osnovni numerički pokazatelji dinamike

Pomoću grafičkog prikaza vremenskih nizova može se formirati osnovna slika o


promatranoj pojavi te naslutiti njen razvoj u budućnosti.Međutim,tako dobivene
informacije obično nisu dostatne.Zbog toga,u većini slučajeva se provodi i brojčana
analiza vremenskih nizova.Dinamiku promjena možemo pratiti na različite
načine,izračunom različitih pokazatelja bilo apsolutnih,bilo relativnih promjena.Prve
diferencije vremenskog niza
ΔY t =Y t −Y t−1 , t = 2,3,…,n
su apsolutni pokazatelji promjena pojave,opisane vremenskim nizom,u uzastopnim
razdobljima.Ako su prve diferencije frekvencija vremenskog niza približno jednake
(nepromijenjene) to je znak da pojava opisana nizom očituje linearni trend.
Dinamika apsolutne promjene pojave u tekućem u odnosu na bazno (pojavi tipično)
razdoblje,možemo pratiti pomoću diferencija oblika
¿
Δ Y t =Y t −Y b , t = 1,2,3,…,n
Ove,o mjernim jedinicama i frekvencijama ovisne, diferencije su apsolutni pokazatelji
dinamike.Zbog toga nisu uvijek prikladni izvori procjena razvoja pojave u vremenu.Da i
ne govorimo o usporedbi varijacija pojava iskazanih različitim mjernim
jedinicama.Takovi zadaci postaju nemoguće misije.Izlaz postoji i krije se u prijelazu na
relativne pokazatelje dinamike.Najjednostavniji među njima su prve relativne diferencije
poznate pod imenom pojedinačne stope promjena
ΔY t
t = ⋅¿ ¿
S Y t−1 100 ,t = 2,3,…,n
One u postocima iskazuju vrijednost promjene pojave u tekućem razdoblju u odnosu na
prethodno razdoblje.Posve analogno se može računati ta promjena u odnosu na bazno
razdoblje

109
¿
Δ¿ Y t
t= ⋅¿ ¿
S Y t−1 100 , t = 1,2,3,…,n
Primjer 7.1
Podaci o broju diplomanata na sveučilištu u gradu X tijekom razdoblja od 1995. do 2005.g
dani su tablicom:
Tablica 7.1
Godina Broj diplomanata Godina Broj diplomanata
1995 63 2001 103
1996 78 2002 85
1997 92 2003 96
1998 59 2004 98
1999 88 2005 107
2000 96 2006 110

a) Izračunajte vrijednost promjena broja diplomanata po godinama promatranog


razdoblja. Interpretirajte dobivenu vrijednost za 2001.godinu.
b) Izračunajte vrijednost promjena broja diplomanata za navedeno razdoblje u odnosu na
1999.godinu.Interpretirajte dobivenu vrijednost za 1995.g.
c) Izračunajte pojedinačne stope promjena broja diplomanata u uzastopnim razdobljima i
objasnite dobivenu vrijednost za 2002.godinu.
d) Izračunajte stope promjena broja diplomanata po navedenim godinama u odnosu na
1995.g. i objasnite dobivenu vrijednost za 1997.g.

Rješenje:

a) Podatke ćemo unijeti u stupce A i B počevši od drugih mjesta.Prve ćelije u svakom od


tih stupaca upotrijebit ćemo za naslove,upravo kao i ćeliju C1 u koju ćemo upisati t ΔY
.Niz prvih diferencija generiramo u stupcu C počevši od C3 (ne počinjemo od prve godine
u nizu 1995. zato jer ona nema prethodnu,unutar promatranog skupa vrijednosti,pa za nju
ne možemo izračunati diferenciju) u koju upisujemo = B2 – B1.
Enter.Sadržaj ćelije C3 kopiramo u blok ćelija C4:C13.Diferencija
ΔY 2001 = 7 što znači da
je u 2001.godini bilo 7 više diplomanata nego u prethodnoj 2000.g.
¿
b) U D1 upišemo
Δ Y (1999=0 )
t a u D2 unesemo =B2-$B$5 .Adresa bazne 1999 je
„zamrznuta“ u skladu s pripadnom formulom.Nakon toga kopiramo sadržaj ćelije D2 u
blok D3:D13.Kako smo u D1 dobili -25 to znači da je u tekućoj 19995.godini bilo čak 29
diplomanata manje nego u baznoj 1999 godini.
c) U E1 upisujemo St E2 preskačemo a u E3 upisujemo =C3/B2*100.Enter i kopiranje
rutine mišem u blok E4:E13.Kako je vrijednost stope pojedinačnih promjena za 2002
godinu -17,48 to znači da je u 2002 godini zabilježeno smanjenje broja diplomanata za
17,48%u odnosu na
prethodnu 2001 godinu.
¿
d) Sada ćemo u F1 upisati St (1995 = 0) a u F2 unijeti =D2/$B$4*100 te kopirati taj
¿
sadržaj u blok F3:F13.Vrijednost S1997 = 31,52 znači da je u 1997 godini bilo 31,52% više
diplomanata nego u baznoj 1995 godini.

110
Tablica 7.2

7.2 Individualni indeksi

Relativni pokazatelji dinamike jedne ili skupine pojava su neimenovani brojevi koje
zovemo indeksima.Ako se njima iskazuje odnos stanja jedne pojave u različitim
razdobljima,riječ je o individualnim indeksima.Skupnim indeksima se prati dinamika
heterogene skupine pojava.Obzirom na način praćenja jedne pojave ,individualni indeksi
se dijele na lančane (verižne) i bazne.Indeksi su relativni brojevi iskazani (ali ne i
napisani) u postocima.Ishodišna vrijednost je 100.Ako indeks prekoračuje tu vrijednost
tada je promatrana pojava porasla upravo za iznos tog prekoračenja iskazan u
postocima.Analogno,ako vrijednost indeksa ne dosiže ishodišnu vrijednost,tada se
vrijednost promatrane pojave smanjila u navedenom razdoblju i to upravo za,u postocima
iskazan,iznos otklona od ishodišnih 100.Svaka interpretacija ovih relativnih pokazatelja
dinamike nužno mora uključiti podatke o razdoblju na koje se odnosi.

7.2.1 Lančani indeksi

Ako su Yt ,t = 1,2,…,n frekvencije vremenskog niza,tada lančani (verižni) indeksi


definirani kao
Yt
t= ⋅100
V Y t−1 , t = 2,3,…,n
znače,u postocima iskazan,udio vrijednosti pojave tekućeg razdoblja u odnosu na
prethodno razdoblje.Stopa promjena St u uzastopnim vremenskim razdobljima se računa
tako da od pripadnog verižnog indeksa oduzmemo 100
St = Vt - 100
Primjer 7.2
Podaci o stanogradnji u gradu X,u razdoblju od 1996 do 2007 su dani narednom tablicom:

111
Tablica 7.3

Godina Broj stambenih kvadrata Godina Broj stambenih kvadrata


( 000) ( 000)
1996 8 2002 13,12
1997 8,34 2003 14,08
1998 9,42 2004 16,42
1999 10,67 2005 11,37
2000 12,45 2006 16,77
2001 15,72 2007 18,32

Izračunajte lančane indekse i pojedinačne stope promjena po navedenim godinama te


objasnite značenje indeksa za 2000. i 2005. godinu.

Rješenje:

Kao i u većini primjera,podatke ćemo unijeti u prva dva stupca novog radnog lista i to od
drugog retka.Ćelije u prvom retku su,naravno sačuvane za odgovarajuće naslove,pa tako u
C1 upišemo Vt ,a u D1 St .Budući da je drugi član vremenskog niza prvi član koji ima
prethodnika,niz lančanih indeksa počinje od njega.U C2 ćemo upisati nepoznat ili samo
staviti crticu (--),a u C3
= B3/B2*100 te,uneseni sadržaj mišem kopirati u blok ćelija C4:C13.I kod izračuna
stopa,u startu imamo isti problem,uzrokovan istim razlozima,te stoga u D2 crtica ili
upišemo nepoznata.U D3 unosimo obrazac rutine = C3 – 100.I,opet,kopiranje sada
sadržaja ćelije D3 u blok D4:D13.
Tablica 7.4
Broj stambenih
Godina kvadrata Vt St
( 000)
nepozna nepoznat
1996 8,00 t a
1997 8,34 104,25 4,25
1998 9,42 112,95 12,95
1999 10,67 113,27 13,27
2000 12,45 116,68 16,68
2001 15,72 126,27 26,27
2002 13,12 83,46 -16,54
2003 14,08 107,32 7,32
2004 16,42 116,62 16,62
2005 11,37 69,24 -30,76
2006 16,77 147,49 47,49
2007 18,32 109,24 9,24

Kako je V2000 = 116,68 a pripadna stopa S2000 = 16,68 to znači da je u 2000.godini


zabilježeno povećanje broja novoizgrađenih stambenih kvadrata,u odnosu na prethodnu
1999.godinu,u iznosu od 16,68%,dok je istovremeno,u 2005.godini sagrađeno 30,76%
manje stanova no u prethodnoj 2004.godini (V2005 = 69,24, S2005 = -30,76).

112
7.2.2 Bazni indeksi

Bazni indeksi su relativni pokazatelji promjene vrijednosti pojave dane vremenskim


nizom u odnosu na vrijednost koju pojava ima u nekom odabranom,baznom,razdoblju
istog niza.Definiraju se na način

Yt
It = Y b * 100 t = 1,2,….,n
Izračunu baznih indeksa prethodi odabir baznog razdoblja.Ako nije unaprijed zadano,za
bazno razdoblje treba odabrati razdoblje „normalne“ vrijednosti pojave.Razdoblja
ekstremnih vrijednosti pojave nisu prikladni kandidati za bazno razdoblje.Naime,oni će
dati nerealno velike ili nerealno male vrijednosti baznim indeksima ovisno o tome da li je
riječ o maksimalnim ili minimalnim vrijednostima pojave u tako odabranom baznom
razdoblju.
Pripadna stopa promjena pojave u tekućem,u odnosu na bazno razdoblje,je
¿
St = It - 100 , t = 1,2,…,n
Primjer 7.3
Za podatke iz prethodnog primjera izračunajte bazne indekse i pripadne stope promjena
uzimajući 2002.godinu za baznu godinu.Objasnite značenje dobivenih vrijednost indeksa i
pripadne stope za 1998. i 2004. godinu.
Rješenje:
¿
Koristit ćemo postojeću tablicu te u ćelije E1 i F1,redom,upisati It ,2002 = 100 i St .U E8
(koja pripada baznoj godini 2002 ) upišemo 100 a u E2 obrazac za izračun traženih
indeksa
=B2/$B$8*100.Vrijednosti baznih indeksa za preostale godine razmatranog razdoblja
dobijemo kopiranjem sadržaja ćelije E2 u odgovarajuće ćelije stupca E.Pripadne stope
računamo u stupcu F,počevši od F2 u koju upišemo = E2-100 te kopiramo taj sadržaj u
blok E3:E13.

Tablica 7.5

113
Vrijednost baznog indeksa za 1998.godinu iznosi 71,80 a pripadna stopa je -28,20 što
znači da je u 1998 godini izgrađeno 28,20% manje stanova nego u baznoj 2002.godini dok
je istovremeno,u 2004.godini izgrađeno 25,19% više stanova nego u 2002.godini(I2004 =
¿
125,15, S2004 = 25,15%).

7.2.3 Pretvaranje indeksa

U praksi je ponekad potrebno pretvoriti lančane indekse u bazne ili obrnuto,bazne u


lančane.Postoje slučajevi u kojima je nužno promijeniti baze ili pak,rekonstruirati
vremenski niz iz zadanih baznih,odnosno lančanih indeksa,i poznate vrijednosti obilježja
u jednom od promatranih razdoblja.

7.2.3.1 Pretvaranje baznih indeksa sa stare na novu bazu

Kako su formule za izračun baznih indeksa po staroj bazi (SB) i novoj bazi (NB) redom
SB
Yt NB
Yt SB
Yb
t = ∗100 t = ∗100 b = ∗100
I Y SB i I Y NB te I Y SB
to je
NB I SB
t
t =
I Y SB
b * 100
a to znači da se transformacija baza provodi na način da bazni indeksi (po staroj bazi)
preuzimaju ulogu originalnih frekvencija.
Primjer 7.4
Koristeći bazne indekse za 2002.godinu izračunajte brojčane pokazatelje dinamike
stanogradnje na bazi 2000.godine.
Rješenje:

Rezultirajuću tablicu 7.5 ćemo kopirati na novi radni list i u prvom slijedećem slobodnom
stupcu G izračunati nove bazne indekse.Stoga u G1 unosimo It ,2000 = 100,a u G2
=E2/$E$6*100 i taj sadržaj kopiramo u blok ćelija G3:G13.

Tablica 7.6

Broj stambenih
It It
Godina kvadrata Vt St St*
2002 = 100 2000 = 100
( 000)
1996 8,00 nepoznat nepoznata 60,98 -39,02 64,26
1997 8,34 104,25 4,25 63,57 -36,43 66,99
1998 9,42 112,95 12,95 71,80 -28,20 75,66
1999 10,67 113,27 13,27 81,33 -18,67 85,70
2000 12,45 116,68 16,68 94,89 -5,11 100,00
2001 15,72 126,27 26,27 119,82 19,82 126,27
2002 13,12 83,46 -16,54 100,00 0,00 105,38
2003 14,08 107,32 7,32 107,32 7,32 113,09
2004 16,42 116,62 16,62 125,15 25,15 131,89
2005 11,37 69,24 -30,76 86,66 -13,34 91,33
2006 16,77 147,49 47,49 127,82 27,82 134,70
2007 18,32 109,24 9,24 139,63 39,63 147,15

114
7.2.3.2 Pretvaranje bazni indeksa u lančane

Kako su bazni indeksi proporcionalni frekvencijama tj. izvornim vrijednostima pojave


opisane vremenskim nizom,to i pri preračunavanju baznih indeksa u lančane igraju
analognu ulogu kao i u prethodno opisanoj pretvorbi,tj.s njima postupamo kao s
frekvencijama
It
⋅100
V = I t−1
t , t = 2,3,…..,n
Primjer 7.5
Dinamika promjena otkupnih cijena kukuruza u razdoblju od 1998. do 2007.godine u
odnosu na 2001.godinu dana je narednom tablicom:

Tablica 7.7
It Godin It
Godina 2001 = 100 a 2001 = 100
1998 88,62 2003 142,16
1999 90,28 2004 153,16
2000 95,13 2005 160,12
2001 100,00 2006 162,29
2002 130,48 2007 90,43

Izračunajte brojčane pokazatelje dinamike promjena cijena u tekućoj u odnosu na


prethodnu godinu,za navedeno razdoblje.Koliko je ta promjena iznosila za 2007.godinu?

Rješenje:
U prva dva stupca novog radnog lista ćemo smjestiti podatke,a u stupcima C i D računati
lančane indekse i pripadne stope.Naslove u zaglavne ćelije;u C2 i D2 napisati
nepoznat,odnosno nepoznata a u C3 unosimo =B3/B2*100 i kopiramo taj sadržaj u
preostale ćelije istog stupca do,zaključno,C11.Analogno,u D3 upisujemo =C3-100 te taj
sadržaj mišem kopiramo u blok ćelija D4:D11.

Tablica 7.8
It
Godina 2001 = 100 Vt St
nepozna nepoznat
1998 88,62 t a
1999 90,28 101,87 1,87
2000 95,13 105,37 5,37
2001 100,00 105,12 5,12
2002 130,48 130,48 30,48
2003 142,16 108,95 8,95
2004 153,16 107,74 7,74
2005 160,12 104,54 4,54
2006 162,29 101,36 1,36
2007 90,43 55,72 -44,28

Iz priložene izlazne tablice je vidljivo da je u 2007.godini gotovo prepolovljena otkupna


cijena kukuruza u odnosu na prethodnu 2006.godinu.Točnije iznosila je svega 55,72%

115
cijene prethodne godine što znači smanjenje od 44,28% u odnosu na cijenu iz
2006.godine.

7.2.3.2 Pretvaranje lančanih indeksa u bazne

Lančane indekse računamo iz poznatih baznih dvojako ovisno o tome da li se oni odnose
na razdoblja koja prethode baznom razdoblju ili ga slijede.
It
t−1= ⋅100
I Vt , t<b
It = 100 , t=b
I t−1⋅V t
t =
I 100 , t>b
Primjer 7.6
Zadani su lančani indeksi prosječnih plaća u ustanovi X tijekom razdoblja od 1992. do
2001. godine.Izračunajte pokazatelje dinamike promjena plaća u odnosu na 1998.godinu.

Tablica 7.9

Godina Vt Godina Vt
1992 --- 1997 110,92
1993 98,32 1998 102,73
1994 101,45 1999 95,37
1995 103,82 2000 107,49
1996 106,58 2001 112,81

Rješenje:
U stupce A i B novog radnog lista smjestimo zadane podatke sačuvavši zaglavne ćelije za
naslove.U C1 upišemo It , 1998 = 100.Izračun baznih indeksa iz zadanih lančanih
počinjemo od bazne 1998 godine kojoj ( C8) pridijelimo vrijednost I1998 = 100.Sada ćemo
pomoću odgovarajućih formula odrediti ostale vrijednosti baznih indeksa i to počevši od
razdoblja koja neposredno prethode,odnosno slijede,bazno razdoblje.Za godine koje
prethode baznoj 1998.godini,u C7 ćemo upisati
I 1998
⋅100
= C8 / B8*100 što odgovara formuli I1997 = V 1998 .Poslije Enter ćemo ovaj sadržaj
kopirati u ćelije stupca C koje prethode aktualnoj C7 do,zaključno,C2.Sada prelazimo na
„poslijebazna“ razdoblja.Početak je u ćeliji C9 u koju unesemo = C8*B9/100 što je
„jezikom“ relativnih adresa iskazana formula
I 1998⋅V 1999
I1999 = 100 .
Ovaj sadržaj ćemo kopirati u naredne dvije ćelije C10 i C11.

116
Tablica 7.10
Godina Vt It
1998 = 100
nepozna
1992 t 79,51
1993 98,32 78,18
1994 101,45 79,31
1995 103,82 82,34
1996 106,58 87,76
1997 110,92 97,34
1998 102,73 100,00
1999 95,37 95,37
2000 107,49 102,51
2001 112,81 115,65

7.2.3.4 Rekonstrukcija niza pomoću lančanih indeksa

Već je rečeno da znajući vrijednost pojave u jednom od razdoblja je moguće rekonstruirati


čitav vremenski niz pomoću lančanih ili baznih indeksa.U slučaju poznatih lančanih
indeksa,taj postupak formalno nalikuje preračunavanju baznih indeksa u lančane.I ovdje
imamo dva tipa generirajućih formula ovisno o tome da li se odnose na razdoblja koja
prethode razdoblju za koje znamo vrijednost pojave opisane nizom, ili ga slijede.
Ako je poznata vrijednost Yt tada za frekvencije koje joj prethode vrijedi

Yt
t−1= ⋅100
Y Vt
dok se članovi niza koji slijede zadanu vrijednost računaju na način
Y t−1⋅V t
t=
Y 100 .
Primjer 7.7
Verižni indeksi prosječnih plaća zaposlenika u ustanovi X,u razdoblju od 1992 do 2001
godine,dani su tablicom 7.9.Znajući da je prosječna plaća u toj ustanovi,1997 godine
iznosila 3752 kn,izračunajte prosječne plaće u toj ustanovi,za sve preostale godine
promatranog razdoblja.
Rješenje:
Kopirat ćemo tablicu 7.9 na novi radni list te u C1 upisati Prosječna plaća u ustanovi X ,a
u C7 unijeti zadanu vrijednost prosječne plaće 3752.U C6 upišemo = C7/B7*100 te taj
sadržaj kopiramo u prethodne ćelije C6 do,zaključno,C2.Izračun frekvencija preostalog
dijela niza počinjemo s ćelijom C8 u koju ćemo upisati =C7*B8/100 što ćemo kopirati u
naredni blok ćelija C9:C11.Izlazna tablica je:

117
Tablica 7.11
Godina Vt Prosječna plaća u ustanovi X
1992 --- 3064,80
1993 98,32 3013,31
1994 101,45 3057,01
1995 103,82 3173,78
1996 106,58 3382,62
1997 110,92 3752
1998 102,73 3854,43
1999 95,37 3675,97
2000 107,49 3951,30
2001 112,81 4457,46

7.2.3.5 Rekonstrukcija niza iz baznih indeksa

Pri izračunu baznih indeksa istaknutu ulogu ima vrijednost pojave u baznom razdoblju.Ta
se činjenica odražava na relacije za rekonstrukciju niza.Frekvencije niza zadanih baznih
indeksa i poznate vrijednosti pojave baznog razdoblja se računaju na način
Y b⋅I t
t=
Y 100 , t = 1,2,….,n
U slučaju kada nije poznata vrijednost pojave u baznom razdoblju već u nekom trenutku t
(Yt ),tada će rekonstrukciji niza,prema već navedenoj formuli,prethoditi izračun
frekvencije baznog razdoblja
Yt
b= ⋅100
Y I t .
Primjer 7.8
Zadani su bazni indeksi (1994 = 100) godišnjeg ulova plave ribe u županiji X za razdoblje
od 1990 do 2001 godine.Izračunajte količinu ulovljene ribe u svakoj od godina navedenog
razdoblja znajući da je 1996 godine ulovljeno 13,42 tone plave ribe.

Tablica 7.12

It It
Godina Godina
1994 = 100 1994 = 100
1990 83,47 1996 105,79
1991 92,73 1997 104,91
1992 98,42 1998 91,67
1993 99,72 1999 110,13
1994 100 2000 112,62
1995 102,37 2001 115,43

Rješenje:
Na novom radnom listu,u prva dva stupca,na način svih prethodnih primjera,unesemo
podatke iz gornje tablice.Niz ćemo rekonstruirati u stupcu C pa u C1 upišemo naslov
Godišnji ulov ribe (000 kg)a u C8 unesemo zadanu vrijednost 13,42.Kako se taj ulov nije
zbio u baznoj 1994 godini,to ćemo najprije izračunati ulov u baznoj godini na način da u
C6 upišemo = C8/B8*100.Sad možemo krenuti sa prvim članom niza.Stoga u C2
pišemo =$C$6*B2/100

118
I taj sadržaj kopiramo u blok ćelija C3:C5.Ne znamo ulov u 1995,a poznati su nam
članovi niza koji joj prethode te član niza koji joj neposredno slijedi.Sadržaj ma koje od
ćelija početnog bloka C2:C5 ćemo kopirati u C7 pokretanjem poznatih koraka
(Copy/Paste) desnom tipkom miša.Zadnji blok ćelija ćemo popuniti tako da
najprije,ponavljanjem upravo opisane procedure,kopiramo (opet desnom tipkom miša)
sadržaj ma koje od ćelija bloka C2:C5 u C9,a nakon toga,njen sadržaj mišem kopiramo u
ćelije bloka C10:C13.Izlazna tablica je:

Tablica 7.13

It
Godina Godišnji ulov ribe
1994 = 100
( 000 kg )
1990 83,47 10,59
1991 92,73 11,76
1992 98,42 12,49
1993 99,72 12,65
1994 100 12,69
1995 102,37 12,99
1996 105,79 13,42
1997 104,91 13,31
1998 91,67 11,63
1999 110,13 13,97
2000 112,62 14,29
2001 115,43 14,64

7.3 Skupni indeksi

Skupni indeksi su brojčani pokazatelji relativne promjene heterogene skupine pojava.U


pravilu,frekvencije nizova različitih pojava se iskazuju različitim mjernim
jedinicama.Zbog toga su teško usporedive.Jedan,doduše ne i besprijekoran,način za
prevladavanje tog problema je vrijednosno iskazivanje pojava.Najčešće se relativne
promjene prate u dva razdoblja:baznom (nazvanim i nultim razdobljem) i razdoblju u
kojem iskazujemo dinamiku
promjena (tekuće ili izvještajno razdoblje).Cijene označavamo s pij a količine s qij .Prvi
od ova dva indeksa označava mjesto u niz ( i = 1,2,…,k ) a drugi razdoblje na koje se
odnosi.Za bazno razdoblje j = 0 ,dok je 1 oznaka tekućeg razdoblja.Promatra li se k
pojava,njihova vrijednost će biti
k
p1 j q 1 j + p2 j q 2 j +¿⋅¿⋅¿+ p kj qkj =∑ pij q ij
i=1
pri čemu su moguće sve kombinacije vrijednosti indeksa j kako za cijene tako i za
količine.To znači da se cijene različitih razdoblja (baznog ili tekućeg) mogu množiti sa
količinama upravo kao što su mogući i umnošci cijena sa količinama različitih razdoblja.
Analiza skupine pojava nije ni u kom slučaju jednostavna niti je način praćenja njihove
dinamike jedinstven.Skupni indeksi se javljaju pod različitim nazivima i u različitim
oblicima.Najčešće su u upotrebi skupni indeksi cijena,količina i vrijednosti.Najčešći oblici
skupnih indeksa su Laspeyresov i Pascheov oblik.

119
7.3.1 Skupni indeksi cijena

Skupni indeks cijena mjeri prosječnu promjenu cijena skupine pojava u dva različita
vremenska razdoblja i to na bazi nepromijenjenih količina.
Laspeyresov skupni indeks cijena
k
∑ pi1 qi0
i=1
01 ( q 0 )= k ⋅100
∑ pi0 qi0
P i=1

označava ukupnu promjenu cijena skupine pojava računatu uz nepromijenjene količine


baznog razdoblja.
Pascheov skupni indeks cijena
k
∑ pi 1 qi 1
i =1
01 ( q1 )= k ⋅100
∑ pi 0 qi 1
P i =1

predstavlja relativni brojčani iskaz ukupne promjene cijena tekućeg razdoblja u odnosu na
bazno razdoblje uz nepromijenjene količine tekućeg razdoblja.
Teorijske kriterije kakvoće indeksa zadovoljava svojevrsna izvedenica iz navedenih oblika
skupnih indeksa.Riječ je o geometrijskoj sredini Laspeyresovog i Pascheovog skupnog
indeksa poznatog kao Fischerov idealni indeks cijena.Istina da je on sljedbenik prednosti i
jednog i drugog,ali je njegova interpretacija prilično složena.

7.3.2 Skupni indeks količina

Ovdje je riječ o brojčanom pokazatelju relativne promjene fizičkog obujma skupine


pojava.Slično kao i kod skupnog indeksa cijena,izračun se oslanja na vrijednosno
iskazivanje vrijednosti pojave uz onemogućavanje utjecaja promjene cijena na te
promjene.Ako se pri izračunu koriste stalne cijene baznog razdoblja,dobit ćemo
Laspeyresov skupni indeks količina
k
∑ pi 0 qi 1
i =1
01 ( p 0 )= k ⋅100
∑ pi 0 qi 0
Q i=1

Ako se pri izračunu skupnog indeksa koriste nepromijenjene cijene tekućeg


razdoblja,dobit ćemo Pascheov oblik skupnog indeksa količina
k
∑ pi1 qi1
i=1
01 ( p 1 )= k ⋅100
∑ pi 1 qio
Q i =1

Dakle, Laspeyresov skupni indeks količina iskazuje prosječnu relativnu promjenu količina
promatranih pojedinačnih pojava uz neizmijenjene cijene baznog razdoblja,dok Pascheov
oblik skupnog indeksa količina pokazuje za koliko su se u prosjeku promijenile količine
skupine pojava,uzrokovane promjenama količina pojedinih pojava u skupini pri čemu se
cijene održavaju nepromijenjene na nivou tekućeg razdoblja.

120
Analogno,kao i u slučaju skupnog indeksa cijena,i ovdje možemo načiniti novi skupni
indeks količina pomoću geometrijske sredine Laspeyresovog i Pascheovog oblika
skupnog količina.Naravno,sada je to Fischerov indeks količina sa analognim pratećim
svojstvima.

7.3.3 Skupni indeks vrijednosti

Ponovimo još jednom činjenicu da skupni indeksi znače relativne pokazatelje promjena
vrijednosti skupne pojava uzrokovanih promjenama cijena ili količina pojedinih pojava
unutar skupine.Skupni indeksi cijena su to radili na način da su,tijekom postupka,količine
držali nepromijenjenim bilo na nivou baznog bilo na nivou tekućeg razdoblja i tako
otklonili opasnost od utjecaja njihove,eventualne,promjene na vrijednost skupine
pojava.Ista ideja vodilja je nazočna i pri konstrukciji skupnih indeksa količina samo što su
sada cijene pod „blokadom“ kako ne bi svojim možebitnim izmjenama utjecale na
vrijednost skupine pojava.
Skupni indeksi vrijednosti mjere promjene uzrokovane istodobnim mijenjanjem cijena i
količina promatrane skupine pojava.
k
∑ pi 1 q i 1
i=1
01 = k ⋅100
∑ pio q io
V i =1

Usporedimo li ove relaciju s formulama za skupne indekse cijena i količina,uočit ćemo da


je skupni indeks vrijednosti moguće dobiti i kao umnožak Laspeyresovog indeks cijena i
Pascheovog indeks količina,odnosno kao umnožak Laspeyresovog indeks količina i
Pascheovog indeksa cijena.

Primjer 7.9
Podaci o cijenama i broju stomatoloških usluga obavljenih u ambulanti X tijekom 2003 i
2004 godine,dani su tablicom:

Tablica 7.14

Broj Broj
cijene cijene
Vrsta usluge zahvata zahvata
2003 2004
2003 2004
Vađenje zuba 300 320 150 200
Liječenje zuba 900 1200 200 300
Uklanjanje karijesa 600 800 80 100
Postavljanje ispuna 1000 1100 150 200
Izrada klasične proteze 50 53 1100 1300

Izračunajte:
a) za koliko su se promijenile cijene pruženih usluga u 2004. u odnosu na prethodnu
2003.godinu,računajući s neizmijenjenim količinama iz 2003.godine
b) za koliko su se promijenile cijene pruženih usluga u 2004. u odnosu na prethodnu
2003.godinu,ako se promjena računa s neizmijenjenim količinama iz 2004.godine
c) za koliko se promijenio broj svih obavljenih usluga u 2004.godini u odnosu na
prethodnu godinu računajući s neizmijenjenim cijenama iz bazne 2003.godine
d) za koliko su se promijenile količine svih obavljenih usluga u 2004.godini u odnosu na
prethodnu godinu uz neizmijenjene cijenama iz 2004.godine

121
e) za koliko su se promijenile vrijednosti svih vrsta obavljenih usluga u 2004.godini u
odnosu na 2003.godinu.
Rješenje:
Na novom radnom listu,na način prethodnih primjera,unesemo podatke.U A1 upišemo
Vrsta usluge,a u B1,ispod već postojećeg naslova Broj zahvata 2003, navest ćemo i q0.
Na isti način,u C1,D1 i E1,ispod pripadnih naslova, upisujemo redom q1,p0,p1Nakon toga
p q p q pq
opskrbimo naslovim 0 0 , 0 1 , 1 0 , p1 q 1 ,redom,stupce F,G,H i I.
a) Da bi odredili traženi Laspeyresov skupni indeks cijena,trebamo popuniti
odgovarajuće ćelije stupaca F i H.Počet ćemo s F2 u koju ćemo unijeti =B2*D2.Enter
i kopiranje sadržaja ćelije F2 u blok ćelija F3:F6 te zbrajanje upravo izračunatih
vrijednosti u F7.Analogno,u H2 unosimo =C2*D2,Enter,kopiranje sadržaja iz H2 u
blok H3:H6 i zbroj izračunatih umnožaka u H7.U B10 pišemo =H7/F7*100.Tražena
vrijednost, Laspeyresov skupni indeks cijena iznosi 137,03,što znači da je u
2004.godini zabiležen rast cijena svih obavljenih usluga za 37,03% računajući s
neizmjenjenim brojem usluga iz 2003.godine.
b) Ovdje je riječ o Paascheovom obliku skupnog indeksa cijena za što trebamo zbroj
umnožaka iz stupaca I i G.Stoga,najprije u G2 upišemo =C2*D2.Nastavak
znamo.Kopiranje ovog sadržaja u sklop ćelija G3:G6 i zbroj upravo izračunatih
umnožaka u G7.U I2 unosimo =C2*E2.Poznatim slijedom koraka dolazimo do sume
u I7,te do tražene vrijednosti indeksa u B11pomoću naredbe =I7/G7*100.
Dobivena vrijednost Paascheovog skupnog indeksa cijena 137,82 pokazuje da je rast
cijena stomatoloških usluga u 2004. godini,računat uz nepromijenjene količine iz
2004.godine,iznosi 37,82% te neznatno odstupa od Laspeyresov oblika istog skupnog
indeksa cijena.

c) Za izračun vrijednosti Laspeyresov oblika skupnog indeksa količina trebamo sume


umnožaka u stupcima G i F.Kako smo ih već priredili u G7 i F7 to ćemo u B12 upisati
=G7/F7*100.Dobivena vrijednost od 120,36 znači da je ukupan broj obavljenih usluga
u 2004.godini bio veći za 20,36% u odnosu na prethodnu godinu ako se iskazuje uz
neizmijenjene cijene iz prethodne godine.

d) I za traženi Paascheov skupni indeks količina,koji pretpostavlja poznavanje zbroja


umnožaka p1q1 (I7) i umnožaka p0q0 (H7) imamo potrebite vrijednosti,pa,stoga,u B13
unosimo = I7/H7*100.Dobivena vrijednost od 121,05 znači da je u 2004.godini
povećan broj stomatoloških usluga za 21,05% u odnosu na prethodnu godinu ako se ta
promjena iskazuje uz neizmijenjene cijene tekuće 2004.godine.

e) I za ovaj skupni indeks imamo već priređene potrebne vrijednosti u I7 i F7,pa ćemo u
B14 upisati =I7/F7*100.Dobivena vrijednost od 168,88 znači da je u 2004.godini
porasla vrijednost svih obavljenih stomatoloških usluga za čak 68,88% u odnosu na
prethodnu 2003.godinu.

Tablica 7.15

122
Broj Broj
cijene cijene
zahvata zahvata
Vrsta usluge 2003 2004 p0q0 p0q1 p1q0 p1q1
2003 2004
p0 p1
q0 q1
Vađenje zuba 300 320 150 200 45000 48000 60000 64000
Liječenje zuba 900 1200 200 300 180000 240000 270000 360000
Uklanjanje karijesa 600 800 80 100 48000 64000 60000 80000
Postavljanje ispuna 1000 1100 150 200 150000 165000 200000 220000
Izrada klasične proteze 50 53 1100 1300 55000 58300 65000 68900
478000 575300 655000 792900

P01(q0) 137,03
P01(q1) 137,82
Q01(p0) 120,36
Q01(p1) 121,05
V01 165,88

7.3.4 Deflacioniranje, revalorizacija. Prosječna stopa promjene

Gotovo se sa sigurnošću može tvrditi da ne postoji privreda u kojoj su cijene neovisne o


vremenu.Naprotiv,cijene se u pravilu mijenjaju s vremenom u većoj ili manji+oj
mjeri.Radi toga ne možemo imati pravi uvid u dinamiku mijenjanja pojave s vremenom
bez uvažavanja utjecaja promjena cijena na tijek tih promjena.Preciznije rečeno,moramo
onemogućiti utjecaj neminovne promjene cijena na vrijednost pojave iskazane
vremenskim nizom.Taj postupak se zove deflacioniranje.Provodi se diobom nominalnih
vrijednosti (tj. vrijednosti iskazanih u cijenama tekućeg razdoblja) s odgovarajućim
indeksom cijena nemnoženim sa sto (tkz.deflacijskim indeksom ili deflatorom).Izbor
deflatora ovisi o konkretnom slučaju i nije ga jednostavno provesti jer podrazumijeva
dobro poznavanje pojave i statističke metodologije.Recimo,ako želimo izračunati realnu
vrijednost nečije plaće,tada ćemo za deflator upotrijebiti skupni indeks životnih troškova
pri izračunu kojeg ćemo koristiti samo cijene roba i usluga nužnih za svakodnevni život.
Iz množine posebnih skupnih indeksa,izdvojit ćemo
Vrijednosti u stalnim cijenama koje ćemo dobiti iz nominalnih vrijednosti dijeljenjem sa
indeksom cijena(deflatorom) te množenjem sa sto.Pri tome se svi indeksi moraju odnositi
na

istu baznu godinu tj.godinu uz čije cijene se računaju vrijednosti.


Prosječna stopa promjena se definira kao prosječna promjena vrijednosti pojave
(povećanje ili smanjenje,ovisno o predznaku stope) iskazana u postocima.Ona je prikladna
zamjenska veličina niza pojedinačnih stopa samo ako one ne očituju velike brojčane
varijacije.Računa se kao pomoću geometrijske sredine lančanih indeksa
G =
N−1
√ V 2 V 3⋅¿⋅V N
kao S̄ = G - 100 .
Kako je

√ V 2 V 3⋅¿⋅V N =
N−1

N−1 YN
Y 1 * 100

123
Znači da u izračunu prosječne stope promjena sudjeluju samo prva i posljednja vrijednost
niza što,pored već navedene osjetljivosti na varijabilnost pojedinačnih stopa,predstavlja
najveći nedostatak prosječne stope promjena kao mjere prosječnog tempa promjene
opisane vremenskim nizom.Rado sveg navedenog nije preporučljivo koristiti je u
prognostičke svrhe.

Primjer 7.10
Lančani indeksi cijena i podaci o ostvarenoj dobiti u tekućim cijenama turističkog naselja
Maslina u gradu X,dani su slijedećom tablicom:
Tablica 7.16

Lančan Lančan
Ostvarena dobit
i Ostvarena dobit i
Godin Godin u tekućim
indeksi u tekućim cijenama indeksi
a a cijenama
( 000 )
( 000 )
cijena cijena
1991 ----- 352,14 1999 111,18 810,37
1992 101,12 360,81 2000 108,02 821,37
1993 107,17 371,13 2001 106,12 850,68
1994 116,12 400,42 2002 113,62 900,04
1995 120,30 490,48 2003 115,48 953,68
1996 121,43 592,63 2004 121,31 1001,21
1997 130,28 700,48 2005 122,14 1200,32
1998 121,41 790,68 2006 123,23 1350,54

Izračunajte:
a) ostvarenu dobit iskazanu u stalnim cijenama iz 2001.godine.
b) prosječnu stopu promjena.

Rješenje:
Zadatak ćemo riješiti na novom radnom listu na kojem ćemo prethodno,na već uhodani
način,smjestiti naše podatke.Da bi mogli ostvarenu dobit izraziti u stalnim cijenama iz
2001.godine,trebamo bazne indekse cijena iz iste godine.Stoga,u prvi slijedeći slobodni
stupac D,preciznije,u ćeliju D1 upišemo obrazloženje vrijednosti koje ćemo smjestiti u taj
stupac : It 2001 = 100,a zatim u D12 unesemo 100.Prisjetimo se,ostale vrijednosti baznih
indeksa ovise,između ostalog,i o tome da li se odnose na godine koje prethode baznoj ili je
slijede.Odlučimo li najprije za „predbazne“ godine,morat ćemo početi sa D11 u koju ćemo
upisati =D12/B12*100.Poslije Enter ćemo ovaj sadržaj,mišem,kopirati u ćelije
„prethodnice“ do,zaključno,D2.Izračun baznih indeksa za „poslijebazne“ godine počinje u
D13 gdje moramo napisati = D12*B13/100.Opet Enter,i opet kopiranje mišem,ali sada u
blok ćelija D14:D17.

Sada možemo,konačno,izračunati traženu dobit.Zato,u E1 naslov Ostvarena dobit u


stalnim cijenama iz 2001.godine,a potom u E2 upišemo =C2/D2*100 te taj sadržaj
kopiramo u preostale ćelije istog stupca do,zaključno,E17.

124
Tablica 7.17

Lančan Ostvarena dobit


Ostvarena dobit
i u tekućim cijenama It
Godina u stalnim cijenama iz 2001
indeksi 2001 = 100
( 000 )
cijena ( 000 )
1991 ----- 352,14 26,99 1304,92
1992 101,12 360,81 27,29 1322,24
1993 107,17 371,13 29,24 1269,07
1994 116,12 400,42 33,96 1179,15
1995 120,30 490,48 40,85 1200,63
1996 121,43 592,63 49,61 1194,66
1997 130,28 700,48 64,63 1083,87
1998 121,41 790,68 78,46 1007,69
1999 111,18 810,37 87,24 928,93
2000 108,02 821,37 94,23 871,64
2001 106,12 850,68 100 850,68
2002 113,62 900,04 113,62 792,15
2003 115,48 953,68 131,21 726,84
2004 121,31 1001,21 159,17 629,02
2005 122,14 1200,32 194,41 617,42
2006 123,23 1350,54 239,57 563,73

b) Da bi izračunali prosječnu stopu promjena,najprije ćemo odrediti geometrijsku sredinu


lančanih indeksa
G = √ V 2 V 3⋅¿⋅V N = √V 2 V 3⋅¿⋅V 16 .
N−1 15

U MS Excel-u je to moguće uraditi pomoću funkcije


= GEOMEAN (B3:B17)
Koju ćemo upisati u B20.U B21 unesemo
=B20 – 100
Dobivena vrijednost 15,67 znači da je tijekom promatranog razdoblja dobit rasla
godišnje,u prosjeku 15,67%.

7.4 Trend modeli

Model vremenske pojave je analitički zapis njenog razvoja u vremenu.Izbor modela ovisi
o svrsi analize i osobinama vremenskog niza kojim je predočena pojava.Svaki model je
analitički zapis pretpostavke o očekivanom tijeku pojave u vremenu.Veliki broj
vremenskih nizova iskazuje osnovnu razvojnu tendenciju (trend).S metodološkog
stanovišta,većina trend modela se ubrajaju u regresijske modele te se analiziraju na isti
način kao i ti modeli.Pri tome je uvijek nezavisna varijabla vrijeme.Osim regresijskih
metoda,koriste se i specifične statističke metode primjerene upravo toj vrsti statističkog
niza i postavljenim ciljevima njihove analize.Uz određene uvjete,model se koristi u
prognostičke svrhe.

125
7.4.1 Linearni trend modeli

Neznatna varijabilnost prvih diferencija vremenskog niza


ΔY t = Y - Yt−1 , t = 2,3, ¿⋅¿,N
ukazuje na linearni trend tj.činjenicu da je osnovna tendencija razvoja pojave,opisane
nizom,linearna.Kako je riječ o posebnom regresijskom modelu,koristit ćemo posve
analogne jednadžbe s pripadnim parametrima uz napomenu da je nezavisna varijabla
uvijek i jedino vrijeme.U skladu s tim ćemo i „stari“ indeks sumacije i zamijeniti
indeksom t (time).Jednadžba modela će biti
Y^ = a X + b
pri čemu je
N
∑ x t y t −N ¯¿ X̄⋅Ȳ
t =1
N
∑ x 2t −N X̄ 2
a = t =1

b = Ȳ - a X̄ .
Pri tome parametar a znači očekivanu prosječnu promjenu (povećanje ili smanjenje ovisno
o predznaku) varijable Y pri povećanju nezavisne varijable xt za jedinicu vremena.
Parametar b predstavlja očekivanu vrijednost (trend vrijednost) varijable Y u ishodištu
vremenskog razdoblja (xt = 0).
Reprezentativnost trend modela se procjenjuje na isti način kao i regresijskog modela.Ista
napomena vrijedi i za mjere odstupanja stvarnih od trend vrijednosti.
Već smo kazali da je postupak izgradnje linearnog trend modela potpuno analogan
postupku izgradnje linearnog regresijskog modela s postojanom prirodom nezavisne
varijable (uvijek i jedino to je vrijeme).Obično se ne koriste izvorne vrijednosti nezavisne
varijable već transformirane koje,najčešće ali ne i jedino,ishodište postavljaju u početak
promatranog razdoblja.

Primjer 7.11
Podaci o broju razvrgnutih brakova u županiji X,u razdoblju od 1994 do 2007 godine,dani
su narednom tablicom:

Tablica 7.18
Godina Broj razvoda Godina Broj razvoda
1994 68 2001 113
1995 72 2002 121
1996 83 2003 130
1997 89 2004 138
1998 95 2005 145
1999 101 2006 151
2000 108 2007 158

a) Zadani niz prikažite grafički.


b) Nađite jednadžbu linearnog trenda s ishodištem u 1994.godini.
c) Objasnite značenje parametara u dobivenoj jednadžbi.
d) Uz pretpostavku da će se broj razvrgnutih brakova mijenjati u skladu s prepoznatim
trendom,odredite broj očekivanih razvoda u 215.godini.

126
e) Uz pretpostavku da će broj razvoda zadržati uočeni trend,odredite u kojoj godini se
može očekivati 315 razvoda.
f) Provjerite reprezentativnost dobivenog trend modela.

Rješenje:
Na novom radnom listu,kao i u svim prethodnim primjerima,smjestimo podatke iz tablice
u prva dva stupca s odgovarajućim naslovom u prvoj ćeliji svakog od njih.
a) Vremenski nizovi se prikazuju najčešće (naravno,ne i jedino) linijskim
grafikonima.Postupak počinje jednako,kao i kod ostalih grafičkih
prikaza,označavanjem skupa podataka A2:B15 i pokretanjem „alata“ za izradu
grafikona Chart Wizard .Od ponuđenih opcija biramo XY (Scatter) i to donji lijevi
podtip.Nastavak je uobičajeno „šminkanje“ s ciljem što veće informativnosti
grafikona.Legenda je nepotrebna pa ćemo je ukloniti,a na kartici Titles upisati naslov
Kretanje broja razvoda brakova u županiji X u razdoblju od 2004 do 2007,na osi
apscisa su Godine a na y-osi Broj razvoda.Po potrebi možemo povećati preglednost
grafikona „izostavljanjem“ dijela ravnine u kojem nema zadanih podataka.S istom
nakanom ćemo mijenjati skale na obje,ili nekoj od koordinatnih osi.Želimo li to uraditi
na y-osi,kliknut ćemo desnom tipkom miša na ma koju od vrijednosti na toj osi.U
ponuđenom plutajućem izborniku biramo Format Axis ,a unutar njega opciju Scale
unutar koje možemo podešavati,po osobnom izboru,vrijednosti parametara.Na našem
grafikonu možemo uočiti da vrijednosti na y-osi nisu manje od 60 niti veće od 160 te,u
skladu s tom činjenicom,možemo prepraviti ponuđene ekstremne vrijednosti (umjesto
0 pisati 60,a umjesto maksimuma 180 staviti 160).

Kretanje broja razvoda brakova u županiji X u


razdoblju od 1994 do 2007

160
150
140
130
Broj razvoda

120
110
100
90
80
70
60
1992 1994 1996 1998 2000 2002 2004 2006 2008

Godine

b) Da bi dobili traženu jednadžbu linearnog trenda,najprije ćemo transformirati


nezavisnu varijablu u skladu s odabirom ishodišta.Između stupaca A i B umetnemo
novi stupac.Postupak znamo:označimo stupac B ispred kojeg želimo novi stupac,zatim
slijed znanih koraka Insert/Columns.U „novoj“ćeliji B1 upišemo xt ,a u B2 pišemo 0,u
B3 unosimo 1 i dalje,redom,do B15 gdje mora stajati 13.

127
Godina xt Broj razvoda
1994 0 68
1995 1 72
1996 2 83
1997 3 89
1998 4 95
1999 5 101
2000 6 108
2001 7 113
2002 8 121
2003 9 130
2004 10 138
2005 11 145
2006 12 151
2007 13 158

Nastavak je analogija iznalaženja linearnog regresijskog modela.Koristit ćemo onaj


najjednostavniji način.Označimo graf,a zatim na karticama Type i Options dijaloškog
okvira Add Trendline odaberemo linearni model i zatražimo ispis jednadžbe istog na
grafu (Display equation on chart) i predočenje koeficijenta determinacije uz traženu
jednadžbu (Display R- squared value on chart).

Kretanje broja razvoda brakova u županiji X u


y = 6,989x + 66,857 razdoblju od 1994 do 2007
R2 = 0,9976
160
150
140
130
Broj razvoda

120
110
100
90
80
70
60
0 2 4 6 8 10 12 14

xt

Jednadžba linearnog trend modela je


Y = 6,989 x + 66,857
c) a = 6,989 znači da se godišnje,u prosjeku, može očekivati 7 novih razvoda
b = 66,857 znači da očekivani broj razvoda u ishodišnoj (1994) godini iznosi 67
Zaokružene,cjelobrojne,vrijednosti parametara su u suglasju s njihovim značenjem.

d) Prepoznavanje tendencije razvoja pojave u vremenu omogućava predviđanje njenog


razvoja u budućnosti.Kako trebamo prognozirati očekivani broj razvoda u 2015

128
godini,naravno uz pretpostavku da će promatrana pojava zadržati prepoznati
„stil“ponašanja i u buduće,iskoristiti ćemo dobivenu jednadžbu trend modela

Transformirana vrijednost za 2015 godinu je 21 (2015 – 1994 =21)


Y^ = 6,989* 21 + 66,857 = 213,626
Što znači da se,uz gore navedene pretpostavke,u 2015 godini očekuje 214 razvoda.

(Y -
Godina xt Broj razvoda Yoček Yoček)^2
1994 0 68 66,857 1,306
1995 1 72 73,846 3,408
1996 2 83 80,835 4,687
1997 3 89 87,824 1,383
1998 4 95 94,813 0,035
101,80
1999 5 101 2 0,643
108,79
2000 6 108 1 0,626
2001 7 113 115,78 7,728
122,76
2002 8 121 9 3,129
129,75
2003 9 130 8 0,059
136,74
2004 10 138 7 1,570
143,73
2005 11 145 6 1,598
150,72
2006 12 151 5 0,076
157,71
2007 13 158 4 0,082
164,70
2008 14 3 26,330
171,69
2009 15 2
178,68
2010 16 1
2011 17 185,67
192,65
2012 18 9
199,64
2013 19 8
206,63
2014 20 7
213,62
2015 21 6
220,61
2016 22 5
227,60
2017 23 4
234,59
2018 24 3
241,58
2019 25 2
248,57
2020 26 1
2021 27 255,56

129
262,54
2022 28 9
269,53
2023 29 8
276,52
2024 30 7
283,51
2025 31 6
290,50
2026 32 5
297,49
2027 33 4
304,48
2028 34 3
311,47
2029 35 2
318,46
2030 36 1
6,989 a
66,857 b N = 14
X Y 1,481 Standardna greška ocjene trenda
21 213,6 1,32% koeficijent varijacije
35,5 315

e) Analogno,iz iste jednadžbe,za danu vrijednost zavisne varijable Y = 315,dobijemo


X = ( 315 – 66,857) / 6,989
što daje X = 35,5 tj. 315 razvoda brakova se može očekivati u 2030 ( 1994 + 36) godini.
g) Reprezentativnost modela ocjenjujemo slično kao i kod regresijskog te uz pomoć
koeficijenta determinacije.
Standardna greška trenda (varijanca) se računa na poznati način


N
∑ ( Y i −Y^ i )2
i=1
σ= N−2
U stupcu D izračunamo očekivane vrijednosti zavisne varijable.U D1 unesemo oznaku
Yoček,a u D2 obrazac za izračun tih vrijednosti =6,989*B2 + 66,857.Taj sadržaj mišem
kopiramo u blok ćelija D3:D13.U slijedećem stupcu izračunamo kvadrate odstupanja
zadanih vrijednosti od očekivanih,a njihov zbroj ćemo dobiti u E14.Broj podataka N =
14.Prema gore navedenoj formuli,dobit ćemo da je standardna greška ocjene trenda
1,481,a koeficijent varijacije,kojeg ćemo dobiti pomoću izračunate greške i prosjeka
σ
⋅¿ ¿
zadanih vrijednosti ,( V = Ȳ 100) iznosi 1,32% .Dakle, prosječno odstupanje stvarnih
vrijednosti od trend vrijednosti iznosi 1,481.Modelom linearnog trenda protumačeno je
99,76% odstupanja.(R2 =0,9976).

7.4.2 Eksponencijalni trend model

Ako se pojava opisana vremenskom nizom mijenja iz razdoblja u razdoblje za gotovo isti
relativni iznos tj. ako pojedinačne stope promjena pokazuju neznatan varijabilitet,ili su

130
približno konstantne,tada je eksponencijalna funkcija prikladan iskaz trenda koji iskazuje
promatrana pojava.Naime,eksponencijalna funkcija se mijenja za isti relativni iznos pri
konstantnoj promjeni nezavisne varijable.Model je oblika
Y^ =ab x
Interpretacija parametara je posve analogna onoj koju smo sreli kod eksponencijalnog
regresijskog modela.
a predstavlja očekivanu (trend) vrijednost nezavisne varijable Y u ishodištu promatranog
vremenskog razdoblja ( xt = 0 )
b znači prosječan ritam promjene zavisne varijable Y pri jediničnoj promjeni nezavisne
varijable.Pomoću ovog parametra računamo prosječnu periodičnu stopu promjena za
promatrano razdoblje
S̄ = ( b – 1 ) * 100
Kao i kod linearnog modela,nezavisna varijabla xt se transformira.Obično je prvo
razdoblje i ishodišno.Isto tako,pomoću logaritama,i ovaj model se linearizira kao i
analogni regresijski model.

Primjer 7.12

Podaci o broju registriranih vozila u gradu X,u razdoblju od 1991. do 2002.godine su dani
slijedećom tablicom.
a) Prikažite navedeni niz linijskim grafikonom
b) Nađite jednadžbu eksponencijalnog trend modela s ishodištem u 1991.godini
c) Obrazložite značenje parametara u dobivenoj jednadžbi
d) Uz pretpostavku da će broj registriranih vozila slijediti eksponencijalni
trend,prognozirajte broj registriranih vozila u 2012.godini
e) Eksponencijalnim trend modelom prognozirajte u kojoj godini se može očekivati
275168 registriranih vozila
f) Procijenite reprezentativnost ovog trend modela

Tablica 7.19

Godin Broj registriranih vozila Godin Broj registriranih vozila


a ( 000 ) a ( 000 )

1991 23,782 1997 83,547


1992 28,876 1998 103,253
1993 36,834 1999 129,725
1994 48,436 2000 151,131
1995 56,623 2001 183,123
1996 72,534 2002 210,452

Rješenje:
a) Po inerciji,podatke smo stalno unosili na isti način,koristeći gornji lijevi dio novog
radnog lista.Postupimo li tako i u ovom primjeru,a nema posebnog razloga da to ne
učinimo,traženi linijski grafikon ćemo dobiti poznatim slijedom koraka.Označit ćemo
blok ćelija sa podacima (A2:B13),/XY (Scatter)treći podtip. Zatim ćemo grafikon
„tekstualno“opremiti naslovom (Kretanje broja registriranih vozila u gradu X u razdoblju
od 1991. do 2002.godine),sadržajem osi (na x osi Godine,a na y osi Broj vozila).Po
želji,promijeniti granice skala na koordinatnim osima.Ovdje ima jako malo
„praznog“hoda te takovi zahvati ne pridonose bitno preciznosti grafa.

131
Kretanje broja registriranih vozila u gradu X u
razdoblju od 1991. do 2002. godine

210
190
170
150
Broj vozila

130
110
90
70
50
30
10
1990 1992 1994 1996 1998 2000 2002

Godine

b) Da bi dobili jednadžbu traženog trend modela,moramo prethodno transformirati


nezavisnu varijablu.“Odbrojavanje“ćemo obaviti na uobičajeni način,a to znači da ćemo
prvu godinu (1991) proglasiti ishodišnom godinom.S tim ciljem umetnut ćemo novi
stupac između postojećih stupaca A i B i u njega unijeti transformirane vrijednosti xt
počevši sa 0 u B2 do 11 u B13.Koristeći podatke iz bloka ćelija B2:C13,ponovit ćemo
prethodni postupak iznalaženja linijskog grafikona.

Nastavak je analogan postupku iz prethodnog primjera.Jedina razlika je izbor


eksponencijalnog modela umjesto linearnog iz prethodnog slučaja.Prateće opcije ćemo
ponoviti.

Kretanje broja registriranih vozila u gradu X u


y = 24,961e0,2006x razdoblju od 1991. do 2002.godine
R2 = 0,9963

200
Broj registriranih vozila

180
160
140
120
100
80
60
40
20
0 2 4 6 8 10 12

xt

a = 24,961 b = EXP (0,2006) = 1,222

132
što znači da je jednadžba traženog trend modela
Y^ = 24,961 ¿1,222 x
c) Parametar a = 24,961 kaže da je u ishodišnoj 1991.godini registrirano 24961 vozilo
Kako je prosječna periodična stopa promjena S̄ = (1,222 – 1) * 100 = 22,21 to znači
da prosječno godišnje raste broj registriranih vozila za 22,21%.
d) Transformirana vrijednost varijable xt za 2012 iznosi 21 (2012 – 1991),pa će očekivani
broj registriranih vozila u 2012 godini biti 1685664 (naravno,uz pretpostavku da će
broj registriranih vozila i u buduće zadržati isti trend rasta)
(= 4,961*1,222^21 = 1685,664)
e) Uz pretpostavku da će rast broja registriranih vozila i u buduće zadržati isti trend,
godinu u kojoj se očekuje 275 168 vozila će se dobiti pomoću
= LN (275,168/24,961)/0,2006 = 11,964
Kako je dobiveni podatak je jako blizak cjelobrojnom 12 što znači je tražena godina
2003. ( 1991 + 12 ).
f) Koeficijent determinacije iznosi 0,9963 i znači da je 99,63% odstupanja stvarnih
vrijednosti od trend vrijednosti protumačeno modelom.Suvišno je naglasiti da je riječ o
izrazito reprezentativnom modelu.

7.4.3 Prognoziranje pomoću trenda

Već je rečeno da svaki model vremenske pojave predstavlja analitički iskaz teze o tijeku
promatrane pojave u vremenu te,upravo zato,svaki takav,dovoljno reprezentativni model
tj. mode koji nas je“uvjerio“ da upravo on najbolje zna što „nas je snašlo“,može poslužiti
za predviđanja nastavka aktualnih događanja.Kako smo od množine mogućih trend
modela

naveli samo najčešće upotrebljavane,navest ćemo funkcije u MS Excel-u pomoću kojih je


moguće procijeniti razinu promatrane pojave u slučaju da ona očituje linearni ili
eksponencijalni trend.To su
FORECAST
TREND
GROWTH .
Prve dvije se koriste za prognoziranje na osnovu linearnog trenda,a GROWTH
omogućava prognoziranje na osnovu eksponencijalnog trenda.Pomoću funkcije
FORECAST možemo izračunati očekivanu vrijednost zavisne varijable za zadanu
vrijednost nezavisne. Dakle,ukratko rečeno,ova funkcija rješava,na drugi način,problem
koji je moguće riješiti jednadžbom linearnog trend modela.Jedina prednost ovog načina
jest preciznija očekivana vrijednost (pri korištenju jednadžbe linearnog trend modela
nužno moramo zaokružiti vrijednosti parametar što utječe na točnost izračuna).Oblik
navedene funkcije je

=FORECAST (novi X;raspon poznate varijable Y;raspon poznate varijable X)

Primjer 7.13

133
Podaci o broju osoba s kardiovaskularnim poteškoćama u gradu X,u razdoblju od 1994.
do 2005.godine,dani su slijedećom tablicom:

Tablica 7.20
Godine Broj oboljelih Godine Broj oboljelih
1994 142 2000 203
1995 153 2001 215
1996 165 2002 228
1997 174 2003 240
1998 186 2004 252
1999 157 2005 270

Uz pretpostavku da će se kretanje broja kardiovaskularnih bolesnika nastaviti u skladu s


linearnim trendom,prognozirajte,pomoću funkcije FORECAST,koliko se
kardiovaskularnih bolesnika može očekivati 2010 godine u gradu X.
Rješenje:
Tablicu s podacima ćemo smjestiti na novi radni list na način prethodnih primjera,a zatim
umetanjem novog stupca između stupaca A i B,osigurati mjesto za transformirane
vrijednosti nezavisne varijable.Ishodište vremenskog niza ćemo smjestiti,kao i inače,u
prvu godinu promatranog razdoblja (1994).Uz takav odabir,transformirana vrijednost
2010 godine će biti 16 (2010 – 1994).Tražena prognostička vrijednost se računa na način:
= FORECAST( 16;C2:C13;B2;B13)
i iznosi 317,224 odnosno,jer očekivani broj oboljelih je cjelobrojna vrijednost,317.

TREND funkcija omogućava prognoziranje vrijednosti zavisne varijable za više


uzastopnih vrijednosti nezavisne varijable,također na osnovu linearnog trend
modela.Funkcija je oblika

=TREND(raspon poznate varijable Y;raspon poznate varijable X;


raspon nove varijable X)

Primjer 7.14
Pomoću linearnog trenda prognozirajte broj kardiovaskularnih bolesnika u gradu X,u
razdoblju od 2012. do 2020. godine.

Rješenje:
Najprije ćemo upisati u odgovarajuće stupce godine (od 2012 do 2020) i njihove
transformirane vrijednosti (od 18 do 26),a zatim označit dio postojećeg radnog lista na
kojem želimo izlazne rezultate (C14:C22).Nakon toga,u vrpci formula upisujemo

=TREND(C2:C13;B2:B13;A14:A22)

te,istovremenim pritiskom na tipke Control,Shift i Enter,u označenom bloku ćelija (koji


biramo po osobnom nahođenju,a mi smo odabrali C14:C22) dobijemo očekivane brojeve
oboljelih u navedenom razdoblju,uz pretpostavku da će broj oboljelih u budućem
razdoblju zadržati iskazani linearni trend promjene.

Tablica 7.21
Godine Xt Broj oboljelih
1994 0 142
1995 1 153

134
1996 2 165
1997 3 174
1998 4 186
1999 5 197
2000 6 203
2001 7 215
2002 8 228
2003 9 240
2004 10 252
2005 11 270
2012 18 341
2013 19 353
2014 20 364
2015 21 375
2016 22 386
2017 23 397
2018 24 408
2019 25 419
2020 26 431

Pomoću funkcije GROWTH je moguće odrediti očekivane vrijednosti zavisne varijable


za nekoliko uzastopnih vrijednosti nezavisne varijable i to pomoću eksponencijalnog trend
modela.Funkcija glasi
= GROWTH(raspon poznate varijable Y;raspon poznate varijable X;
raspon nove varijable X)
Primjer 7.15
Uz podatke iz prethodna dva primjera,eksponencijalnim trend modelom prognozirajte broj
kardiovaskularnih bolesnika u gradu X u vremenu od 2012. do 2020.godine.
Rješenje:
Postupak je posve analogan,odnosi se na isto razdoblje i iste podatke.Stoga,označimo blok
ćelija D14:D22 u koji ćemo smjestiti očekivane vrijednosti prema eksponencijalnom
trendu.Nastavak je poznat.“Skok“ do vrpce formula i upis funkcije

= GROWTH(C2:C13;B2:B13;A14:A22)

i,opet,istovremeni pritisak na tipke Control,Shift i Enter.Očekivane vrijednosti su:

2012 18 341 399


2013 19 353 422
2014 20 364 446
2015 21 375 472
2016 22 386 499
2017 23 397 528
2018 24 408 558
2019 25 419 590
2020 26 431 624
Eksponencijaln
Linearni i
trend trend

Zadaci za vježbu 5.

135
1. Podaci o godišnjoj prodaji piva u gradu X,u razdoblju od 1993. do 2002.godine,dani
su tablicom:

Tablica 7.22

Prodano pivo Prodano pivo


Godina Godina
(000 l) (000 l)
1993 18,42 1998 36,43
1994 22,67 1999 37,71
1995 26,38 2000 41,92
1996 29,42 2001 44,03
1997 33,62 2002 51,31

a)Izračunajte bazne indekse godišnje prodaje piva u gradu X,uzimajući 1996.godinu za


baznu.Obrazložite značenje dobivenog indeksa za 2001.godinu.
b)Izračunajte lančane indekse te obrazložite dobivenu vrijednost tog indeksa za
1999.godinu.
2.Verižni indeksi zapošljavanja u turističkoj djelatnosti,u vremenu od 1995. do
2008.godine u županiji X,su dani tablicom:

Tablica 7.23
Godina Vt Godina Vt
1995 ---- 2002 107,48
1996 103,42 2003 112,57
1997 110,74 2004 120,61
1998 120,17 2005 117,14
1999 110,19 2006 119,53
2000 128,43 2007 115,53
2001 110,71 2008 100,98

a)Izračunajte brojčane pokazatelje dinamike zapošljavanja u turističkoj djelatnosti,u


županiji X,u odnosu na 1999.godinu.
b)Znajući da je broj zaposlenih u turističkoj djelatnosti u županiji X,u 1997.godini iznosio
130428,odredite broj zaposlenih,u turizmu u županiji X,tijekom preostalih godina
promatranog razdoblja.
3.Kretanje cijena uslužnih djelatnosti u gradu X,u razdoblju od 1992. do
1998.godine,dano je tablicom:

Tablica 7.24
It It
Godina Godina
1998.=100 1998.=100
1992 83,27 1999 102,33
1993 87,92 2000 108,74
1994 89,29 2001 110,37
1995 92,45 2002 11,29
1996 97,52 2003 113,37
1997 93,87 2004 118,29
1998 100 2005 121,42

136
a)Izračunajte brojčane pokazatelje dinamike promjene cijena u uzastopnim godinama
promatranog razdoblja.
b)Nađite brojčane pokazatelje promjena cijena uslužnih djelatnosti u odnosu na
1995.godinu.

4.Verižni indeksi obavljenih estetskih zahvata na odjelu plastične kirurgije u bolnici X,u
razdoblju od 1996. do 2005. godine,dani se slijedećom tablicom:

Tablica 7.25
Godina Vt Godina Vt
1996 -- 2001 109,19
1997 108,23 2002 110,42
1998 110,12 2003 112,49
1999 93,89 2004 103,52
2000 105,37 2005 107,83

a)Izračunajte bazne indekse uzimajući 1999.godinu za baznu godinu te obrazložite


značenje dobivenog indeksa za 2003.godinu.
b)Ako je broj obavljenih zahvata 1998.godine iznosio 1105,odredite broj obavljenih
estetskih zahvata u svakoj godini promatranog razdoblja.
c)Izračunajte i objasnite prosječnu godišnju stopu promjena za navedeno razdoblje.
5.Podaci prometne policije o broju i iznosima naplaćenih kazni za učinjene prometne
prekršaje tijekom 2005. i 2007.godine,dani su slijedećom tablicom:

Tablica 7.26

a)Izračunajte za koliko su porasli iznosi svih naplaćenih kazni za prometne prekršaje u


2007.godini računajući s brojem nepromijenjenim brojem kazni iz 2005.godine.
b)Izračunajte za koliko se promijenio ukupan broj kazni u 2007.godini u odnosu na
2005.godinu ako se ta promjena računa s iznosima kazni iz 2007.godine.
c)Za koliko se promijenila ukupna vrijednost obavljenog posla prometne policije u
2007.godini u odnosu na 2005.godinu?
6.Lančani indeksi cijena i proizvodnja grožđa,na poljoprivrednom imanju Primoštenski
vinograd u razdoblju od 1992. do 2005.godine, dani su slijedećom tablicom:

Tablica 7.27

Prizvodnja grožđa Lančani Prizvodnja grožđa


Godin Godin Lančani indeksi
u tekućim cijenama indeksi u tekućim cijenama
a a cijena
(000 kn) cijena (000 kn)
1992 4,52 nepoznat 1999 6,80 102,36
1993 4,80 101,02 2000 7,00 103,78

137
1994 5,12 101,82 2001 7,20 108,92
1995 5,80 102,36 2002 7,25 110,37
1996 6,10 104,48 2003 7,30 111,48
1997 6,30 105,52 2004 7,50 111,92
1998 6,80 105,68 2005 8,00 112,46

a)Proizvodnju grožđa iskažite u stalnim cijenama iz 2001.godine


b)Izračunajte prosječnu godišnju stopu promjena prosječnih otkupnih cijena grožđa.
c)Linearnim trend modelom prognozirajte proizvodnju grožđa u 2010.godini uz troškove
proizvodnje iz 2001.godine.
7.Podaci o stanovništvu naselja X u Dalmatinskoj zagori u vremenu od 1930. do
2000.godine,dani su narednom tablicom:

Tablica 7.28
Godina Broj stanovnika Godina Broj stanovnika
1930 1638 1970 950
1940 1510 1980 800
1950 1350 1990 660
1960 1100 2000 570

a)Nađite jednadžbu linearnog trenda s ishodištem u 1930.godini.Obrazložite značenje


dobivenih vrijednosti parametara.
b)Koeficijentom determinacije procijenite reprezentativnost modela.
c)Pomoću dobivenog modela prognozirajte broj stanovnika u 2010.godini,te u razdoblju
od 2010.do 2050.godine.
d)Ako bi kretanje broja stanovnika zadržalo uočeni trend,odredite deceniju u kojoj će
naselje opustjeti.
8.Podaci o površinama zasađenim povrtnim kulturama,u razdoblju od 1995. do
2006.godine.su dani slijedećom tablicom:

Tablica 7.29
Površine povrtnjaka Površine povrtnjaka
Godina Godina
(u 00 m 2) (u 00 m 2)
1994 1190,21 2000 451,88
1995 1079,68 2001 340,13
1996 960,49 2002 290,48
1997 820,33 2003 180,39
1998 695,48 2004 110,48
1999 573,49 2005 79,53

a)Nađite jednadžbu eksponencijalnog trend modela i interpretirajte dobivene vrijednosti


parametara.
b)Koeficijentom determinacije procijenite reprezentativnost modela.
c)Uz pretpostavku da će kretanje broja površina zasađenih povrtlarskim kulturama
zadržati eksponencijalni trend,prognozirajte koliko će površina biti zasađeno povrtnim
kulturama u 2012.godini,a koliko u razdoblju od 2010. do 2016.godine.
d)Uz pretpostavke iz prethodnog dijela ovog zadatka,odredite u kojoj godini će biti svega
5000 m2 zasađeno povrtnim kulturama.

Rješenja:
1. Tablica 7.30

138
Prodano It
Godina pivo 1996.=10
(000 l) 0 S*t Vt St
nepoznat
1993 18,42 62,61 -37,39 nepoznat a
1994 22,67 77,06 -22,94 123,07 23,07
1995 26,38 89,67 -10,33 116,37 16,37
1996 29,42 100,00 0,00 111,52 11,52
1997 33,62 114,28 14,28 114,28 14,28
1998 36,43 123,83 23,83 108,36 8,36
1999 37,71 128,18 28,18 103,51 3,51
2000 41,92 142,49 42,49 -57,51 -157,51
2001 44,03 149,66 49,66 105,03 5,03
2002 51,31 174,41 74,41 116,53 16,53

a)U 2001.godini je prodano 49,66% piva više nego u baznoj 1996.godini.


b)U 1999.godini je prodano 3,51% piva više nego u prethodnoj 1998.godini.

2.
Tablica 7.31
Stvarni broj
Godina Vt It S*t zaposlenih
1995 ---- 65,94 -34,06 113884
1996 103,42 68,20 -31,80 117779
1997 110,74 75,52 -24,48 130428
1998 120,17 90,75 -9,25 156735
1999 110,19 100 0,00 172707
2000 128,43 128,43 28,43 221807
2001 110,71 142,18 42,18 245563
2002 107,48 152,82 52,82 263931
2003 112,57 172,03 72,03 297107
2004 120,61 207,49 107,49 358341
2005 117,14 243,05 143,05 419760
2006 119,53 290,52 190,52 501739
2007 115,53 335,63 235,63 579660
2008 100,98 338,92 238,92 585340

3.
It It
Godina 1998.=10 1995.=10
0 0 Vt
nepozna
1992 83,27 90,07 t
1993 87,92 95,10 105,58
1994 89,29 96,58 101,56
1995 92,45 100 103,54
1996 97,52 105,48 105,48

139
1997 93,87 101,54 96,26
1998 100 108,17 106,53
1999 102,33 110,69 102,33
2000 108,74 117,62 106,26
2001 110,37 119,38 101,50
2002 11,29 12,21 10,23
2003 113,37 122,63 1004,16
2004 118,29 127,95 104,34
2005 121,42 131,34 102,65

4.
It Stvarni
Godina Vt 1999=10 broj
0 S*t zahvata
1996 -- 89,36 -10,64 927
1997 108,23 96,72 -3,28 1003
1998 110,12 106,51 6,51 1105
1999 93,89 100,00 0,00 1037
2000 105,37 105,37 5,37 1093
2001 109,19 115,05 15,05 1194
2002 110,42 127,04 27,04 1318
2003 112,49 142,91 42,91 1483
2004 103,52 147,94 47,94 1535
2005 107,83 159,52 59,52 1655

S 6,65

a)Broj estetskih zahvata obavljen u 2003.godini je bio za 42,91% veći nego u baznoj
1999.godini.
c)Broj estetskih zahvata je prosječno godišnje rastao po stopi od 6,65%

140
.
5.
Iznos
Broj kazni Broj kazni Iznos kazne
Vrsta prekršaja kazne p0*q0 p1*q0 p1*q1
2005. q0 2007. q1 2005. p0
2007. p1
Prekoračenje 26500
brzine 530 700 500 700 0 371000 490000
15200
Vožnja bez pojasa 760 820 200 300 0 228000 246000
16800
Prolaz kroz crveno 210 180 800 1200 0 252000 216000
26700
Vožnja bez kacige 890 910 300 500 0 445000 455000
Parkiranje na
zabranjenom 11700
mjestu 780 1020 150 200 0 156000 204000
96900 145200 161100
0 0 0

a) P01(q0) 149,85
b) Q01(p1) 110,95
c) V01 166,25

6.
Proizvodnja
grožđa Proizvodnja grožđa
Lančani indeksi
Godina u tekućim u stalnim cijenama
cijena
cijenama It iz 2001.
(000 kn) 2001.=100 xt
1992 4,52 nepoznat 70,46 0 6,415
1993 4,80 101,02 71,17 1 6,744
1994 5,12 101,82 72,47 2 7,065
1995 5,80 102,36 74,18 3 7,819
1996 6,10 104,48 77,50 4 7,871
1997 6,30 105,52 81,78 5 7,703
1998 6,80 105,68 86,43 6 7,868
1999 6,80 102,36 88,47 7 7,687
2000 7,00 103,78 91,81 8 7,624
2001 7,20 108,92 100,00 9 7,200
2002 7,25 110,37 110,37 10 6,569
2003 7,30 111,48 123,04 11 5,933
2004 7,50 111,92 137,71 12 5,446
2005 8,00 112,46 154,87 13 5,166
2006 14
2007 15
2008 16
2009 17
2010 18
b) S 6,25
c) X 18
Y 5,591

141
7.

Godin Broj
a xt stanovnika
1930 0 1638
1940 1 1510
1950 2 1350
1960 3 1100
1970 4 950
1980 5 800
1990 6 660
2000 7 570
2010 8 348
2020 9 187
2030 10 26
2040 11 -135
2050 12 -296

X 10,16
Y 0

a)
Y = -161,02 *X +1635,8
a = -161,02 znači da očekivano prosječno smanjenje broja stanovnika u naselju X tijekom
desetljeća iznosi 161 osobu
b = 1635,8 ( ¿ 1636 ) trend broj stanovnika,u ishodišnoj 1930.godini,iznosi 1636 osoba.
b)R2 =0,9892 ukazuje na značajnu reprezentativnost modela
c) U 2010.godini se može očekivati 348 stanovnika u slučaju da opadanje njihovog broja
zadrži linearni trend.
d) U razdoblju od 2030. do 2040. će naselje potpuno opustiti ako se nastave započeta
demografska kretanja.

142
8.

Površine
povrtnjak
Godina xt
a
(u 00 m2)
1994 0 1190,21
1995 1 1079,68
1996 2 960,49
1997 3 820,33
1998 4 695,48
1999 5 573,49
2000 6 451,88
2001 7 340,13
2002 8 290,48
2003 9 180,39
2004 10 110,48
2005 11 79,53
2006 12
2007 13
2008 14
2009 15
2010 16 32,53
2011 17 25,50 a 1593,3
2012 18 20,00 b 0,78411 X 18 14,23
2013 19 15,68 S -21,59% Y 86,07 50
2014 20 12,29
2015 21 9,64
2016 22 7,56

a)
a = 1593,3 znači trend vrijednost u ishodišnoj 1994. ( X = 0 ) godini
S = -21,59 znači da se prosječno,godišnje,očekuje smanjenje povrtnjaka u iznosu od
21,59%
b) Koeficijent determinacije iznosi 0,9491 te ukazuje na osjetnu reprezentativnost
modela.

MATERIJALE PRIPREMILA:

Karmela Mikelić, viši predavač

143

You might also like